المبدأ الخامس: تكون البيانات الانتخابية مفتوحةً عندما تكون قابلةً للتحليل (أي متوافرةً بشكلٍ رقمي قابل للقراءة بالآلة).
تكون البيانات المتوافرة عادةً بشكلٍ رقمي يمكن قراءته بالآلة قابلةً للتحليل بسهولة وسرعة. فالوصول إلى البيانات الانتخابية "القابلة للتحليل" أمر أساسي لتقييم مدى نزاهة العملية الانتخابية. فمن المهم لتحقيق الشفافية الانتخابية أن يتمكن العامة من القيام بتحليل مستقل للبيانات الأولية والتحقق على أساسه من تحليل هيئة إدارة الانتخابات. فمجموعة البيانات كما هي تقدّم القليل من المعلومات للإنسان، ولكن عندما تعالج البيانات بطريقةٍ ما، من خلال التحليل و/أو الوسائل البصرية، تصبح مفيدةً ويمكن الخروج منها بأفكارٍ ملهمة.
بيانات قابلة للقراءة بالآلة
بالمعنى التقني، تكون البيانات "القابلة للقراءة بالآلة" بياناتٍ قابلةً للتحليل. ومعنى هذا المصطلح أنّ مجموعة البيانات متوافرةً بشكلٍ يتيح للكمبيوتر فهمها. بعبارةٍ أخرى، يعني ذلك أنّ البيانات تتبع بنيةً منطقيةً بحيث تسمح بالمعالجة الآلية. في كتيّب سياسات البيانات المفتوحة الصادر عن "مؤسسة المعرفة المفتوحة" تعرّف الأشكال القابلة للقراءة عبر الآلة بأنها "الأشكال التي يمكن استخراج بياناتها عن طريق الكمبيوتر بسهولة."
قابلة للقراءة بالآلة مقابل متاحة رقمياً
من المهم التوضيح أنّ المعلومات "القابلة للقراءة بالآلة" ليست مرادفةً للبيانات "المتاحة رقمياً". فإنّ مسح التقرير مثلاً يجعل محتواه "متاحاً رقمياً". ولكن، لا يمكن للكمبيوتر أن "يفهم" المعلومات الواردة في التقرير. يقدّم الكتاب التمهيدي حول القابلية للقراءة بالآلة للوثائق والبيانات الإلكترونية الصادر عن منظمة Data.gov تعريفاً مفيداً للاختلافات بين البيانات القابلة للقراءة بالآلة والمتاحة رقمياً:
يمكن رؤية الاختلاف في الفرق بين غلاف المجلة وشيفرة التعرف على هذا الغلاف. فلا يمكن للكمبيوتر أن يفهم مباشرةً ما الذي تمثّله الصورة على المجلة، وإن توافرت بصيغةٍ إلكترونية، ولكن يمكنه قراءة وفهم شيفرة التعرف واستخدامها لتحديد السعر ومتابعة عملية الشراء مثلاً.
عندما تنشر هيئات إدارة الانتخابات المعلومات بصيغ قابلة للتحليل (أي قابلة للقراءة بالآلة) فإنها تساعد في ردم الهوة بين "الوثائق" (التي تكون عادةً ثابتةً ومجمّدةً في الشكل) و"البيانات" (التي تكون ديناميكيةً وتسمح بمعالجة إضافية).
في وقتٍ تتيح فيه هيئات إدارة الانتخابات المعلومات بشكل وثائق PDF، إلاّ أنّ هذه الصيغة غير قابلة للقراءة بالآلة. في الواقع، إنّ عدداً كبيراً من الصيغ الأكثر رواجاً لنشر المعلومات الانتخابية (أي التقارير، ومعلومات الاتصال، ونتائج الانتخابات) ليست قابلةً للقراءة بالآلة. فالصيغ من قبيل PDF، وملفات Word، وصور JPG، وصفحات HTML لا تتمتع ببنية تسمح بالتحليل والمراجعة المباشرة. عوضاً عن ذلك، هي مفيدة لعرض المعلومات على الشاشة أو طباعتها على صفحة. ولكن، لسوء الحظ، فإنّ هذه الصيغ تجعل من الصعب إعادة بناء وتحليل المعلومات بصورة ميكانيكية. في وقتٍ يمكن فيه للكمبيوتر أن يعرض النص في وثيقة PDF، من الصعب لا بل المستحيل أن "يفهم" البنية والسياق من حول هذا النص.
صيغ مناسبة لغايات مناسبة
كما سبق وذكر أعلاه، لا تتسم الصيغ من قبيل PDF، وملفات Word، وصور JPG، وصفحات HTML ببنية تسمح بالمعالجة الآلية للبيانات. فهذه الصيغ مناسبة لعرض المعلومات على الشاشة أو طباعتها. وقد اعتبرت هذه الصيغ عبر التاريخ مناسبةً للغاية المتوخاة منها في تلك الفترة. فعندما قامت هيئات إدارة الانتخابات أولاً بنشر المعلومات، كان الغرض منها أن يتمكن الإنسان من قراءتها، وطباعتها، ومن ثم القيام بالتحرك على أساسها، كأن يملأ استمارة مثلاً. في بعض الحالات، قد يتمكن المستخدمون من التحقق من البيانات إلاّ أنّ الوصول إلى البيانات الضمنية لم يكن متوافراً. فإنّ نشر المعلومات في أنواع الملفات المغلقة كان الدافع من ورائه الصيغ المألوفة (HTML وPDF)، وتعريف ضيّق "للمستخدمين،" وتوقع محدود لما يمكن للمستخدمين فعله بهذه المعلومات.
حالياً، تقوم هيئات إدارة الانتخابات التي تقدّر الاحتمالات الواسعة لما يمكن القيام به بالمعلومات الانتخابية بإتاحة هذه البيانات بمجموعة واسعة من الصيغ، بما في ذلك تلك "القابلة للطباعة" وتلك "القابلة للتحليل." فقد قامت هيئات إدارة الانتخابات في جورجيا، وكولومبيا، والمكسيك بإتاحة مسوح الصورة الخاصة بنتائج مكتب الاقتراع في الوقت الفعلي تقريباً على مواقعها الإلكترونية.[1] فنشرت مسوح صور محاضر النتائج لغاية الشفافية حول المصدر الأولي للبيانات وللسماح لأي شخص بالتدقيق بصرياً بالأرقام المكتوبة باليد، والتواقيع، والمراجعات. كذلك الأمر، وفي ما يتعلق بالانتخابات الرئاسية، وانتخابات مجلس الشيوخ، والانتخابات النيابية لسنة 2012، قام المعهد الانتخابي الفدرالي في المكسيك، والذي أصبح يعرف اليوم بالمعهد الانتخابي الوطني، بإتاحة النتائج الأولية والنهائية لسنة 2012، لكل عملية انتخابية متوافرة دفعةً واحدةً قابلة للتنزيل بشكلٍ قابل للقراءة بالآلة (بصيغة ملف TXT). تتاح النتائج الأولية بشكل ملف مضغوط تحت خانة "قاعدة البيانات" على الموقع الإلكتروني لنظام النتائج الانتخابية الأولية التابع للمعهد الانتخابي الفدرالي، في حين تعرض النتائج النهائية بدفعة واحدة قابلة للتنزيل لكل ولاية من خلال نظام ATLAS للبيانات التاريخية. وقد وضع المعهد الانتخابي الفدرالي البيانات بالتداول بتلك الطريقة لأنها حرصت على أن تتمكن المنظمات الإعلامية ومنظمات مراقبة الانتخابات من تحليل المعلومات والتحقق منها بسرعة. يبيّن المثال الخاص بالمعهد الانتخابي الفدرالي أنّ التنسيق بين الشكل والغاية لا يقوم على توفير البيانات القابلة للقراءة عبر الآلة بدلاً من مسوح الصور، بل توفير البيانات القابلة للقراءة بالآلة بالإضافة إلى الصور. بالتالي، يجب أن يتوافق اختيار الشكل مع الغاية أو الغايات، ما قد يعني أنّ هيئات إدارة الانتخابات قد ترغب في نشر البيانات بأشكال متعدّدة على الفور تقريباً.
المتغيرات المفصولة بفواصل CSV، الترميز بلغة جافاسكريبت JSON، ولغة الترميز الممتدة XML: الصيغ الموصى بها للبيانات الانتخابية
- تعدّ البنية الأكثر شيوعاً للبيانات الانتخابية البيانات "المجدولة" – أي البيانات المخزنة بشكل جدول أو سلسلة من الجداول. ولعلّ الصيغة الأكثر شيوعاً القابلة للقراءة بالآلة للبيانات المجدولة هي نوع الملف "Comma Separated Variables" (CSV) أو المتغيرات المفصولة بفواصل. يمكن لجميع قواعد البيانات وبرامج جداول البيانات تقريباً حفظ البيانات بهذه الصيغة. تخزن الملفات التي تعتمد على المتغيرات المفصولة بفواصل البيانات المجدولة في شكلٍ مبني على النص يجعل من السهل معالجته بواسطة الكمبيوتر.
- أما الصيغة القائمة على الترميز بلغة جافاسكريبت "JavaScript Object Notation" (JSON) فهي الصيغة غير المقيّدة والممكن قراءتها بالآلة. وهي مستمدّة من لغة جافاسكريبت المستخدمة على مواقع إلكترونية عدة. وتعدّ هذه الصيغة أفضل من أجل تمثيل العلاقات الهرمية في البيانات (مثلاً جدول تنظيمي أو مستويات مختلفة من الحدود الانتخابية) عوضاً عن البيانات المجدولة. ولكن، من مساوئ أشكال الملفات التي تعتمد على المتغيرات المفصولة بفواصل وتلك القائمة على الترميز بلغة جافاسكريبت، أنها لا تتضمن واصفاتٍ للبيانات – أي المعلومات التي تشرح البيانات. توفّر واصفات البيانات السياق للبيانات من خلال اعتماد وصفٍ للمتغيّرات، وكيفية جمع البيانات وتاريخ آخر تحديث لها.
عمدت لجنة الانتخابات المركزية في جورجيا بنشر صور للاستمارات الخاصة بمكاتب الاقتراع في الوقت الفعلي تقريباً للانتخابات البرلمانية لسنة 2012، والانتخابات الرئاسية لسنة 2013، والانتخابات البلدية لسنة 2014. وقد نشر أمين السجلات الوطنية في كولومبيا مسوح الصور عن استمارات مكاتب الاقتراع لانتخابات مجلس الشيوخ لسنة 2014. في العام 2012، نشر المعهد الانتخابي الفدرالي في المكسيك الصور والنتائج الأولية على مستوى مكتب الاقتراع للانتخابات الرئاسية، وانتخابات مجلس الشيوخ، والانتخابات النيابية على الموقع الخاص بنظام النتائج الانتخابية الأولية. ↩︎