Principe 2: Les données électorales sont ouvertes quand elles sont granulaires

Granulaires

Les données électorales doivent être disponibles au niveau le plus précis possible de granularité ou de détail. Les données qui sont finement grainées, ou en pleine résolution, ne sont pas sous une forme globale ou modifié. Ce principe a également été exprimé en rendant les données disponibles au niveau «primaire» ou au niveau auquel la source de données est collectée. La granularité est nécessaire pour promouvoir la transparence et la responsabilisation.

En termes d'élections, il est clair que l'emplacement, l'adresse et les coordonnées de chaque bureau de vote doivent être annoncées avant le jour de l'élection. Les citoyens ont besoin de l'information afin qu'ils puissent savoir où voter. Le niveau du bureau de vote est le niveau le plus granulaire pour les résultats des données électorales. Puisque les votes sont exprimés dans les bureaux de vote (parfois appelés enceinte, flux de vote[1] ou tables[2]) les bureaux de vote représentent le niveau primaire pour les résultats des élections. Si les ensembles de données comme les résultats des élections ne sont disponibles que sous forme agrégée ou modifiée, alors les données ne sont pas ouvertes. En effet, une grande partie de la «fraude» qui a été commise dans les élections est facile à dissimuler si les données ne sont pas diffusées sous leur forme la plus granulaire, ou au niveau primaire.

En termes de processus d'inscription des électeurs, le niveau le plus granulaire est l'électeur individuel. Alors que l'unité primaire de collecte de données pour l'enregistrement des électeurs est l'électeur individuel, le niveau auquel les données sont publiées varie largement d'un pays à l'autre. Les OGE dans certains pays affichent une copie imprimé de la liste électorale avec tous les détails de l'électeur (nom, prénom, adresse, numéro de carte nationale d'identité) à l'extérieur du bureau de vote. Publier une liste des électeurs pour un bureau de vote spécifique est granulaire mais l'ensemble de données n'est clairement pas complet car il représente seulement une partie de l'ensemble de la liste pour l'ensemble du pays. Dans d'autres pays, la liste complète des électeurs est disponible sur le site web de l'OGE sous plusieurs fichiers. Dans ce cas, les données peuvent être analysées, par exemple, pour noter le nombre et le pourcentage de femmes sur la liste ou pour voir si d'autres groupes historiquement marginalisés sont inclus. Mais quelques pays déclarent des inquiétudes vis-à-vis de la vie privée des électeurs et au lieu de publier une liste des électeurs, ils permettent aux électeurs de rechercher leurs détails individuels. Si le cadre juridique impose des restrictions sur la granularité des données électorales (par exemple, en raison de problèmes de confidentialité), la justification de la restriction doit être clairement indiquée, et les moyens les moins restrictifs doivent être utilisés pour protéger l'intérêt légitime en cause.

Le domaine émergent de la «médecine légiste électorale» utilise différentes méthodes statistiques[3] pour analyser et identifier les tendances suspectes des données publiées au niveau primaire (par exemple, les bureaux de vote). En outre, les lieux utilisés pour le scrutin (par exemple, les bâtiments administratifs, écoles, marchés) sont souvent les endroits où l'inscription des électeurs est menée et les plaintes déposées. Ainsi, l'accès aux données au niveau le plus granulaire est essentiel pour les citoyens et les autres parties prenantes afin d'évaluer la transparence de la plupart des phases du processus électoral.

Questions pour aider à déterminer quel niveau de données correspond au niveau primaire ou à la source:

  • Où ont été collectées les données à l'origine? Cela peut donner une indication sur le niveau le plus bas.
  • Quel est le niveau le plus bas possible, où un point individuel de données peut varier par rapport à un autre point de données?
  • Est-ce que ces données sont relatives au vote? Si oui, alors le bureau de vote est probablement le niveau le plus bas.
  • Est-ce que ce sont des données relatives aux qualifications pour être listé sur le bulletin de vote ou être inscrit pour voter? Si oui, alors les individus (les électeurs ou les signatures des électeurs) sont susceptibles de représenter le niveau le plus bas.

Les dirigeants des pays du G8 ont reconnu explicitement l'importance de ce principe quand ils ont signé la Charte du G8 des Données Ouvertes (et l'annexe technique) en Juin 2013. Dans la Charte de Données Ouvertes, les gouvernements du Canada, France, Allemagne, Italie, Japon, Russie, États-Unis et du Royaume-Uni s'engagent à publier des données ouvertes de haute qualité et déclarent que les données seront «dans leur forme originale non modifiée et au niveau le plus fin de granularité disponible


  1. Dans certains pays africains comme le Malawi et la Zambie, le niveau le plus bas est le flux de vote et le niveau supérieur est appelé le bureau de vote. Quand nous disons «bureau de vote» dans le présent document, nous entendons niveau le plus bas auquel les résultats sont exprimés et comptés. ↩︎

  2. Dans de nombreux pays d'Amérique latine, le niveau le plus bas est appelée la «mesa» ou «table». Un centre de vote (un bâtiment) contiendra habituellement plusieurs «mesas» (dans plusieurs salles du bâtiment). Encore une fois, lorsque nous utilisons le terme «bureau de vote», nous entendons, l'échelle la plus petite des résultats et il est interchangeable avec le concept d'une «mesa» ou une «table». ↩︎

  3. Par exemple, divers tests chiffrés et méthodes de détection de valeurs aberrantes ont été utilisés pour émettre des suspicions sur les résultats des élections dans des endroits tels que la Russie, l'Iran et l'Ukraine. ↩︎