Principio 4: Los datos electorales son abiertos cuando están completos y en bloque

Completos y en bloque

Los datos son abiertos cuando están completos y disponibles en su totalidad. Publicar un conjunto de datos completo es un acto claro de transparencia. Todo dato que se omita es inaccesible y no puede utilizarse. Incluso cuando un usuario está especialmente interesado en una parte determinada de la información, aun así le conviene tener todo el conjunto de datos para que pueda poner en contexto ese interés específico. Por ejemplo, si una organización quiere analizar el índice de registro de votantes de los distritos de su región, puede enfocar la mayor parte de su análisis en los datos de esa región, pero si cuenta con todo el conjunto de datos, puede rápidamente calcular el índice de registro de todo el país y usar esta información para poner el índice regional en el contexto adecuado. Cuando un EMB publica un conjunto de datos incompleto, corre el riesgo de ser acusado de tratar de ocultar (deliberadamente) la información omitida. Con frecuencia el riesgo es mayor cuando la diferencia entre lo que se publica y lo que no se publica tiene una dimensión geográfica. En muchos países, el apoyo a un candidato o partido en especial está altamente correlacionado con la geografía (por ejemplo, en las áreas urbanas se puede apoyar a un cierto candidato, mientras que en las áreas rurales se puede apoyar a un candidato distinto). La integridad es especialmente importante cuando existe un componente geográfico en los datos porque dejar fuera a un área puede parecer como si el EMB de alguna manera tuviera cierta predisposición en contra de algún candidato o partido en particular.

Publicar los datos en bloque significa que todos los datos están contenidos en un solo archivo, de manera que todo el conjunto de datos pueda obtenerse mediante una sola descarga. Por ejemplo, la Comisión Electoral de Sudáfrica (IEC), puso a disposición del público los resultados de las elecciones nacionales y provinciales de 2014 a nivel de centro de votación en bloque como un solo archivo descargable (como archivo .csv comprimido). La IEC también indicó el tipo de archivo y su tamaño junto al vínculo. Publicar un conjunto de datos completo en bloque es con frecuencia uno de los primeros pasos directos y más sencillos que puede seguir un EMB para hacer que los datos sean verdaderamente abiertos. En los casos en que este único archivo resulta ser muy grande y por lo tanto se tardaría demasiado en descargar, los datos deben también ofrecerse como conjuntos pequeños de datos. En Open Government Data: The Book [Datos gubernamentales abiertos: El libro], Joshua Tauberer define "demasiado grande" como "cuando un conjunto de datos es tan grande que no sería práctico descargarlo en bloque. Según los estándares actuales, eso sería un conjunto de datos de por lo menos 10 gigabytes, o alrededor de 6 horas en una conexión de banda ancha".

Documentación adecuada

Tener la documentación adecuada es otro aspecto que se debe considerar para que los datos estén completos o íntegros. El archivo de datos debe tener la documentación correspondiente que describa las variables, los campos y las etiquetas utilizadas en el archivo. Como mínimo, la documentación debe incluir también notas sobre la estructura de los datos y explicaciones de cualquier abreviatura que se utilice en ellos. Lo ideal es que la documentación incluya lo anterior, así como una descripción de la manera en que se recopilaron los datos, el objetivo de la recopilación, el público meta, vínculos a los datos auxiliares relacionados, y un punto de contacto en caso de que hubiera más preguntas. Como se sugiere en la Carta de Datos Abiertos del G8 y el Anexo Técnico, el EMB debe asegurarse de que el conjunto de datos esté "totalmente descrito, según corresponda, para ayudar a los usuarios a entender plenamente los datos". El depósito de datos electorales del Tribunal Superior Electoral de Brasil (TSE, por sus siglas en portugués), es un gran ejemplo de un EMB que ofrece datos en bloque junto con la documentación adecuada. El depósito incluye datos del registro de votantes, información sobre los candidatos y partidos, datos del financiamiento de las campañas y datos de los resultados electorales. El usuario puede descargar los resultados de las elecciones de 2012 y 2014 en bloque y los datos incluyen un archivo "read me" [léeme]. El archivo "read me" de los resultados de 2014, por ejemplo, explica a detalle la manera en que están codificados los datos, ofrece una descripción de cada variable, indica la fecha de la última actualización de los datos e incluye los datos de contacto en caso de que se tengan preguntas adicionales.