A continuacion definimos algunos de los conceptos escenciales para hacer hacking cívico:
Alianza de Gobierno Abierto - Una iniciativa de los gobiernos internacionales lanzada en 2011 con el objetivo de promover la agenda de un Gobierno Abierto entre los países involucrados, así como la colaboración y la promoción de acuerdos multilaterales y mejores prácticas. Hasta el 2014 había 64 países miembro.
Anonimización- El proceso de adaptación de datos de manera que los individuos no pueden ser identificados a partir de ella.
API (Application Programming Interface) - Una manera en que los programas informáticos se hablan entre ellos. Puede ser entendido en términos de cómo un programador envía instrucciones entre los programas.
Ciencia ciudadana (citizen science) - La contribución activa a la investigación científica por parte de personas que no son científicos profesionales, particularmente (pero no exclusivamente) para expandir las oportunidades para crear una colección de datos científicos y dar acceso a información científica a los miembros de la comunidad. (Cornell) Ya sea mediante preguntas, observaciones, experimentos, recolectando datos o incluso desarrollando tecnologías de bajo costo y código abierto, las aportaciones de grandes redes de voluntarios a menudo permiten a las y los científicos llevar a cabo tareas que serían demasiado caras o que requerirían demasiado a través de otros medios. (White House Blog)
La mayoría de las tareas aunque sencillas para la inteligencia humana, son aún demasiado complejas para automatizarlas. Algunos ejemplos de las tareas más comunes son, clasificación de imágenes, reconocimiento de sonidos, análisis de videos o extracción de información de archivos en formato PDF. (Crowdcrafting)
Ciencia de Datos (data science) - El uso de métodos automatizados para analizar grandes cantidades de datos y para extraer el conocimiento de ellos. Mediante la combinación de aspectos de estadística, informática, matemáticas aplicadas, y/o visualizaciones, la ciencia de datos puede convertir las enormes cantidades de datos en tendencias o patrones para que se pueden entender y utilizar. (New York University)
Un ejemplo de la ciencia de datos aplicada es utilizar datos de un servicio de reseñas y recomendaciones ciudadanas (como Yelp) para identificar restoranes que tienen un mayor riesgo de incumplir la normativa sanitaria. Esto fue realizado por la ciudad de Boston para optimizar el despliegue de los inspectores sanitarios. En Chile, la Superintendencia de Electricidad y Combustibles construyó un modelo predictivo de riesgo para optimizar las fiscalizaciones de instalaciones eléctricas.
Código abierto (open source)- Software en el cual el código base está disponible, gracias a una licencia abierta, de manera gratuita y las y los usuarios con las habilidades técnicas necesarias pueden inspeccionar, modificarlo y operar su propia versión, ayudando a eliminar problemas y desarrollar nuevas funciones. Algunos proyectos que manejan software de Código Abierto tienen miles de contribuidores que trabajan como voluntarios.
Colaboración abierta distribuida (crowdsourcing) - Un tipo de actividad en línea participativa en el que una persona, una institución, una organización o una compañía propone a un grupo de individuos de conocimiento variado, a través de una convocatoria abierta flexible, la ejecución voluntaria de una tarea. La realización de la tarea siempre trae consigo el beneficio mutuo. El usuario recibirá la satisfacción de satisfacer un determinado tipo de necesidad, ya sea económica, el reconocimiento social, la autoestima, o el desarrollo de habilidades individuales, mientras que el que busca la ayuda obtendrá y utilizará en su propio beneficio lo que el usuario ha creado. (Estellés-Arolas, E., & González, F.)
Algunos ejemplos son Wikipedia, Galaxy Zoo, que también es ejemplo de ciencia ciudadana, donde voluntarios no-expertos ayudan a clasificar galaxias basadas en su apariencia visual. Otro es NOVAM, un servicio que permitía al público a verificar o corregir datos oficiales sobre la localización de las paradas de autobús en el Reino Unido, con más de 18,000 colaboraciones. (Open Data Handbook)
Colaborativas de datos (data collaboratives) - Intercambio de datos en poder de las empresas, corporaciones, y sector privado en general, con el sector público (gobiernos, organizaciones internacionales, etc) y con organizaciones sin fines de lucro (centros de investigación, universidades, etc) para que puedan ser usados en la toma de decisiones y creación de políticas públicas más efectivas y basadas en datos. (Beth Noveck)
Comunidad de código abierto - La comunidad de código abierto es diversa y altamente motivada, se compone de hackers expertos en tecnología pero también de ciudadanos y ciudadanas comunes interesados en el tema. Su espacio de trabajo es virtual, generalmente en GitHub, donde en conjunto desarrollan soluciones o nuevas adiciones a un mismo código que se comparte. En las comunidades de código abierto existe la posibilidad de mantener un flujo de información (código y la documentación) con cualquier persona de la comunidad. El código abierto abre la posibilidad de que, cuando exista un problema, también exista la posibilidad de que un gran número personas lo intenten resolver, aumentando el aprovechamiento de la capacidad intelectual de toda la comunidad. (OSS Watch)
Datos - Los datos pueden ser pensados como declaraciones atómicas, no procesadas, de un hecho en particular. Frecuentemente se refieren a colecciones sistemáticas de información en tablas numéricas como bases de datos. Cuando los datos están estructurados y presentados de forma útil y con un propósito en particular, se vuelve información disponible para la comprensión humana.
Datos abiertos (open data) - Datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos, cuando más, al requerimiento de atribución y de compartirse de la misma manera en que aparecen. (Open Data Handbook)
Datos Abiertos de Gobierno - Datos abiertos recopilados durante el curso de las actividades habituales del Gobierno y que no identifican a los individuos o sensibilidad comercial. (Open Government Data)
Datos gubernamentales - El trabajo del día a día en el gobierno involucra recolectar enormes cantidades de datos, muchos de los cuales no son confidenciales (datos económicos, demográficos, de gasto público, incidencia delictiva, transporte, etc). El valor de muchos de estos datos puede aumentar significativamente si se liberan como datos abiertos, es decir, que éstos estén disponibles para el uso, reutilización y distribución ya sea de la iniciativa privada, la sociedad civil, periodistas de datos, etc.
Datos masivos (big data) - Los datos masivos bases de datos extensas, diversas, complejas, que se generan de instrumentos, sensores, transacciones en línea, correo electrónico, video, clicks y todo tipo de fuentes digitales a las que se tiene acceso hoy y que se tendrán en el futuro. (National Science Foundation)
Datos pequeños (small data) - Los datos pequeños son datos que pueden ser accedidos y entendidos por humanos con facilidad y utilizarse de inmediato. Generalmente se recolectaron para un propósito específico y se encuentran en una base de datos con un tamaño de archivo no mayor a terabytes en una computadora local. Por ejemplo: son datos pequeños los datos que recolectan día a día los celulares, como los patrones de ubicación o la cantidad de pasos que se caminan en un día, etc. Estos datos pueden servir para identificar tendencias individuales que después pueden ser utilizadas por nutriólogos o entrenadores para mejorar la salud de una persona. (Open Knowledge Foundation)
Desarrollo ágil (agile development) - Alternativa a la gestión de proyectos tradicional, el desarrollo ágil hace hincapié en la capacitación de las personas para colaborar y tomar decisiones en equipo, además de basarse en la planificación, pruebas con usuarios e integración continua. La integración continua se refiere a realizar actualizaciones constantes en base a los resultados de las pruebas con las y los usuarios.
Diseño centrado en el humano (human-centered design) - Es una metodología de investigación y diseño que desarrolla soluciones, proyectos y/o productos tomando como base la perspectiva, forma de sentir y pensar de las personas para quienes se diseña. Este proceso consta en tres partes: 1) la fase para descubrir, que comienza al salir al mundo y aprender de la gente para la que se diseña; 2) la fase para Idear, donde se recopila lo aprendido y se transforman esos aprendizajes en temas y patrones; 3) y por último, la fase de prototipado, donde las ideas evolucionan a diseños concretos basados en la retroalimentación real. (+Acumen)
Formato legible por humanos (human readable) - Datos en un formato que puede ser leídos de manera sencilla por las personas. Algunos formatos legibles por humanos, como los PDF, no son un formato legible por máquina, pues los datos no están estructurados.
Formato legible por máquina (machine readable) - Datos en un formato que pueden ser leídos y procesados, de manera automática, por una computadora; como por ejemplo CSV, JSON, XML, etc. Estos deben de ser organizados de una manera estructurada.
Geodatos - Cualquier base de datos donde los mismos incluyen una localización, por ejemplo, longitud y latitud o alguna otra codificación estándar. Mapas, rutas de transporte, datos sobre el medio ambiente, datos catastrales, y muchos otros tipos de datos pueden ser publicados como geodatos.
Github - GitHub es una plataforma web de colaboración y control de versiones para desarrolladores de software. Github se utiliza para almacenar el código fuente de un proyecto y realizar un seguimiento de la historia completa de todos los cambios en el código. Permite a los desarrolladores cambiar, adaptar y mejorar el software desde sus repositorios públicos de forma gratuita, y privados con una subscripción. Cada repositorio público o privado, contiene todos los archivos de un proyecto, así como el historial de revisiones de cada archivo.
Gobierno Abierto - Es un movimiento que busca hacer de los gobiernos, instituciones más transparentes, con mecanismos de rendición de cuentas y más receptivas con las y los ciudadanos. Gobierno abierto incluye los ideales de la democracia, el debido proceso, la participación ciudadana y los datos abiertos de gobierno. Un acercamiento riguroso a gobierno abierto significa por ejemplo buscar permitir a las y los ciudadanos a que participen la redacción y revisión de legislación o incluso del presupuesto.
Hackathon - Un evento, generalmente de uno o dos días, donde desarrolladores, expertos temáticos y otras personas se juntan a crear aplicaciones, visualizaciones, y prototipos que buscan solucionar problemas en un dominio particular, generalmente utilizando de manera significativa los datos. Los Hackatones que se enfocan en la recolección de datos particulares son una posible manera de fomentar la participación ciudadana para los proveedores de datos. Los hackatones son un formato popular en la comunidad open source.
Hacking Cívico (civic hacking) - Construir herramientas y comunidades, generalmente en línea, que tratan de resolver problemas cívicos o sociales. Algunos ejemplos podrían ser herramientas o plataformas que permiten a personas con ideas afines conocerse en base a intereses locales específicos; o reportar infraestructura dañada a su municipio, o colaborar para recoger la basura en su barrio. Los datos abiertos de nivel local son particularmente útiles para proyectos de hacking cívico.
Internet of Things (el internet de las cosas) - El internet de las cosas es el término que se utiliza para describir la habilidad de dispositivos (desde celulares o relojes inteligentes hasta refrigeradores) para comunicarse entre sí utilizando sensores integrados que se conectan por medio de redes cableadas e inalámbricas. Estos dispositivos utilizan el internet para transmitir, compilar y analizar información. En inglés también se conoce con el acrónimo IoT. (The White House)
IRU (identificador de recursos uniforme) - Un identificador de recursos uniforme es una cadena de caracteres (números y letras) que identifica los recursos de una red de forma precisa. Esto quiere decir que cada archivo tiene un nombre y dirección únicos en Internet, que son necesarios para consumirlos de manera directa. Es importante tener un identificador de recursos uniforme en las bases de datos que se abren para hacerlas consumibles por un programa tecnológico.
Las 5 estrellas de los datos abiertos - Un sistema de clasificación para datos abiertos propuesto por Sir Tim Berners-Lee, fundador de la World Wide Web. Para obtener el máximo de cinco estrellas, los datos deben de (1) estar abiertos en la Web con una licencia abierta, (2) presentarse como datos estructurados, (3) estar en un formato de archivo no propietario, (4) usar URIs como identificadores, (5) incluir vínculos a otras fuentes de datos.
Metadatos - Información acerca de una base de datos, por ejemplo el título y la descripción, los métodos de recolección, el autor o el editor, el lugar o tema y el periodo de tiempo cubierto, la licencia, la fecha y frecuencia de publicación, etc. Es esencial publicar las bases de datos con los metadatos adecuados para incrementar la facilidad de usar, encontrar y descubrir información importante en los datos que se abren.
Nube (cloud) - Los datos que se encuentran en “la nube” están guardados en una compañía de almacenamiento en línea, con el fin de disminuir el almacenamiento físico de los datos y a su vez, tener acceso a los mismos, desde cualquier lugar. La compañía de almacenamiento tiene la responsabilidad de dar acceso a los datos vía Internet.
Participación comunitaria - Proceso planificado con el propósito específico de trabajar con grupos personas que se identifican y están conectados por ubicación geográfica, interés especial, o afiliación o identifican para abordar las cuestiones que afectan a su bienestar. (Queensland Department of Emergency Services)
Percepciones conductuales (nudges) - Las percepciones conductuales consisten en el diseño de pequeñas intervenciones para provocar un cambio en el comportamiento de las personas de una manera predecible, sin al mismo tiempo, prohibir cualquier opción o cambiar sus incentivos económicos significativamente. En la práctica esto significa, por ejemplo, el cambio de la presentación de opciones, de modo que el camino de menor resistencia conduce a el comportamiento deseado. Lo que se busca con estas prácticas es incrementar el bienestar de las personas, por ejemplo, al cambiar los productos “de impulso” (como dulces o papas fritas) en la fila de los cajeros del supermercado por snacks saludables, se influencía a los clientes a comprar más productos saludables. (Thaler y Sunstein, 2009)
Principio de verificación colectiva (many eyes principle) - Cuando algo es visible para muchas personas, colectivamente, hay mayor probabilidad de que encuentren errores. La publicación de datos abiertos puede ser una medida para mejorar la precisión y la calidad de los datos, especialmente cuando una buena interface o plataforma permite reportar los errores encontrados.
Visualización- Una representación visual de datos, que por ejemplo, es una excelente manera de comunicar los elementos esenciales, las correlaciones entre ellos y sus valores atípicos. Aunque ya existen muchas herramientas para crear visualizaciones, el hacerlo no es un proceso automático, al contrario, requiere de mucha atención para la definición de las variables, la relación entre ellas y el descubrir las historias inherentes a esos datos, que luego podrían usarse para diseñar una representación visual que permite la transmisión del mensaje de una manera apropiada.
Web API - “API” que es diseñado para funcionar en Internet. Licencias en las que los puedes encontrar:
- Share-alike License - Una licencia que requiere que los usuarios de un trabajo provean el contenido bajo condiciones similares o iguales a las del trabajo original.
- Public domain - No existen derechos de autor sobre el trabajo.No existen en todas las jurisdicciones.
- Database rights - Un derecho que prohíbe a otros extraer y utilizar contenido de una base de datos. Existe principalmente en jurisdicciones europeas.
- Copyright - El derecho de los creadores de las obras creativas para restringir el uso de los demás de esas obras. Un dueño de los derechos de autor tiene derecho a determinar cómo otros pueden usar ese trabajo.
Este glosario fue construido por el equipo del proyecto DesafíoSP a partir de las siguientes referencias que te recomendamos revisar:
- Basics of Open Government
- Crowdcrafting
- Data Collaboratives Sharing Public Data in Private Hands for Social Good
- Datos abiertos de gobierno
- Definiciones y características del Crowdsourcing
- Definition of Citizen Science
- Embracing Agile
- National Science Foundation
- Nudge: Improving decisions about health, wealth, and happiness
- Open Data Handbook
- Open Definition
- Open Government Data
- Open Government Guide
- Transparency and Technology Project
- What do we mean by small data?
- What is data science?
- White House Big Data Report
- White House blog on Citizen Science and Crowdsourcing
*Si quieres agregar o modificar alguna de estas definiciones puedes poner tu propuesta a discusión en Issues