Dennis es Ingeniero en informática y trabaja con grandes volúmenes de datos. Es gestor y desarrollador de aplicaciones del ámbito académico y usando MediaWiki para proyectos de índole colaborativa. Es integrante del Directorio de Wikimedia Chile
Ideas del episodio
Wikidata es el proyecto de datos abiertos para que las máquinas puedan identificar el conocimiento y ayudarnos a sacarle valor desde Wikipedia.
Es necesario que las organizaciones que son almacenes de datos suban sus contenidos a Wikidata.
Wikidata esta trabajando mucho con datos de personas, paises y ciudades. Esos datos se muestran Wikipedia a través de Wikidata
Cualquier persona puede subir (hay herramientas específicas) datos a Wikidata.
Wikidata tiene herramientas para vincular los elementos de los datos que se suben y los que ya existen
Autores.uy subió datos de todos los autores de Wikipedia a Uruguay
Wikidata prefiere conectarse a otras bases antes que recibir la subida de datos estáticos. De esta forma Wikipedia se modificaría dinámicamente a medida que cambien los recursos
Los objetos deben tener identificadores únicos para identificar el proceso. Tener un URI es más importante que el formato.
La biblioteca Nacional de Chile libero datos describiendo ontologías y en documentos RDF. Posiblemente haya sido el primer ente público en hacerlo en latinoamérica
Wikidata genera un entorno en el que es posible hacer consultas SPARQL cruzadas hacia diferentes orígenes.
Wikipedia no es el único cliente de Wikidata.
Hay gente usando a modo personal Wikidata desde OpenRefine
WolframAlpha usa otros recursos más formales pero tiene una lógica parecida a Wikidata
La mejor forma de generar impacto con datos es pensar el aquello que mejore la calidad de vida de las personas.
Cada vez que vamos a un hospital público o centro de salud en Argentina tengamos o no cobertura social existen resortes legales que le permiten a la institución recuperar todo o parte del costo.
Muchas personas aún teniendo cobertura médica asisten a centros públicos de salud donde son atendidos gratuitamente y si la institución no cumple los pasos requeridos entonces las obras sociales no abonarán (como sería esperado) por esta atención.
Se requiere entonces que los administradores de hospitales y centros de salud públicos (Municipios y Provincias) cumplan una serie de pasos burocráticos entre los que se encuentra la organización de los datos de los servicios médicos prestados.
Como esta tarea puede ser compleja y existe la posibilidad de generar ingresos interesantes (mas grandes mientras más servicios de salud entregue un gobierno) ya existen empresas que regalan un software a cambio de una comisión de los montos reintegrados a través de el. Esta comisión puede ser de entre el 30 y el 50%. No todos los municipios lo usan (la Municipalidad de Córdoba hace una gestión propia) pero los que lo hacen derivan demasiado dinero a esto y quedan sujetos a una dependencia tecnológica no recomendable.
La Organización Panamericana de la Salud (OPS o PAHO) realizo una convocatoria para crear o mejorar sistemas de información de salud (IS4H - Information Systems for Health) basado en la creencia de que los datos y la informatización van a crear mejores condiciones para definir y monitorear políticas públicas de salud. El monto ofrecido es de hasta US$ 40.000.
Después de haber conseguido 10.000 dolares de financiación de CAF la idea de reorganizar toda la gestión de recupero parecía algo realizable y sobre todo muy útil para extender a otros gobiernos más pequeños.
Desarrollar algo internamente, que sea abierto a que otros gobiernos (y por que no, empresas) puedan reutilizar y mejorar es acorde a nuestra política de software público libre.
Los equipos de Modernización y Salud de la Municipalidad tuvimos múltiples reuniones donde acordamos que este producto sería de utilidad no solo para nosotros sino para acompañar a decenas de municipios que brindan servicios de salud en toda nuestra provincia.
Si bien hacer esta postulación es una tarea compleja (empezó hace meses) el esfuerzo valió la pena y la OPS/PAHO premió nuestra postulación:
Es por esto que comenzamos con el proceso de este desarrollo que de no mediar inconvenientes nos dará en los próximos meses el primer software público y libre para gestión de recupero de gastos de salud.
En octubre de 2018 la Municipalidad de Córdoba lanzó la aplicación móvil llamada Go. Su finalidad es proveer información precisa de cada unidad del transporte público de pasajeros con la finalidad de mejorar la experiencia de los usuarios de este servicio.
Al momento de su salida había aplicaciones similares en Argentina pero ninguna (que yo conozca) que permita seguir al colectivo por su GPS en tiempo real. Incluso cuando el colectivo se desvía por cortes de tránsito los usuarios pueden notarlo y re-ubicarse para alcanzarlo.
Nota: Ese día había protestas en la vía pública
Tan difícil de creer que estos datos era reales que este usuario grabó mientras esperaba el colectivo esperando ser defraudado.
Conté hace un tiempo (con motivo del lanzamiento de otra aplicación) la gran cantidad de trabajo que significa llegar a esto y las oportunidades que se abren luego de estas publicaciones.
La aplicación Go representa un esfuerzo particularmente complejo en cuanto a la organización de los datos preexistente:
Las ubicación y especificaciones (lineas que la usan) de las paradas
Los recorridos geolocalizados de cada línea.
La flota activa de colectivos.
El geoposicionamiento en tiempo real de las unidades
Estos datos se encontraban algunos en poder de la municipalidad en formatos variados, otros como parte del sistema de gestión de flota de las empresas de transporte. Comenzar a trabajarlos y procesarlos deja ver la parte del iceberg que una aplicación simple no permite percibir. Detrás de Go hay miles de horas de trabajo y sobre todo muchos datos.
Esta reorganización de los datos nos permitiría además (todavía no está listo) tener un servicio de datos en formato GTFS.* Este formato es el estándar usado en otras ciudades del mundo para compartir datos de transporte y el que usan las aplicaciones más usadas (Google Maps, Apple, etc). Una ciudad sin GTFS no puede decir que ha terminado de abrir sus datos de transporte.
Todos estos datos en control municipal, organizados y antes de lanzar Go nos permitieron desarrollar tableros de control interno que permitían a personal de transporte ver en tiempo real donde estaban las unidades y cuantas de ellas se encontraban prestando servicio. Esto permite mejorar sensiblemente el control de la calidad del servicio subiendo el nivel de datos en poder del municipio en su dialogo con los prestadores del servicio.
Sin embargo la cantidad de datos recibidos ** nos permitían hacer análisis más detallados y complejos que requerían más y mejor equipo del que teníamos.
CAF financiaba con hasta US$ 10.000 a 5 equipos que presentaran propuestas. Se presentaron 10 equipos (Ministerios de Nación Argentina y otras ciudades de nuestro país). Luego de mostrar en un workshop junto a científicos que escucharon nuestros problemas (acompañados por un equipo de la Fundación Sadosky) el trabajo que estábamos realizando la Municipalidad de Córdoba fue seleccionada. Con esta financiación un equipo de UBA/CONICET trabajó junto a nuestro equipo para sacar mejor provecho de toda la nueva información de transporte que estábamos procesando.
Actualmente estamos integrando todo el trabajo conjunto a nuestras herramientas preexistentes y esperamos publicar (y liberar como software libre para otras ciudades) los resultados finales.
Es muy importante destacar que la totalidad de los fondos se invirtieron en tecnología que es propiedad de la Municipalidad y que incrementará las capacidades propias instaladas en los equipos internos.
Conclusiones
La gestión del sistema de transporte de cualquier ciudad mediana o grande sin datos y análisis es seguramente pobre o incompleta. Mirar todo este cúmulo de datos detenidamente deja ver mucho mejor y a un nivel mucho mas detallado que pasa con este servicio que usan cientos de miles de personas cada día.
*Córdoba tuvo el primer GTFS de Argentina que lamentablemente se discontinuó. Impulsado por un activista de la ciudad, Gastón Ávila (acá cuenta un poco del tema). ** Por ejemplo la posición GPS cada ~20 segundos de las 900 unidades de transporte