Ir al contenido principal

Ejemplo de datos libres para hacer periodismo

El siguiente es un ejercicio de análisis de datos a modo de experimentación en las nuevas herramientas existentes para el analisis de datos con fines periodísticos. En los próximos días se cumple un año de la implementación de la "tasa vial" en Córdoba. Muy polémico en su momento con numerosos argumentos a favor y en contra. Con la ayuda de la liberación de datos del estado provincial y nacional podemos analizar las variaciones en algunos indicadores relacionados al mercado de los combustibles. En primer lugar podemos analizar la evolucion de la cantida de puestos de trabajo relacionados al sector antes y despues de esta medida:
Evolución de los puestos de trabajo en Córdoba entre finales de 2010 y finales de 2012 en el rubro Vta y reparación de vehículos + vta por menor de combustible Fuente: Gobierno de Córdoba, dirección de estadísticas y censos Formato: XLSX. Descarga

Si bien la caida es muy pequeña en valores porcentuales (alrededor del 1%) se puede ver como se detuvo el franco ascenso que el mercado venia mostrando trimestre a trimestre. Otro dato a analizar es el consumo de combustible, este gráfico muestra la evolucion de metros cúbicos de gasoil vendidos en cordoba entre 2010 y junio de 2013

Estos fueron transformados y modificados en fusion tables de google, aquí el vínculo para su descarga o edición.

Puede verse el pico mínimo en la fecha de implementación de la tasa vial en septiembre de 2012. Solo a modo de ejemplo del potencial de estos datos va un grafico del consumo de combustible por ciudad en la provincia de Córdoba

Metros cubicos por ciudad, Córdoba, 2011. Incluye expendio a consumidor final, transportes de carga, mayoristas en el agro y empresas de transporte público. El Ministerio de Planificacion Federal Inversion Publica y servicios dispone además de un archivo de datos individualizando estaciones de servicio, ciudad y provincia en una tabla de casi un millón de registros y que muestra datos de los ultimos tres años.

Conclusión Existen numerosos datos disponibles, las administraciones nacionales y provinciales a través de los departamentos de estadísticas ofrecen al publico una abanico grande de posibilidad en cuando a conocer información precisa de las actividades oficiales. Un gran problema del análisis de estos datos es la variada gama de formatos y tecnologías en los que estos datos son liberados. Es necesario siempre un post-procesamiento de los datos y en la mayoría de los casos son necesarias herramientas de manejo de datos o programación no accesibles para el periodista común. Es notorio el avance en los últimos meses, en Argentina particularmente se destaca el trabaja del diario La Nacion con un equipo específico y multidiciplinario, los pueden seguir en twitter en @lndata Un interesante resumen publica pagina 12 acerca de este tema.

Aprovechando el API de Youtube

Selection_043Hace tiempo que quería hacer algo con el API de youtube y sumado a mi interés por noticias internacionales se me ocurrió juntar los mejores canales de noticias de TV que publican diariamente resúmenes de noticias online en un solo sitio.

No es fácil encontrar sitios con noticias de orígenes variados así que imaginé que con el API de youtube y un cron diario que capturara las noticias sería suficiente. Arme mi lista de canales en mysql, le pedí al API que trajera los últimos videos de cada uno (y lo programé para que lo haga a diario) y monte todo en un lindo template (bootstrap compatible). Use como framework Codeigniter que además de ser muy simple ya tiene resueltos muchos detalles y es MVC.

Agregue y validé un sitemap, un feed rss, tome algunas sugerencias siempre utiles de Woorank, GTMetrix y PageSpeed de google.

El resultado de esto se puede ver television.data99.com.ar, un resumen de noticias por país y ciudad que se actualiza a diario y se puede ampliar simplemente agregando nuevos canales de noticias.

Consideraciones para tercerizar el desarrollo de software

Antes de encomendar tareas de desarrollo de software a terceros es importante tener en cuenta algunos aspectos que harán del proceso algo más fácil de llevar adelante y sobre todo, de controlar.

1.- Repositorio de software. Si tu empresa ya cuenta con algún sistema de control de versiones de software (si no es así, debería) debes inicializar un repositorio y darle acceso a los nuevos desarrolladores. Esto te permitirá conocer y controlar el avance día por día, si cuentas con personal capacitado en tu empresa podrás también medir la calidad del producto que están desarrollando y evitar sorpresas al finalizar el desarrollo. Github es una muy buena solución para este proceso.

2.- Entorno de desarrollo. Tienes que entregar accesos a un ambiente desarrollo que tenga los mismos productos de software que corren en tu servidor de producción. Esto evitará que el deploy final sea problemático. AWS (amazon web services) permiten gran flexibilidad aqui. Existen numerosas soluciones además de AWS, consulta con tu proveedor habitual de hosting. Si tu desarrollo requiere una conexión a bases de datos de tu empresa tomate el trabajo de hacer una copia resumida de la misma, no uses la misma base de datos que esta trabajando al público.

3.- Integra a tu equipo con los nuevos programadores. Trata de que al menos una persona en tu equipo forme parte del desarrollo. Esto te garantizará los estándares que ya usas en tu empresa y un control y seguimiento permanente. Los desarrollos “pago y veo al final” no funcionan.

4.- Tiempos de entrega. Pauta claramente al menos tres etapas de desarrollo con fechas claras y objetivos concretos. No dejes de controlar y monitorear los avances

5.- Pide documentación, al menos a nivel básico. Exige que el código al menos este comentado.

Otras consideraciones. .- Es posible que los alcances del producto varíen durante el proceso de desarrollo, consulta costos por desarrollos u horas extras. Asegúrate que hay flexibilidad para implementar cambios. .- Incluye en el costo final el deploy a tu servidor de producción, nadie mejor que quien lo desarrolló para hacer los ajustes finales en el servidor de producción. Trabaja con personas de confianza y modifica los datos de acceso luego de finalizado el período de desarrollo. .- Los productos con pocos datos en general funcionan muy bien. Asegurate de testear el producto a fondo con muchos usuarios concurrentes y con una gran cantidad de datos.