Si escribimos las historia de las evaluaciones ambientales, la frase de "los datos son escasos" y "las incertidumbres son grandes" aparecerá como una muletilla dentro de nuevos reportes. Es casi tan común el hecho de tener pocos datos como el de cumplir reglamentos. Entonces tenemos que pensar que quizá no estamos accediendo a los pocos datos de manera eficaz, que no estamos manejado de manera óptima la cantidad de datos existente.
Los datos en si no generan conocimiento; solo son valores asociados al parámetro que mide el instrumento. Es el manejo, análisis y evaluación de los datos en recursos hídricos y medio ambiente lo que nos permite crear ciencia y evaluar de mejor manera los impactos de los proyectos y población sobre los recursos hídricos y medio ambiente. Y porqué no podemos acceder a los datos? Porque si bien los datos existen, estos no son disponibles.
Qué es exactamente un Dato Abierto?
Es un dato que cualquiera puede acceder, utilizar, modificar y compartir para cualquier propósito (fuente: opendefiniton.org). En recursos hídricos y medio ambiente, es cualquier datos disponible para hacer de él lo que sea por quien sea.
Y el concepto de dato abierto implica la libertad completa de tener el dato, para crear cosas con el. Es un dato sin compromisos, es la esencia del "ver y comprender".
El dato abierto va más allá del dato disponible por el formato de transparencia, o el set de datos que bajas de una web. Es un dato oficial, que es soportado por un organismo oficial / institución / empresa para realizar análisis con el.
El Dato Abierto como la frontera de la ciencia?
En contextos emergentes, en donde el positivismo nos puede dejar pensar que podríamos llegar a un futuro de actividad humana en equilibrio con la naturaleza, y de una gestión sostenible. En donde los escenarios de la ignorancia atrevida pretenda solucionar nuestros problemas con el uso de tecnología. En estos escenarios, tenemos que hacer la ciencia fáctica, o la ciencia de los hechos y no la ciencia de la ficción.
Y la ciencia de los hechos, la ciencia que comprende lo que pasa en el medio ambiente a ciencia que analiza la interacción de los procesos del ciclo hídrico y medio ambiente. Esa ciencia necesita tanto de herramientas avanzadas de análisis como de una gran serie de datos disponibles.
Si vemos en un gráfico que la velocidad del viento en la época seca es mayor. No estamos viendo dos hechos aislados, lo que estamos viendo es que no tenemos datos suficientes para correlacionar ambos hechos.
Cual es nuestra actitud para publicar datos?
El evangelio de Juan 8:32 dice: " Y conocerás la verdad, y la verdad te hará libre". Sin embargo, en la evaluación del medio ambiente es lo contrario. La verdad de los datos, no es algo que la gente considere que lo libere, sino que lo condena.
La empresas publican los datos que tienen que publicar, y eso es lo mínimo posible. Si consideran que algún impacto se tiene que evaluar, los datos de la evaluación se mantienen reservados. Debido a la cantidad de conflictos, es preferible que tengan y reporten una serie de puntos que no presentan variación porque no están en la zona de impacto del proyecto. Incluso el mismo estado no publica todos los datos de sus investigaciones.
Es una cuestión de formas
Al final, dada la cantidad de regulación que nos regula, probablemente el medio de publicación de datos sea un reporte impreso, si tienes suerte será digital y si estás muy suertudo estará online. En tiempos modernos, del mundo globalizado, de la inclusión de la diversidad, seguimos mostrando datos de la manera que lo hicieron las personas al origen de la civilización.
Y es que un reporte no es amigable con el usuario porque los reportes no están hechos para almacenar datos, sino textos. Una tabla puede ser incluso un mejor instrumento que un texto. Incluso los reportes están disponibles en una biblioteca donde te lo prestarían para sacar copia, o lo tienes que pedir mediante un formulario de transparencia.
Entonces vemos de manera rápida que la forma de manejar datos es un proceso lento, carente de medidas organizadas de acceso y procesamiento de datos. Esto limita la resolución espacial y temporal de datos, que disminuye la calidad de nuestras evaluaciones ambientales.
El amor a las matemáticas
Las matemáticas son las ciencias de la vida, las que nos ayudan a construir caminos, casas e incluso llegar a otros planetas. Y una de las cosas más fascinantes de las matemáticas es que es una ciencia exacta, donde uno más uno es dos aquí y ahora y el resto del mundo y en el futuro.
Entonces nuestras evaluaciones ambientales y de recursos hídricos deberían ser más matemáticas, deberían ser más precisas. Las evaluaciones debería ser herramientas de decisión donde se comprenda la implicaciones de los cálculos hechos. Para llegar a utilizar las evaluaciones ambiental en ese nivel necesitamos datos, y todos los datos.
El lado oscuro de los "datos abiertos"
Como dijo Obama al invitar a utilizar el portal de datos abiertos de los Estados Unidos (data.gov): "Comprender e innovar con datos tiene el potencial de cambiar casi cualquier cosa para una mejora" (https://www.youtube.com/watch?v=dKHz9LbgRmo)
El lado oscuro de los datos es el miedo, el odio y sobretodo la ignorancia. Los datos representan cosas de manera cuantificable. Ahora, un limitado análisis de los datos crea juicios rápidos y oportunistas sobre el estado de la calidad del aire, agua o suelo.
Entre investigadores sabemos que un resultado de laboratorio no es vinculante de nada, ya que es solo una vista parcial de un fenómeno. Como evaluadores sabemos que lo importante es el análisis de las tendencias de los datos, la cantidad de datos registrados registrados, y la consistencia de estos datos. Con lo que nos atreveríamos a desafiar estas expresiones:
- Comunidad: La mina ha secado nuestros manantiales. Nosotros: Cuales eran los caudales originales de tus manantiales?
- Evaluador: La calidad del agua del cuerpo de agua supera el ECA aguas abajo del proyecto. Nosotros: Y eso que significa? Cuál fue el ECA antes del proyecto?
Tendríamos que hacer una estadística de los reclamos de las mesas de diálogo, pero creemos que muchas se solucionaría con un análisis de datos, si lo datos fueran realmente abiertos. Por que los datos nos mostrarán la verdad y la verdad nos hará libres, como ya habíamos dicho.
El API como frontera final
Nueva palabra para muchos, el API que es la Interfase de Aplicación de Aplicación de Programa en sus siglas en inglés. Si alguna vez queremos interactuar con muchas fuentes de datos y llegar a un análisis "big data", los servidores webs no serán tan efectivos y demoraría mucho la selección y descarga de múltiples datos. Para mejorar la calidad de datos tenemos que utilizar APIs que conectan nuestra computadora directamente con el servidor y descargan los datos de manera automatizada.
A continuación un ejemplo del paquete WBPY en Python que se conecta con el API del Banco Mundial para obtener datos de población total de tres países entre el 2010:2012. Nótese que todo el requerimiento son 7 líneas de código, sin registros, ni formularios: