Miércoles, 26 de abril de 2017 Actualizado a las 10:38

Este viernes Conicyt presentará el proyecto nacional de datos abiertos

Cultura - El Mostrador

Datos científicos abiertos para la comunidad: una revolución de la ciencia en Chile

por 25 septiembre, 2014

Datos científicos abiertos para la comunidad: una revolución de la ciencia en Chile
Cuando se habla de datos científicos se hace referencia a los registros de hechos (resultados numéricos, textos, imágenes y sonidos) utilizados como fuentes primarias para la investigación científica. Hace años que gobiernos de países desarrollados aplicaron una política que permite que otros investigadores utilicen datos de investigaciones previas para realizar las propias. Eso marcó toda una revolución en la producción de ciencia en el mundo. Chile está en pañales, pero la discusión ya comienza.

Los datos que generan las investigaciones científicas en el mundo podrían llenar varias bibliotecas de Babel. Tal es la magnitud e importancia de estos antecedentes, generados tanto en las ciencias exactas como en las biológicas y humanas, que su libre circulación supondría un salto cuántico en la producción de más ciencia; un verdadero hito al tomar en consideración que la producción de datos científicos, en los últimos 20 años, ya ha aumentado a grado exponencial.

¿Pero quiénes son los dueños de esos datos? ¿Estos antecedentes son propiedad de los científicos que los trabajan o de la humanidad? ¿Propiedad privada o patrimonial?

Cuando, en 2003, el científico estadounidense Francis Collins sorprendió al mundo al mostrar, dos años antes de lo presupuestado, el mapa del génoma humano –más allá del impacto que produjo en la ciencia global– generó múltiples debates científicos y éticos, siendo uno de ellos incluso de carácter político, al remarcar la desigualdad monumental que implicaría para los Estados del mundo que unos pudiesen manejar ese caudal informativo de manera exclusiva, en perjuicio de otros.

adn code barre

A esa discusión le siguieron otras sobre propiedad intelectual y también sobre inversión económica. El centro del debate estaba puesto entonces en la retribución económica respecto de la inversión. La cuestión era: si un Estado o entidad privada invierte tantos pesos en una investigación, ¿es legítimo que otra entidad utilice esos datos sin haber aportado en la inversión? La repuesta vino precisamente del Proyecto Genoma Humano. El gobierno de EE.UU. invirtió más de 3 billones de dólares y la retribución, tras haber abierto los datos, fue de 796 billones.

Pero más allá de estas consideraciones político-económicas, la realidad es mucho más amplia y el impacto en las personas y gobiernos más directo, sobre todo al constatar que las tecnologías de la información hoy permiten almacenar billones de datos a cada segundo.

En el mundo científico, como precisa la Comisión Nacional de Investigación científica y Tecnológica (CONICYT), "los datos de investigación cobran un rol fundamental en la ciencia y son necesarios para validar modelos y chequear hipótesis. Incluso, al encontrarse disponibles pueden ser reutilizados para proponer otras hipótesis o servir como herramienta en los procesos de evaluación".

¿Qué pasa en Chile con estos datos?

La importancia del acceso abierto a los datos de investigación científica es ampliamente reconocida. Varios gobiernos y organismos internacionales han realizado investigaciones al respecto, que han motivado acuerdos para compartir y preservar los datos. Dentro de las conclusiones del Informe de Ciencia y Tecnología de la organización OECD Science, Technology and Industry Outlook se reconoce a la ciencia abierta como "una de las principales estrategias para fortalecer el desarrollo de la ciencia en el mundo".

Patricia Muñoz

Patricia Muñoz

Este viernes 26, en el ex Congreso Nacional, Chile se pone al corriente de este debate mundial al realizar el Primer Encuentro sobre Datos Científicos Abiertos, organizado por Conicyt, a través de su Programa de Información Científica, y patrocinado por el Consejo del Futuro del Senado.

Patricia Muñoz, directora del Programa de Información Científica de Conicyt, explica que la Comisión "ha invitado a participar a la comunidad científica nacional a intercambiar ideas en torno al diseño e implementación de una política nacional para el acceso y la preservación de datos de investigación financiados con fondos públicos, porque es fundamental contar con el aporte de científicos e instituciones vinculadas con el quehacer investigativo, en la medida que estos desempeñan un papel fundamental para garantizar el acceso y la preservación de los datos".

El centro del debate, que instala Conicyt, está puesto en la posibilidad de compartir los datos científicos, solo en aquellos casos en que dichas investigaciones estén financiados con fondos públicos. "En muchos casos la generación de datos es costosa", repara Muñoz, "por lo que su reutilización para oportunidades de investigación futuras ahorra recursos y rentabiliza la primera inversión".

La idea que prima –en la opinión de Muñoz– es que si los fondos son públicos, entonces los datos que se extraen también debiesen serlo.

A esto se suma –agrega la directora– "el hecho de que compartir los datos permite también emprender investigaciones que, en muchos casos, no serían posibles, al reutilizar los datos para verificar otras hipótesis y probar otras metodologías”.

Debate científico nacional

En Conicyt explican que hoy no hay un fondo que financie ciencia en Chile, que coloque como obligación depositar los datos en repositorios abiertos.

Para Willy Kracht, académico del Departamento de Ingeniería en Minas de la Facultad de Ciencias Físicas y Matemáticas de la Universidad de Chile, "no tener esta garantía se traduce en un avance más lento en el desarrollo del conocimiento". Esta aseveración, aclara el científico, cobra la importancia debida en las investigaciones con fondos públicos, pero respecto a las investigaciones privadas la situación es distinta, sobre en su área de desarrollo, que es la minería.

"En realidad no es un concepto que se use en el área (procesamiento de minerales y metalurgia extractiva), principalmente porque hay bastante contacto con la industria y ahí es todo confidencial", explica.

En el campo de la multimedia, la situación es distinta. Benjamín Bustos, académico del Departamento de Ciencias de la Computación y miembro del Núcleo Milenio CIWS (Centro Investigacion Web Semántica), señala que "al menos desde el punto de vista científico es relevante disponer de repositorios de datos abiertos, para poder ocuparlos con fines académicos y de investigación". Según él, "en la academia existen esfuerzos para generar colecciones de datos estándar que queden disponibles a cualquier equipo de investigación para realizar experimentos, y que otros puedan reproducir los experimentos usando los mismos datos".

Bustos cree que para tener una verdadera disponibiliad de datos se requiere de una discusión legislativa.

"Para los datos de origen en instituciones públicas, en mi opinión, debería legislarse para que ocupen formatos abiertos, de forma que cualquier persona pueda ocupar herramientas computacionales de libre acceso para procesarlos y analizarlos", argumenta.

La necesidad de legislación, no obstante, también genera discusión al interior de la comunidad científica.

Yuri Carvajal, investigador en Salud Pública de la Facultad de Medicina de la Universidad de Chile, opina que en la regulación de estas materias la legislación no debiese ser el único camino. Esta investigadora apuesta más bien por códigos voluntarios. “Prefiero las prácticas, los softwares libres en la educación y en reparticiones públicas”, expresa, al tiempo que aclara que entiende  “por públicas  no a aquellas instituciones no privadas, sino más bien a los que involucran a varias personas”.

Así como en ciencias exactas se reconoce que actualmente no existen repositorios (sitios de almacenamiento digital), en el área de las ciencias humanas, como la historia, académicos admiten que sí existen modelos de almacenamiento que son básicamente para datos emanados de fuentes primarias como libros, diarios y revistas. Sin embargo, en el campo de la investigación doctoral, los datos sencillamente se pierden, situación que anima el debate sobre la preservación de los datos científicos.

Horacio Gutiérrez, profesor titular de Historia, en la Universidad de San Pablo, Brasil, admite que efectivamente existe tal pérdida. “Los archivos que generan las tesis de postgrado habitualmente se pierden porque nadie los quiere recibir, y muchos autores no los quieren entregar porque los consideran únicamente suyos”, sostiene.

Respecto de la autoría intelectual de los datos, Patricia Muñoz precisa que el efecto de ellos es precisamente contrario al temor que los infunde.

“Los datos en rigor pertenecen al investigador, pero además se debe resguardar la seguridad y preservación de estos, particularmente cuando hay fondos públicos involucrados. La importancia que adquiere esta preservación se alinea con la visión de los datos en cuanto son un patrimonio que se debe resguardar”, dice.

Un tema relevante –añade– “lo constituye el hecho de que una política de acceso abierto no atenta contra la titularidad o propiedad de los datos susceptibles de protección. El acceso abierto garantiza que terceros puedan acceder a ellos y puedan manipularlos bajo ciertas condiciones que respeten la titularidad del autor”.

Además de este punto de vista, la directora de Información científica del Conicyt sostiene que los “beneficios se extienden también a los investigadores cuyos datos de investigación se publican, ya que, según los estudios disponibles, hay una correlación directa entre la accesibilidad a los datos que sustentan una investigación y la cantidad de artículos que la citan”.

 Seminario

En el seminario que se llevará a cabo este viernes, un panel de expertos se referirá al contenido y sentido de la iniciativa con la reseña de aspectos técnicos, legales y administrativos.

Los académicos de la Universidad de La Frontera, Ronald Cancino y Patricio Padilla, presentarán una investigación de su autoría, realizada en 2009, que da cuenta del estado del arte nacional e internacional en materia de gestión de datos de investigación. Además, entregarán elementos diagnósticos y estratégicos de las políticas de gestión de datos de investigación e información científica, así como ejemplos de buenas prácticas.

Juan Carlos Lara, director de Investigación de la ONG “Derechos Digitales”, se referirá a los aspectos legales de la preservación en repositorios y el acceso al conocimiento científico. Se explorarán distintas aproximaciones a “lo abierto” como paradigma legal, con consecuencias directas en la forma en que el conocimiento científico se puede distribuir en Internet.

Por último, Claudio Gutiérrez, académico del Departamento de Ciencias de la Computación de la Universidad de Chile, presentará una propuesta para construir una infraestructura para la publicación y el acceso a datos científicos en Chile. Su enfoque se centrará principalmente en los desafíos técnicos –desde el punto de vista de ciencias de la información y computación– que una iniciativa como esta conlleva.

Más información sobre El Mostrador

Videos

Más Noticias

Blogs y Opinión

Encuesta

Mercados

TV

Cultura + Ciudad

Deportes