Repositorio de Información/metadatos
De SierraNevada
Tabla de contenidos |
Introducción
Concepto de Metadatos e importancia
Cuando hablamos de metadatos nos referimos a la información acerca de los datos. Consiste en una información de nivel superior que describe el contenido, calidad, estructura y accesibilidad de un conjunto especÃfico de datos [1]. De una forma sencilla, si tenemos un conjunto de datos, los metadatos corresponden a la información que nos describe quién, qué, cuándo, dónde y por qué de ese conjunto de datos. Es decir, nos informan sobre el contexto en el que se tomaron los datos, los protocolos utilizados, la estructura y el formato que presentan; proporcionando de esta forma lo necesario para una correcta interpretación de los datos.En ecologÃa, al igual que en otras disciplinas cientÃficas, los datos presentan una tendencia natural de degradación con el tiempo respecto al contenido de información, es lo que se conoce como entropÃa de la información. [1] Por otro lado, los datos ecológicos presentan unas caracterÃsticas que hacen de los metadatos una necesidad para un manejo eficiente de la información. Entre estas caracterÃsticas destacamos:
- Heterogeneidad. Existe un amplio abanico de estudios muy diferentes dentro de la disciplina ecológica (biodiversidad, restauración vegetal, ciclos biogeoquÃmicos, etc.) lo cual se traduce en un conjunto de datos con formatos muy heterogéneos que reflejan los motivos de la colecta de datos. [2].
- Diferentes escalas. Dentro de los estudios ecológicos se atiende a diferentes escalas temporales, geográficas y taxonómicas.
- Dispersión de los datos. Existe, al igual que en otras disciplinas, una dispersión de datos en diferentes centros de investigación. .
Los cientÃficos han reconocido la importancia de documentar sus datos, y en ecologÃa la utilización de metadatos aporta una serie de beneficios que fundamentan el uso de estos:
- Reducen la entropÃa de la información.
- Aumentan la longevidad de los datos.
- Facilitan la reutilización de los datos y el intercambio entre cientÃficos.
- Facilitan las sÃntesis basadas en amplios datos (diferentes escalas) y los meta-análisis.
- Permiten la generación de repositorios de información.
- Capacitan el uso de aplicaciones analÃticas avanzadas (p.ej. integración de datos, flujos de trabajo) y la interoperabilidad entre diferentes sistemas.
En definitiva, el uso de metadatos aumenta la potencialidad de los datos.
Estándares de metadatos
Existen diferentes esquemas o estándares de metadatos que establecen una serie de criterios fijos para la descripción de los datos. Estos estándares o modelos de metadatos varÃan en función del propósito y de la disciplina cientÃfica: biodiversidad (TDWG, Biodiversity Information Standart), información geográfica (Content Standards for Digital Geospatial Metadata, U.S. Federal Geographic Data Committee; normas ISO 19115), entre otros.
EML: Estandar de Metadatos en EcologÃa
En ecologÃa se ha desarrollado un estándar de metadatos (basado en los trabajos pioneros de Michener et al. 1997[1] y de la ESA, Ecological Society of America) conocido como EML (Ecological Metadata Language). Este estándar, mantenido por la red KBN (Knowledge Network for Biocomplexity), consiste en un lenguaje común implementado en XML que permite describir, archivar y transportar datos. Presenta una estructura modular, donde cada uno de los módulos esta diseñado para describir una parte lógica del total de los metadatos que deben ser incluidos en un conjunto de datos ecológicos. Entre sus caracterÃsticas destacan su caracter flexible y extensible, además de que incluye diferentes elementos de otros estándares, tales como:Dublin Core; Perfil de Datos Biológicos (BDP) del FGDC; ISO 19115; Darwin Core; Geography Markup Language (GML), lo cual le permite cierta interoperabilidad con estos estándares.
Existen diversas herramientas para la creación de metadatos siguiendo el estándar EML, entre las que destacan Morpho y MetadataEditor.
Objetivos
Repositorio de Metadatos
En el contexto del sistema de información sobre el programa de seguimiento del cambio global en Sierra Nevada, los metadatos constituyen un pilar básico. Nuestro objetivo fundamental es diseñar e implementar un sistema de "metadatado" que permita documentar toda la información existente en el sistema. Con toda esta "metainformación" elaboraremos un catálogo o repositorio[3] , que nos permitirá consultar de manera ágil toda la documentación asociada a los distintos elementos del sistema. Este catálogo será una de las principales vÃas de entrada para los usuarios al sistema de información.
De esta forma, se facilitará la tarea de transformar toda la información que se genere en conocimiento para hacerla útil al proceso de toma de decisiones. En definitiva, el repositorio de información (apoyado por el repositorio de metadatos) será un pilar básico en el proyecto del observatorio de cambio global en Sierra Nevada, porque ayudará a la consecución del proceso de gestión adaptativa.
Para todo ello nos hemos planteado unos objetivos especÃficos:
- Estudio de tipos y formatos de información que queremos documentar.
- Análisis y estudio del estándar EML.
- Elección de herramientas para la creación de archivos de metadatos.
- Estudio de las diferentes propuestas de integración de datos.
MetodologÃa
Para la consecución de los objetivos planteados estamos analizando los sistemas de gestión de la información utilizados en los sitios LTER, estudiando las diferentes aproximaciones respecto a los esquemas de repositorios de metadatos, las formas de implementación de los mismos y los sistemas de metadatado de la información que están utilizando.
Para la creación de archivos de metadatos estamos utilizando diferentes herramientas de distintas iniciativas:
- Morpho. Es un editor de metadatos desarrollado por la red Knowledge Network for Biocomplexity (KBN) que utiliza el estándar EML. Con esta herramienta se pueden documentar diversos tipos de formatos de datos incluyendo algunas bases de datos Access.
- MetadataEditor. Se trata de un editor de metadatos basado en web, desarrollado por la iniciativa LTER que permite crear metadatos en estándar EML
- Esri2EML. Es una herramienta que permite convertir los archivos de metadatos generados con algunos estándares geográficos (FGDC o ESRI) al estándar EML.
Estamos utilizando diferentes recursos para el estudio de la implementación de metadatos siguiendo el estándar EML. Entre ellos cabe citar:
- BibliografÃa general sobre metadatos en ecologÃa [1][2][3][4][5][6][7]
- Recursos ofrecidos por diferentes iniciativas:
Avances
- Tipos de datos que vamos a documentar
Hay una gran heterogeneidad en el formato de datos que vamos a documentar, existiendo gran dependencia del investigador y del proyecto de investigación. De forma general pretendemos documentar información de tipo gráfica y alfanumérica.
Una gran parte de la información que se genere estará bajo un formato de base de datos normalizada y estandarizada. Hemos conseguido documentar (obtener el archivo de metadatos) la estructura de las diferentes bases de datos estandarizadas que se está utilizando en cada uno de los ámbitos temáticos (programa de seguimiento)
Actualmente se está analizando los formatos de datos que se pretende documentar y estamos estudiando la inclusión de otros formatos de datos.
- Estudio de EML.
Se han estudiado los diferentes módulos del EML, y se ha visto como podemos encajar nuestros tipos de datos en ellos.
- Estudio de herramientas
Se han estudiado y probado distintas herramientas para la creación de metadatos en el estándar EML. Entre ellas destacamos:
- Morpho
- MetadataEditor
- ESRI2EML
Se están analizando las limitaciones y las ventajas que ofrecen para el formato de información que pretendemos documentar. Actualmente se está en proceso de elección de la herramienta más adecuada a nuestros propósitos.
- Catálogos de metadatos.
En cuanto a los catálogos de metadatos se está analizando la funcionalidad de utilizar un estándar de metadatos (EML). Se está planteando la posibilidad de diseñar un catálogo de metadatos que utilice diversos estándares y ver si de este modo se resolverÃan algunas dudas que se nos están presentando.
- Presentación general sobre metadatos y EML.
En esta presentación se muestra el concepto general de metadatos, el estándar EML y el esquema del repositorio de metadatos que pretendemos llevar a cabo.
Referencias Bibliográficas
- ↑ 1,0 1,1 1,2 1,3 Michener, W.K., Brunt, J.W., Helly, J.J., Kirchner, T.B. & Stafford, S.G. (1997). Nongeospatial metadata for the ecological sciences. Ecological Applications, 7 (1):330-342[1]
- ↑ 2,0 2,1 Fegraus, E.H., Andelman, S., Jones, M.B. & Schildhauer, M., (2005). Maximizing the Value of Ecological Data with Structured Metadata: An Introduction to Ecological Metadata Language (EML) and Principles for Metadata Creation. Bulletin of the Ecological Society of America, 86 (3): 158–168 [2]
- ↑ 3,0 3,1 Jones, M.B., Schildhauer, M.P., Reichman, O.J. & Bowers, S. (2006). The New Bioinformatics: Integrating Ecological Data from the Gene to the Biosphere. Annual Review of Ecology, Evolution, and Systematics, 37 (1): 519–544 [3]
- ↑ Jones, M.B., Berkley, C., Bojilova, J. & Schildhauer, M. (2001). Managing scientific metadata. Internet Computing IEEE, 5 (5): 59–68. [4]
- ↑ Michener, W.K. (2006). Meta-information concepts for ecological data management. Ecological Informatics, 1 (1): 3–7. [5]
- ↑ Alonso, B. &Valladares, F. (2006). Bases de datos y metadatos en ecologÃa: compartir para investigar en cambio global. Ecosistemas, 15 (2): 83–88. [6]
- ↑ Michener, W.K. & Brunt, J.W. (Eds.) (2000). Ecological Data: Design, Management and Processing. Oxford: The seminal paper Blackwell. 180 pp.
Reuniones del Equipo de Trabajo
Informes
Integrantes del equipo
o
Laboratorio de EcologÃa - CEAMA
|