Repositorio de Información/metadatos - SierraNevada

Repositorio de Información/metadatos

De SierraNevada

Tabla de contenidos

Introducción

Concepto de Metadatos e importancia

Cuando hablamos de metadatos nos referimos a la información acerca de los datos. Consiste en una información de nivel superior que describe el contenido, calidad, estructura y accesibilidad de un conjunto específico de datos [1]. De una forma sencilla, si tenemos un conjunto de datos, los metadatos corresponden a la información que nos describe quién, qué, cuándo, dónde y por qué de ese conjunto de datos. Es decir, nos informan sobre el contexto en el que se tomaron los datos, los protocolos utilizados, la estructura y el formato que presentan; proporcionando de esta forma lo necesario para una correcta interpretación de los datos.
Concepto de Metadatos

En ecología, al igual que en otras disciplinas científicas, los datos presentan una tendencia natural de degradación con el tiempo respecto al contenido de información, es lo que se conoce como entropía de la información. [1] Por otro lado, los datos ecológicos presentan unas características que hacen de los metadatos una necesidad para un manejo eficiente de la información. Entre estas características destacamos:

  • Heterogeneidad. Existe un amplio abanico de estudios muy diferentes dentro de la disciplina ecológica (biodiversidad, restauración vegetal, ciclos biogeoquímicos, etc.) lo cual se traduce en un conjunto de datos con formatos muy heterogéneos que reflejan los motivos de la colecta de datos. [2].
  • Diferentes escalas. Dentro de los estudios ecológicos se atiende a diferentes escalas temporales, geográficas y taxonómicas.
  • Dispersión de los datos. Existe, al igual que en otras disciplinas, una dispersión de datos en diferentes centros de investigación.
    Entropía de la información
    .

Los científicos han reconocido la importancia de documentar sus datos, y en ecología la utilización de metadatos aporta una serie de beneficios que fundamentan el uso de estos:

  • Reducen la entropía de la información.
  • Aumentan la longevidad de los datos.
  • Facilitan la reutilización de los datos y el intercambio entre científicos.
  • Facilitan las síntesis basadas en amplios datos (diferentes escalas) y los meta-análisis.
  • Permiten la generación de repositorios de información.
  • Capacitan el uso de aplicaciones analíticas avanzadas (p.ej. integración de datos, flujos de trabajo) y la interoperabilidad entre diferentes sistemas.

En definitiva, el uso de metadatos aumenta la potencialidad de los datos.

Estándares de metadatos

Existen diferentes esquemas o estándares de metadatos que establecen una serie de criterios fijos para la descripción de los datos. Estos estándares o modelos de metadatos varían en función del propósito y de la disciplina científica: biodiversidad (TDWG, Biodiversity Information Standart), información geográfica (Content Standards for Digital Geospatial Metadata, U.S. Federal Geographic Data Committee; normas ISO 19115), entre otros.

EML: Estandar de Metadatos en Ecología

En ecología se ha desarrollado un estándar de metadatos (basado en los trabajos pioneros de Michener et al. 1997[1] y de la ESA, Ecological Society of America) conocido como EML (Ecological Metadata Language). Este estándar, mantenido por la red KBN (Knowledge Network for Biocomplexity), consiste en un lenguaje común implementado en XML que permite describir, archivar y transportar datos. Presenta una estructura modular, donde cada uno de los módulos esta diseñado para describir una parte lógica del total de los metadatos que deben ser incluidos en un conjunto de datos ecológicos. Entre sus características destacan su caracter flexible y extensible, además de que incluye diferentes elementos de otros estándares, tales como:Dublin Core; Perfil de Datos Biológicos (BDP) del FGDC; ISO 19115; Darwin Core; Geography Markup Language (GML), lo cual le permite cierta interoperabilidad con estos estándares.

Existen diversas herramientas para la creación de metadatos siguiendo el estándar EML, entre las que destacan Morpho y MetadataEditor.

Objetivos

Repositorio de Metadatos

En el contexto del sistema de información sobre el programa de seguimiento del cambio global en Sierra Nevada, los metadatos constituyen un pilar básico. Nuestro objetivo fundamental es diseñar e implementar un sistema de "metadatado" que permita documentar toda la información existente en el sistema. Con toda esta "metainformación" elaboraremos un catálogo o repositorio[3] , que nos permitirá consultar de manera ágil toda la documentación asociada a los distintos elementos del sistema. Este catálogo será una de las principales vías de entrada para los usuarios al sistema de información.

De esta forma, se facilitará la tarea de transformar toda la información que se genere en conocimiento para hacerla útil al proceso de toma de decisiones. En definitiva, el repositorio de información (apoyado por el repositorio de metadatos) será un pilar básico en el proyecto del observatorio de cambio global en Sierra Nevada, porque ayudará a la consecución del proceso de gestión adaptativa.



Para todo ello nos hemos planteado unos objetivos específicos:

  • Estudio de tipos y formatos de información que queremos documentar.
  • Análisis y estudio del estándar EML.
  • Elección de herramientas para la creación de archivos de metadatos.
  • Estudio de las diferentes propuestas de integración de datos.


Metodología

Para la consecución de los objetivos planteados estamos analizando los sistemas de gestión de la información utilizados en los sitios LTER, estudiando las diferentes aproximaciones respecto a los esquemas de repositorios de metadatos, las formas de implementación de los mismos y los sistemas de metadatado de la información que están utilizando.

Para la creación de archivos de metadatos estamos utilizando diferentes herramientas de distintas iniciativas:

  • Morpho. Es un editor de metadatos desarrollado por la red Knowledge Network for Biocomplexity (KBN) que utiliza el estándar EML. Con esta herramienta se pueden documentar diversos tipos de formatos de datos incluyendo algunas bases de datos Access.
  • MetadataEditor. Se trata de un editor de metadatos basado en web, desarrollado por la iniciativa LTER que permite crear metadatos en estándar EML
  • Esri2EML. Es una herramienta que permite convertir los archivos de metadatos generados con algunos estándares geográficos (FGDC o ESRI) al estándar EML.

Estamos utilizando diferentes recursos para el estudio de la implementación de metadatos siguiendo el estándar EML. Entre ellos cabe citar:

  • Bibliografía general sobre metadatos en ecología [1][2][3][4][5][6][7]
  • Recursos ofrecidos por diferentes iniciativas:
    • Red Knowledge Network for Biocomplexity (KBN)
      • Presentaciones sobre EML, Morpho y MetaCat.
      • Manual de buenas prácticas sobre EML
    • Red US Long Term Ecologiacal Research (LTER)
    • Science Environment for Ecological Knowledge (SEEK)

Avances

  • Tipos de datos que vamos a documentar

Hay una gran heterogeneidad en el formato de datos que vamos a documentar, existiendo gran dependencia del investigador y del proyecto de investigación. De forma general pretendemos documentar información de tipo gráfica y alfanumérica.

Tipos de datos a documentar

Una gran parte de la información que se genere estará bajo un formato de base de datos normalizada y estandarizada. Hemos conseguido documentar (obtener el archivo de metadatos) la estructura de las diferentes bases de datos estandarizadas que se está utilizando en cada uno de los ámbitos temáticos (programa de seguimiento)

Actualmente se está analizando los formatos de datos que se pretende documentar y estamos estudiando la inclusión de otros formatos de datos.

  • Estudio de EML.

Se han estudiado los diferentes módulos del EML, y se ha visto como podemos encajar nuestros tipos de datos en ellos.

  • Estudio de herramientas

Se han estudiado y probado distintas herramientas para la creación de metadatos en el estándar EML. Entre ellas destacamos:

  • Morpho
  • MetadataEditor
  • ESRI2EML

Se están analizando las limitaciones y las ventajas que ofrecen para el formato de información que pretendemos documentar. Actualmente se está en proceso de elección de la herramienta más adecuada a nuestros propósitos.

  • Catálogos de metadatos.

En cuanto a los catálogos de metadatos se está analizando la funcionalidad de utilizar un estándar de metadatos (EML). Se está planteando la posibilidad de diseñar un catálogo de metadatos que utilice diversos estándares y ver si de este modo se resolverían algunas dudas que se nos están presentando.

  • Presentación general sobre metadatos y EML.

En esta presentación se muestra el concepto general de metadatos, el estándar EML y el esquema del repositorio de metadatos que pretendemos llevar a cabo.


Referencias Bibliográficas

  1. ↑ 1,0 1,1 1,2 1,3 Michener, W.K., Brunt, J.W., Helly, J.J., Kirchner, T.B. & Stafford, S.G. (1997). Nongeospatial metadata for the ecological sciences. Ecological Applications, 7 (1):330-342[1]
  2. ↑ 2,0 2,1 Fegraus, E.H., Andelman, S., Jones, M.B. & Schildhauer, M., (2005). Maximizing the Value of Ecological Data with Structured Metadata: An Introduction to Ecological Metadata Language (EML) and Principles for Metadata Creation. Bulletin of the Ecological Society of America, 86 (3): 158–168 [2]
  3. ↑ 3,0 3,1 Jones, M.B., Schildhauer, M.P., Reichman, O.J. & Bowers, S. (2006). The New Bioinformatics: Integrating Ecological Data from the Gene to the Biosphere. Annual Review of Ecology, Evolution, and Systematics, 37 (1): 519–544 [3]
  4. ↑ Jones, M.B., Berkley, C., Bojilova, J. & Schildhauer, M. (2001). Managing scientific metadata. Internet Computing IEEE, 5 (5): 59–68. [4]
  5. ↑ Michener, W.K. (2006). Meta-information concepts for ecological data management. Ecological Informatics, 1 (1): 3–7. [5]
  6. ↑ Alonso, B. &Valladares, F. (2006). Bases de datos y metadatos en ecología: compartir para investigar en cambio global. Ecosistemas, 15 (2): 83–88. [6]
  7. ↑ Michener, W.K. & Brunt, J.W. (Eds.) (2000). Ecological Data: Design, Management and Processing. Oxford: The seminal paper Blackwell. 180 pp.

Reuniones del Equipo de Trabajo

Informes

Integrantes del equipo

o

Laboratorio de Ecología - CEAMA
  • Francisco Javier Bonet García (Coordinación Sistema de Información). correo-e: fjbonet@ugr.es
  • Antonio Jesús Pérez Luque. (Repositorio de Metadatos). email ajperez@ugr.es
  • Ramón Pérez Pérez (Responsable de desarrollos informáticos). correo-e: ramon.pperez@gmail.com
  • Artículo.............................................................................
  • Discusión.............................................................................
  • Ver código fuente.............................................................................
  • Historial.............................................................................
  • Zona Interna.............................................................................
  • Lo que enlaza aquí.............................................................................
  • Cambios en enlazadas.............................................................................
  • Subir archivo.............................................................................
  • Subir varios archivos.............................................................................
  • Páginas especiales.............................................................................
  • 38.107.179.216.............................................................................
  • Discusión para esta IP.............................................................................
  • Registrarse/Entrar.............................................................................
Esta página fue modificada por última vez el 05:17, 23 jul 2009. Esta página ha sido visitada 1.347 veces.
  • Aviso legal.............................................................................
  • Powered by MediaWiki.............................................................................
  • Design by Creados.............................................................................
  • Como participar.............................................................................