El catálogo de la Biblioteca Virtual Miguel de Cervantes contiene alrededor de 200,000 registros que fueron creados en un primer momento con el estándar MARC21. El catálogo ha sido recientemente migrado a nueva base de datos basada en el modelo conceptual FRBR promovido por el IFLA (International Federation of Library Associations and Institutions).
El contenido de la base de datos ha sido migrado automáticamente a tripletas RDF utilizando el vocabulario RDA (Resource Description and Access) para describir las entidades, así como sus propiedades y relaciones. La nueva versión del catálogo de datos abiertos se encuentra accesible online.
Data.cervantesvirtual.com muestra información estructurada en diferentes páginas:
Se han utilizado enlaces permanentes para cada uno de los registros del catálogo. Por ejemplo: http://data.cervantesvirtual.com/manifestation/224029.
Los datos corresponden al catálogo principal y se han transformado a tripletas RDF para mejorar la interoperabilidad en el nuevo contexto de datos abiertos.
El modelo de datos utilizado permite la inclusión de enlaces a otros repositorios como por ejemplo VIAF o DBpedia para favorecer el enriquecimiento semántico.
Data.cervantesvirtual.com propociona enlaces al catálogo tradicional, como por ejemplo búsqueda de contenido o portales temáticos. Además incluye enlaces a repositorios externos como por ejemplo VIAF o DBpedia.
Existen diferentes tipos de enlaces:
Para mejorar la interoperabilidad, se han utilizado vocabularios existentes en la medida de lo posible como RDA o Dublin Core.
Todas la páginas pueden ser indexadas por los principales buscadores gracias a la inclusión de información estructurada:
Schema.org, proporciona un vocabulario para añadir información en HTML para facilitar la indexación y búsqueda.
Opengraph Protocol (OG), ha sido utilizado para que las páginas puedan ser enlazadas en las principales redes sociales.
Glyphicon Halflings ha sido utilizado para mostrar iconos.
La librería Apache Jena ha sido utilazada para transformar los registros del catálogo a RDF. Jena es librería de código abierto para desarrollar aplicaciones de Web Semántica. Apache License, Version 2.0.
Sesame ha sido utilizado como repositorio RDF para almacenar las tripletas resultado de la transformación.
Para facilitar la reutilización y uso del repositorio, la información ha sido publicada en datahub.io.
Gustavo Candela Romero, Maria Pilar Escobar Esteban, Manuel Marco Such, Rafael C. Carrasco
Transformation of a Library Catalogue into RDA Linked Open Data.
TPDL 2015: 321-325
Gustavo Candela Romero, Maria Pilar Escobar Esteban, Manuel Marco Such, Rafael C. Carrasco
Migration of a library catalogue into RDA linked open data.
Semantic Web Journal 2017. Online
Gustavo Candela Romero, Maria Pilar Escobar Esteban, Borja Navarro-Colorado
In search of Poetic Rhythm: Poetry retrieval through text and metre.
DATeCH 2017. doi 10.1145/3078081.3078085. Full text PDF
Gustavo Candela Romero, Maria Pilar Escobar Esteban, Manuel Marco Such
Semantic Enrichment on Cultural Heritage collections: A case study using geographic information.
DATeCH 2017. doi 10.1145/3078081.3078090. Full text PDF