Datos enlazados en la Biblioteca Virtual Miguel de Cervantes

Introducción

Datos enlazados en la Biblioteca Virtual Miguel de Cervantes

El catálogo de la Biblioteca Virtual Miguel de Cervantes (BVMC) contiene más de 300 000 registros que fueron creados originalmente a partir del estándar MARC21. Siguiendo el plan estratégico, el catálogo se actualizó con el modelo conceptual FRBR promovido por el IFLA y recibió el premio SPIRL de Stanford Libraries. El contenido de la base de datos ha sido migrado automáticamente a tripletas RDF utilizando el vocabulario RDA para describir las entidades, así como sus propiedades y relaciones.

data.cervantesvirtual.com ha sido premiado con el Premio Aporta 2017 por su grado de innovación, utilidad e impacto.

El proyecto tiene como objetivo ser una guía para otras instituciones que deseen publicar sus datos en abierto, así como también adoptar las últimas tendencias promovidas por instituciones referentes en el ámbito de las bibliotecas como la IFLA y la OCLC. Además, los resultados de este proyecto son utilizados como material docente en la Universidad de Alicante.

Acceso al catálogo

El catálogo tiene disponible diferentes puntos de acceso:

Acceso a los recursos

data.cervantesvirtual.com muestra información estructurada en diferentes páginas:

Enriquecimiento con Wikidata

Wikidata es un entorno de edición colaborativa que puede ser editado por cualquier usuario. El sitio web data.cervantesvirtual.com se ha enriquecido con dos propiedades de Wikidata:

Los registros se han enriquecido a través de peticiones SPARQL que recuperan información adicional de Wikidata como se puede observar en el autor Miguel de Cervantes. La ficha de autor ha sido enriquecida automáticamente con campos adicionales de metadatos e imagen, gracias a las propiedades de Wikidata que enlazan al catálogo de la BVMC.

Calidad de los datos generados

La calidad del repositorio LOD data.cervantesvirtual.com se ha evaluado mediante diferentes técnicas. Los resultados de la evaluación, junto a la de otros repositorios se han publicado como artículo de investigación en la revista Journal of Information Science con el título "Evaluating the quality of linked open data in digital libraries" que se encuentra disponible en su versión preprint en el repositorio RUA de la Universidad de Alicante.

Además de la validación a través de consultas SPARQL, es posible utilizar lenguajes para validar y describir conjuntos de datos RDF como Shape Expressions (ShEx). En el artículo "A Shape Expression approach for assessing the quality of Linked Open Data in Libraries" publicado en la revista Semantic Web Journal se incluyen ejemplos basados en varias colecciones de datos de Linked Open Data como la Biblioteca Británica, la Biblioteca Nacional Francesa y la Biblioteca Nacional de Finlandia. Los ejemplos se pueden consultar y ejecutar sin necesidad de instalar ningún software desde GitHub y la herramienta ShEx2 — Simple Online Validator. Más información disponible en el siguiente enlace.

Referencias

Enlaces adicionales