Datos enlazados en la Biblioteca Virtual Miguel de Cervantes

Introducción

El catálogo de la Biblioteca Virtual Miguel de Cervantes (BVMC) contiene más de 300 000 registros que fueron creados originalmente a partir del estándar MARC21. Siguiendo el plan estratégico, el catálogo se actualizó con el modelo conceptual FRBR promovido por el IFLA y recibió el premio SPIRL de Stanford Libraries. El contenido de la base de datos ha sido migrado automáticamente a tripletas RDF utilizando el vocabulario RDA para describir las entidades, así como sus propiedades y relaciones.

data.cervantesvirtual.com ha sido premiado con el Premio Aporta 2017 por su grado de innovación, utilidad e impacto.

El proyecto tiene como objetivo ser una guía para otras instituciones que deseen publicar sus datos en abierto, así como también adoptar las últimas tendencias promovidas por instituciones referentes en el ámbito de las bibliotecas como la IFLA y la OCLC. Además, los resultados de este proyecto son utilizados como material docente en la Universidad de Alicante.

Acceso al catálogo

El catálogo tiene disponible diferentes puntos de acceso:

El buscador proporciona una interfaz web para realizar búsquedas a partir de una cadena de texto.
El punto de acceso SPARQL para realizar consultas. La BVMC dispone de un tutorial introductorio SPARQL y un conjunto de ejemplos de consultas para reutilizar el catálogo.

Acceso a los recursos

data.cervantesvirtual.com muestra información estructurada en diferentes páginas:

Páginas de autor: todas las obras de un autor, así como el rol (impresor, creador, ilustrador…) en cada una de ellas. Ejemplo: Lope de Vega.
Páginas de obras: toda la información de las obras. Ejemplo: Cervantes o La casa encantada.
Páginas de idiomas: todas las obras publicadas en un idioma en concreto. Ejemplo: Español.
Páginas de fechas: todas las obras publicadas en una fecha, así como los autores nacidos y fallecidos en dicha fecha. Ejemplo: 1562.

Enriquecimiento con Wikidata

Wikidata es un entorno de edición colaborativa que puede ser editado por cualquier usuario. El sitio web data.cervantesvirtual.com se ha enriquecido con dos propiedades de Wikidata:

BVMC work ID (P3976): enlaza obras del catálogo a partir de las obras.
BVMC person ID (P2799): enlaza autores del catálogo.

Los registros se han enriquecido a través de peticiones SPARQL que recuperan información adicional de Wikidata como se puede observar en el autor Miguel de Cervantes. La ficha de autor ha sido enriquecida automáticamente con campos adicionales de metadatos e imagen, gracias a las propiedades de Wikidata que enlazan al catálogo de la BVMC.

Calidad de los datos generados

La calidad del repositorio LOD data.cervantesvirtual.com se ha evaluado mediante diferentes técnicas. Los resultados de la evaluación, junto a la de otros repositorios se han publicado como artículo de investigación en la revista Journal of Information Science con el título "Evaluating the quality of linked open data in digital libraries" que se encuentra disponible en su versión preprint en el repositorio RUA de la Universidad de Alicante.

Además de la validación a través de consultas SPARQL, es posible utilizar lenguajes para validar y describir conjuntos de datos RDF como Shape Expressions (ShEx). En el artículo "A Shape Expression approach for assessing the quality of Linked Open Data in Libraries" publicado en la revista Semantic Web Journal se incluyen ejemplos basados en varias colecciones de datos de Linked Open Data como la Biblioteca Británica, la Biblioteca Nacional Francesa y la Biblioteca Nacional de Finlandia. Los ejemplos se pueden consultar y ejecutar sin necesidad de instalar ningún software desde GitHub y la herramienta ShEx2 — Simple Online Validator. Más información disponible en el siguiente enlace.

Referencias

Candela, G., Escobar, P., Carrasco, R. y Marco-Such, M. (2020). Evaluating the quality of linked open data in digital libraries. Journal of Information Science. https://doi.org/10.1177/0165551520930951
Candela, G., Escobar, P., Carrasco, R. y Marco-Such, M. (28-29 de octubre de 2019). Evaluating the quality of linked open data in digital libraries. WikidataCon. Berlín, Alemania. https://www.wikidata.org/wiki/Wikidata:WikidataCon_2019/Program/Sessions/Libraries_panel
Candela, G., Escobar, P., Carrasco, R. y Marco-Such, M. (2019). A linked open data framework to enhance the discoverability and impact of culture heritage. Journal of Information Science, 45(6), 756-766. https://doi.org/10.1177/0165551518812658
Candela, G., Escobar, P., Carrasco, R. y Marco-Such, M. (2018). Migration of a Library Catalogue into RDA Linked Open Data. Semantic Web Journal, 9(4), 481-491. http://dx.doi.org/10.3233/SW-170274 [Versión preprint]
Candela, G., Escobar, P. y Marco-Such, M. (2017). Semantic Enrichment on Cultural Heritage collections: A case study using geographic information. En Apostolos Antonacopoulos, M. B. (ed.), Proceedings of the 2nd International Conference on Digital Access to Textual Cultural Heritage, DATeCH 2017, Göttingen, Germany, June 1-2, 2017 (pp. 169-174). Association for Computing Machinery. https://doi.org/10.1145/3078081.3078090
Candela, G., Escobar, P., Sáez, M. y Marco-Such, M. (2021). A Shape Expression approach for assessing the quality of Linked Open Data in Libraries. Semantic Web Journal. http://doi.org/10.5281/zenodo.4732774 [Versión preprint]
Escobar, P., Candela, G., Carrasco, R. y Marco-Such, M. (28-29 de octubre de 2017). Improving access to Culture Heritage: data.cervantesvirtual.com. WikidataCon. Berlín, Alemania. https://www.wikidata.org/wiki/Wikidata:WikidataCon_2017/Submissions/Improving_access_to_Culture_Heritage:_data.cervantesvirtual.com

Enlaces adicionales

Abián, D., Candela, G. Birkholz, J., Sáez, M., Escobar, P., Chambers, S., Martínez-Sempere, I. y Berna-Martinez, J. (2019). Wikidata/Wikibase Workshops: Lessons Learned. En WikidataCon 2019, Abstracts. Berlín, Alemania. http://hdl.handle.net/1854/LU-8633763
Candela, G., Escobar, P., Sáez, M. y Marco-Such, M. (24 de febrero de 2018). Datatón Cervantes. Wikidata Events. Wikimedia España, Biblioteca Virtual Miguel de Cervantes y Centro de Competencia IMPACT. https://www.wikidata.org/wiki/Wikidata:Events/Madrid/2018-02-24
Candela, G., Sáez, M. y Escobar, P. (2020). Introducción a Wikidata y a la Biblioteca Virtual Miguel de Cervantes. Wikimedia España. https://es.wikipedia.org/wiki/Wikipedia:Encuentros/Sesiones_en_l%C3%ADnea_WMES_2020/Sesi%C3%B3n_7
Padilla, T., Allen, L., Frost, H., Potvin, S., Russey, E. y Varner, S. (2019). Already Computational: Collections as Data (Version 1): Final Report. Zenodo. https://doi.org/10.5281/zenodo.3152935
Smith-Yoshimura, K. (2020). Transitioning to the Next Generation of Metadata. OCLC Research. https://doi.org/10.25333/rqgd-b343