WikidataCon evento

Conferencia WikidataCon 2017

El próximo 28 y 29 de octubre tendrá lugar la conferencia WikidataCon en Berlín. El evento está destinado a la comunidad de Wikidata y por ello se entiende a los usuarios que editan Wikidata, que realizan sentencias SPARQL, que crean aplicaciones reutilizando datos abiertos,…El objetivo fundamental es celebrar el quinto aniversario de Wikitada compartiendo ideas y experiencias de éxito desde el inicio del proyecto.

El idioma del evento será inglés puesto que es una conferencia internacional pero existe la posibilidad de solicitar una pequeña reunión en un idioma determinado.

En cuanto al programa, todavía se está decidiendo y el envío de propuestas está abierto hasta el 31 de julio. La Fundación de la Biblioteca Virtual Miguel de Cervantes ya ha realizado el envío de una propuesta de una charla para presentar el catálogo de datos enlazados data.cervantesvirtual.com y las nuevas funcionalidades incorporadas recientemente. Si tenéis pensado acudir al evento y os parece interesante nuestra charla tenéis la posibilidad de añadir vuestro nombre a la presentación en el apartado Interested attendees.

La información detallada del congreso la podéis encontrar en el siguiente enlace.

Os animo a que participéis en WikidataCon!

 

linked-open-data-bvmc

¿Sabes cómo usar la base de datos Wikidata?

Wikidata, una base de datos libre y colaborativa

Wikidata entró en nuestras vidas recientemente y se le augura un futuro prometedor para el procesamiento automático de información. En este artículo presentamos cómo podemos utilizar Wikidata en nuestra organización para beneficiarnos de su contenido. Según la definición de su web, Wikidata es un proyecto de la Fundación Wikimedia: una base de datos secundaria libre, colaborativa y multilingüe, que recopila datos estructurados para dar soporte a Wikipedia, Wikimedia Commons, a los otros proyectos Wikimedia y mucho más.Wikidata logo

¿Qué quiere decir esta definición? La palabra clave es estructurada, hecho que permite que la información sea reutilizada por terceras partes, ya sea usuarios, instituciones como la Fundación de la Biblioteca Virtual Miguel de Cervantes y, lo más importante, procesadores que pueden entender esa información estructurada. Otro punto muy relevante es el hecho de que sea colaborativa, lo que quiere decir que se enriquece con voluntarios que desean incorporar sus contenidos al repositorio.

Como forma novedosa y diferente a otras aproximaciones, la información se almacena en tripletas RDF (Sujeto- predicado-objeto, por ejemplo “Gustavo conoce a Pilar”) y se puede ver directamente desde la vista de cada página. En el siguiente ejemplo podemos observar cómo se estructura la información en una página de Wikidata, concretamente la página de Miguel de Cervantes. En primer lugar podemos ver el título y el identificador. A continuación observamos las tripletas que contienen información estructurada sobre el registro como puede ser la imagen, el género, la fecha de nacimiento y muerte, lugar de nacimiento, influencias, obras, etc. Las tripletas permiten almacenar cualquier tipo de información de forma genérica y el valor de cada una de ellas viene dado por la propiedad que se está editando en ese momento.

Miguel-de-Cervantes-Wikidata-Ejemplo

Finalmente llegamos a un apartado denominado identificadores que permite enlazar el registro con otros repositorios. Este apartado es muy importante para el concepto de Linked Open Data. Si nos fijamos bien, vemos una propiedad que se llama BVMC Person id que almacena identificadores de autores de la Biblioteca Virtual Miguel de Cervantes, en concreto el autor Miguel de Cervantes en nuestro catálogo de Linked Open Data.

Miguel de Cervantes - identificadores- Wikidata

Si nos fijamos en la imagen anterior, se puede observar una propiedad BVMC person id que tiene valor 40. ¿Qué significa esta información? Bien, aquí viene el truco, BVMC person id es una propiedad de Wikidata que identifica autores en la Biblioteca Virtual Miguel de Cervantes y el valor 40 (http://data.cervantesvirtual.com/person/40) corresponde al identificador del autor Miguel de Cervantes. De esta forma, los datos de la BVMC y de Wikidata quedan enlazados para poder reutilizar la información.

Para poder crear una propiedad en Wikidata es necesario solicitar su creación. Para ello existe un protocolo que los usuarios deben seguir. En primer lugar, se debe buscar si existe una propiedad que sea similar para evitar redundancias, os adjunto el enlace. En caso de no existir, entonces debemos proceder con el protocolo establecido. Lo primero es rellenar la ficha de solicitud. Una vez rellenada la solicitud, los administradores de Wikidata se compromenten a en una semana darnos una respuesta. Podréis observar que los administradores introducirán comentarios en la solicitud, a modo de aprobación o negación por diversos motivos. Os dejo una solicitud reciente de la BVMC. Finalmente, si se acepta la propiedad tendrá un aspecto como el ejemplo de identificadores de autores.

Una vez creada la propiedad, cualquier usuario puede proceder a introducir valores. Desde cualquier entidad de Wikidata al pulsar el botón “add” en la zona inferior, nos aparecerá un autocompletado desde el cual podemos añadir la propiedad y el valor. Es importante resaltar que si se introducen valores incorrectos, probablemente serán rechazados ya que los administradores de Wikidata están muy atentos a cualquier uso incorrecto de su plataforma. Además, existen formas para la inserción masiva de datos en Wikidata, pero todavía se encuentran en versiones iniciales y no he podido adentrarme demasiado.

wikidata-anadir-propiedad
wikidata-añadir-propiedad

Una vez hemos realizado todo el proceso, una de las primeras ventajas que podemos observar si accedemos a la entrada de la Wikipedia del autor Miguel de Cervantes, es que en el apartado de Control de autoridades aparecerá un enlace a nuestra web. Como podéis imaginar esto es una fuente muy rica de visitas para nuestra web y para mejorar el posicionamiento. Evidentemente, esta no es la mejor forma de explotar esa información pero al menos es un detalle que nos puede encaminar a introducir nuestros identificadores en Wikidata. No es de extrañar que en breve existan otras formas más interesantes y vistosas para el usuario de explotar esa información.

wikipedia-control-de-autoridades
wikipedia-control-de-autoridades

¿Cómo se accede a los datos en Wikidata?

Wikidata ofrece un interfaz online para realizar consultas en SPARQL. Si deseamos trabajar con nuestra propiedad de identificadores de autor, tendremos que usar el espacio de nombres correcto (wdt) y el identificador de la propiedad que lo podemos obtener de la URL (https://www.wikidata.org/wiki/Property:P2799). Os muestro un ejemplo de sentencia que obtiene los enlaces de Wikidata a nuestro catálogo de datos enlazados.

PREFIX wdt: <http://www.wikidata.org/prop/direct/>
select *
where {?item wdt:P2799 ?BVMCauthor}

wikidata-sparql-ejemplo
wikidata-sparql-ejemplo

 

Espero que os haya gustado esta entrada y os animo a que participéis en Wikidata!

¿Sabrías montar una arquitectura para una biblioteca digital?

Arquitectura

Si te interesa cómo funciona una biblioteca digital en cuanto a tecnología, a continuación describimos la arquitectura que utilizamos en la Biblioteca Virtual Miguel de Cervantes.

Para el desarrollo e implementación de la nueva arquitectura de la BVMC, se ha optado por SOA como metodología y guía de trabajo basada en estándares e interoperabilidad con el objetivo de mejorar los tiempos de respuesta, minimizar los costes de desarrollo, facilitar la reutilización de los componentes y la interacción con diferentes sistemas.

arquitectura-bvmc
Arquitectura BVMC

La integración de SOA se ha realizado en el servidor de aplicaciones Jboss que combina una arquitectura orientada a servicios con una licencia de código abierto. Entre las ventajas que proporciona un servidor de aplicaciones de estas características se encuentran el funcionamiento en cluster que proporciona una alta disponibilidad, la escalabilidad y el mantenimiento, así como la disminución de la complejidad del desarrollo de software dando soporte a diferentes tecnologías de forma transparente.

En su parte externa, un conjunto de servicios web implementados en J2EE se comunica con los clientes mediante JSON como formato ligero de intercambio de información, dando soporte a las necesidades de los usuarios.

La arquitectura se ha implementado en un modelo multicapa, donde la capa de acceso a datos es capaz de mantener la independencia del tipo de origen de datos y la transparencia hacia las capas más altas de la arquitectura. La capa de negocio contiene la lógica de la aplicación y proporciona los componentes necesarios para proveer servicios de búsqueda y recuperación de información. Basada en componentes distribuidos (EJB), que dotan al desarrollador de un modelo que le permite abstraerse de los problemas de concurrencia, transacciones, persistencia o seguridad, para centrarse en el desarrollo de la lógica de negocio en sí.

La capa de negocio da servicio tanto al sistema de catalogación como a la capa de servicios web y presentación. Por último, la capa de servicios pone a disposición de los usuarios y aplicaciones las funcionalidades ofrecidas por la BVMC en forma de servicios web.

BVMC 3.0

Actualmente, la BVMC dispone de una representación semántica de sus obras y autores en RDF basada entre otras en la norma internacional RDA. Se ha construido un nuevo concepto de catálogo orientado a web semántica, buscando facilitar el acceso a la información, compartir, reutilizar, enlazar y ser enlazados desde otros repositorios en la red.

En la siguiente imagen se puede observar como el repositorio de la BVMC enlaza y es enlazado desde otros repositorios reconocidos internacionalmente como Wikidata, DBpedia, Geonames, Europeana, VIAF o ISNI entre otros.

linked-open-data-bvmc
Datos enlazados en la BVMC

Mediante la conexión con estos repositorios se consigue enriquecer y dar visibilidad al catálogo tradicional. Por ejemplo, Geonames es una gran base de datos geográfica que alberga información sobre países y contiene más de ocho millones de nombres de lugares. Permite ofrecer al usuario información completa, por ejemplo, del lugar de publicación original de una obra o situar ese lugar en un mapa, sin necesidad de tener almacenado todos los datos en el catálogo de la BVMC ya que es posible enlazar en tiempo real a otros repositorios para obtener esa información y combinarla con la catalogada en la biblioteca.

Europeana es una biblioteca digital que integra fondos de bibliotecas, archivos y museos de diferentes bibliotecas europeas, entre las que se encuentran la British Library, la Gallica (Biblioteca Nacional de Francia) y la Biblioteca Nacional de España. Además intenta apoyar diferentes iniciativas en el campo de las bibliotecas digitales. Actualmente la BVMC ya dispone de un importante volumen de obras en Europeana.

Referencias

  • Gustavo Candela Romero, Maria Pilar Escobar Esteban, Manuel Marco Such, Rafael C. Carrasco. Transformation of a Library Catalogue into RDA Linked Open Data. TPDL 2015: 321-325

  • Gustavo Candela Romero, Maria Pilar Escobar Esteban, Manuel Marco Such, Rafael C. Carrasco. Migration of a library catalogue into RDA linked open data. Semantic Web Journal 2017. Online

  • Stanford Prize for Innovation in Research Libraries (SPIRL). Online