DARIAH Annual Event 2023 y la BVMC

19/05/2023

La Biblioteca Virtual Miguel de Cervantes (BVMC) asistirá al congreso DARIAH Annual Event 2023 en Budapest los días 6 al 9 de Junio. El programa se encuentra disponible en el siguiente enlace.

La participación de la BVMC en el evento incluye la presentación del trabajo realizado a través del centro de competencia en digitalización Impact sobre el futuro y desafíos para las instituciones de patrimonio cultural.

Además, se presentará un póster sobre etiquetado y enriquecimiento de textos basado en las obras de la BVMC que se ha realizado en colaboración con estudiantes del Máster de Estudios Literarios de la Universidad de Alicante. Una selección de textos editados en TEI-XML se han enriquecido a través de la base de conocimiento Wikidata con enlaces de eventos, lugares deidades y seres mitológicos. El objetivo es entrenar un modelo de reconocimiento de entidades nombras en el texto (Named-Entity Recognition, en inglés) con la librería de procesamiento del lenguaje natural Spacy. La siguiente figura muestra los pasos a seguir para crear el modelo.

Frameowrk-NER-BVMC

En total, se han anotado 8 obras creando alrededor de 500 enlaces a Wikidata. Gracias al enriquecimiento, es posible crear visualizaciones a partir de las localizaciones incluidas en una obra como por ejemplo el Burlador de Sevilla de Tirso de Molina:

El estudio se ampliará con la anotación de más obras y la creación de una colección de Jupyter Notebooks que permitan la reproducibilidad de los resultados. El póster presentado en el evento se encuentra disponible en el siguiente enlace. El conjunto de datos generado como resultado del proyecto se encuentra disponible para su reutilización así como el código generado como ejemplo. Este trabajo ha sido realizado en colaboración con la red INTELE.

 

poster DARIAH annual event 2023 BVMC

Referencias