An ontological approach for unlocking the Colonial Archive

23/05/2023

Las instituciones de patrimonio cultural han explorado nuevas formas para publicar sus colecciones en formato digital para facilitar su reutilización. Ejemplos de iniciativas que siguen este modelo son la International GLAM Labs Community y el proyecto Collections as Data.

En este trabajo realizado en colaboración con numerosos investigadores internacionales en el marco del proyecto Unlocking the Colonial Archive y publicado en la revista Journal on Computing and Cultural Heritage, se presenta un estudio para la extracción y transformación de la colección digital Relaciones Geográficas a un modelo semántico basado en el vocabulario European Data Model promovido por Europeana.

Para este estudio se han seleccionado 81 obras de la colección Relaciones Geográficas of Mexico and Guatemala a través de sus ficheros manifests en formato JSON. El conjunto de datos se ha transformado al formato RDF siguiendo las pautas del vocabulario EDM con la herramienta Open Refine. También se ha desarrollado un Jupyter Notebook que se puede ejecutar en la plataforma Binder para realizar consultas sobre el conjunto de datos mediante SPARQL.

El proceso de transformación a RDF funciona en cuatro pasos:

  • Identificación de recursos a través de sus manifest.json
  • Transformación a un fichero tabulado CSV
  • Modelado de datos RDF a través del vocabulario EDM con la herramienta OpenRefine
  • Enriquecimiento con repositorios externos como Wikidata y GeoNames

El código y descripción del proceso de transformación se encuentra disponible en GitHub.

Referencias

  • Gustavo Candela, Javier Pereda, Dolores Sáez, Pilar Escobar, Alexander Sánchez, Andrés Villa Torres, Albert A. Palacios, Kelly McDonough, and Patricia Murrieta-Flores. 2023. An ontological approach for unlocking the Colonial Archive. J. Comput. Cult. Herit. Just Accepted (April 2023). https://doi.org/10.1145/3594727