Discovering emerging topics in textual corpora of galleries, libraries, archives, and museums institutions
07/10/2021El uso y publicación de colecciones de datos (en inglés, Collections as Data) que faciliten el acceso computacional incluye corpus de textos basados en periódicos y revistas.
Este artículo, publicado en la revista Journal of the Association for Information Science and Technology, propone una metodología para identificar términos emergentes en colecciones digitales publicaciones por instituciones de patrimonio cultural. La metodología se ha aplicado a varias colecciones de datos entre las que se incluyen Doxa, DBLP computer science bibliography y UK Doctoral Thesis Metadata from EThOS de la Biblioteca Británica. Además, se incluye una colección de Jupyter notebooks disponbile en Zenodo que muestra cómo reutilizas las colecciones digitales de forma innovadora y creativa.
Referencias
- Candela, G. y Carrasco, R. C. (2021). Discovering emerging topics in textual corpora of galleries, libraries, archives, and museums institutions. Journal of the Association for Information Science and Technology, 1-14. https://doi.org/10.1002/asi.24583