Welcome to data.cervantesvirutal.com Labs

Buscador geográfico de obras de literatura española

Buscador geográfico de obras de literatura española

El buscador geográfico permite realizar búsquedas en el catálogo general por localización. Como resultado se obtienen las obras publicadas en una cierta localización. Se ha utilizado Geonames como repositorio geográfico.

Análisis sintáctico automático

Análisis sintáctico automático

Un analizador sintáctico en computación linguística es un proceso que analiza secuencias de tokens para determinar su estructura gramatical. Este ejemplo de aplicación permite introducir un texto y realizar el análisis sintáctico de forma automática.

Resúmenes automáticos de obras de literatura española

Resúmenes automáticos de obras de literatura española

Con el objetivo de crear resúmenes de manera automática a partir de textos de las obras de la Bibliteca Virtual Miguel de Cervantes, se han seleccionado un conjunto de obras para realizar pruebas. El resumen se ha generado detectando las partes más relevantes del texto. La estrategia de extracción utiliza la frecuencia de las palabras o la posición en el texto para detectar los elementos más relevantes ya sean palabras o fragmentos.

Buscador con el que se pueden encontrar palabras españolas utilizadas a lo largo del tiempo

Buscador diacrónico

El corpus contiene 86 obras de la Bibliteca Virtual Miguel de Cervantes, publicadas entre 1482 y 1647. Cubre una gran variedad de autores y géneros (como prosa, teatro y verso). El corpus es una de las pocas colecciones de Español histórico de uso libre Los metadatos añadidos corresponde al lema (en su forma moderna), el discurso (part of speech) y su forma moderna equivalente. Los resultados del desarrollo y análisis de esta aplicación fueron presentados en el European Conference on Information Retrieval (ECIR) en 2015.

Corpus de Sonetos del Siglo de Oro (con anotación métrica)

Corpus de Sonetos del Siglo de Oro (con anotación métrica)

El corpus está formado por sonetos escritos en castellano entre los siglos XVI y XVII del catálogo de obras de la Bibliteca Virtual Miguel de Cervantes. Cada soneto ha sido anotado en XML siguiendo el estándar TEI. Además de encabezado e información estructural, cada soneto tiene representado formalmente los patrones métricos de cada verso.