Especificaciones

Documentos: 4059
Tokens: 2104264
Fuentes: La Nación, Diario Extra, CrHoy
Anotaciones: Clase de palabra (tagset), lema, morfología (tagset).
Anotado utilizando Spacy.
Recopilado 2018 por el Instituto de Investigaciones Lingüísticas de la Universidad de Costa Rica

Historial de cambios

1.3

Se agregó anotación morfológica.
Se cambió los nombres de las anotaciones a español.

1.2

Se agregó lemas a la anotación
Se agregó ejemplos de búsqueda
Se agregó aproximadamente 700.000 tokens al corpus.

1.1

Se agregó clase de palabra a la anotación.