cultura y tecnología
8 meneos
13 clics
Euskaltzaindia presenta un corpus del euskera “de referencia, abierto y colectivo”

Euskaltzaindia presenta un corpus del euskera “de referencia, abierto y colectivo”

Euskaltzaindia presentó en marzo Euskararen Erreferentzia Corpusa (ECC), empezado hace 4 años, proyecto “de referencia para reunir pormenores concretos y equilibrados de la lengua, recogiendo muestras de diferentes ámbitos, dando un reflejo del euskera actual”. Es ”abierto y colectivo”, esta primera versión se nutre de 123.124 documentos y 154,21 millones de palabras de textos de 2000 a 2023, de 68 entidades privadas y públicas, medios de comunicación y agentes sociales. Servirá para “análisis lingüístico, aprendizaje automático o lingüística".

| etiquetas: euskaltzaindia , euskera , euskara , corpus lingüístico , ecc , texto , palabra , ia

menéame