Euskaltzaindia presentó en marzo Euskararen Erreferentzia Corpusa (ECC), empezado hace 4 años, proyecto “de referencia para reunir pormenores concretos y equilibrados de la lengua, recogiendo muestras de diferentes ámbitos, dando un reflejo del euskera actual”. Es ”abierto y colectivo”, esta primera versión se nutre de 123.124 documentos y 154,21 millones de palabras de textos de 2000 a 2023, de 68 entidades privadas y públicas, medios de comunicación y agentes sociales. Servirá para “análisis lingüístico, aprendizaje automático o lingüística".
|
etiquetas: euskaltzaindia , euskera , euskara , corpus lingüístico , ecc , texto , palabra , ia
Más info:
- Euskaltzaindia ("Real Academia de la Lengua Vasca"): www.euskaltzaindia.eus/en/ ; es.wikipedia.org/wiki/Real_Academia_de_la_Lengua_Vasca
- Euskaltzaindia (Nota de prensa de sobre el nuevo corpus: "Euskaltzaindia presenta un corpus del euskera referencial, equilibrado y de calidad"):… » ver todo el comentario
En general, Hemeroteca yo lo usuaría más bien para "mira lo que decía este político en 2019" y cosas así. Para das zascas, básicamente
Es intereante el envío, a ver si hay suerte.