La Fundación Elhuyar pone CorpEus on line

2007/10/01 Lopez Viña, Rakel - Marketin sailaElhuyar Fundazioa

El grupo de I+D de la Fundación Elhuyar, en colaboración con el grupo IXA de la Facultad de Informática de la UPV, ha puesto on-line el servicio CorpEus. CorpEus permite consultar Internet como un corpus gigante en euskera. Realiza una búsqueda por medio del lema de la palabra (o palabras) introducida entre las páginas en euskera de Internet, mostrando en su contexto todas las apariciones de la palabra contenida en dichas páginas, junto con gráficos por diferentes datos.
Los resultados del sistema CorpEus tienen este aspecto. Resultado de la búsqueda correspondiente a la palabra anorexia en el ejemplo.

CorpEus se presentó en el congreso internacional WAC3 (Web as Corpus) celebrado en Louvain-la Neuve (Bélgica) los días 15 y 16 de septiembre y ha tenido una gran acogida. Las características de la herramienta han sido muy interesantes para el resto de los asistentes y comentaron que la metodología utilizada puede ser de utilidad para otras lenguas.

Los copuss son muy importantes en todas las lenguas: elaboración de diccionarios, regulación de la propia lengua, ayuda a las traducciones, desarrollo de tecnologías lingüísticas... En definitiva, los corpus nos proporcionan información sobre los usos reales de las palabras: si una palabra se ha utilizado más que otra, cómo se declinó o escribe habitualmente, con qué palabras se combina...

CorpEus está en línea en http://www.corpeus.org. Más información en la presentación y en la página de ayuda. Además, en el número de julio de la revista Elhuyar Zientzia eta Teknika publicamos un artículo sobre CorpEus.