A Fundación Elhuyar pon CorpEus en liña

2007/10/01 Lopez Viña, Rakel - Marketin sailaElhuyar Fundazioa

O grupo de I+D da Fundación Elhuyar, en colaboración co grupo IXA da Facultade de Informática da UPV, puxo on-line o servizo CorpEus. CorpEus permite consultar Internet como un corpus xigante en eúscaro. Realiza una procura por medio da lema da palabra (ou palabras) introducida entre as páxinas en eúscaro de Internet, mostrando no seu contexto todas as aparicións da palabra contida en devanditas páxinas, xunto con gráficos por diferentes datos.
Os resultados do sistema CorpEus teñen este aspecto. Resultado da procura correspondente á palabra anorexia no exemplo.

CorpEus presentouse no congreso internacional WAC3 (Web as Corpus) celebrado en Louvain-a Neuve (Bélxica) os días 15 e 16 de setembro e tivo una gran acollida. As características da ferramenta foron moi interesantes paira o resto dos asistentes e comentaron que a metodoloxía utilizada pode ser de utilidade paira outras linguas.

Os copuss son moi importantes en todas as linguas: elaboración de dicionarios, regulación da propia lingua, axuda ás traducións, desenvolvemento de tecnoloxías lingüísticas... En definitiva, os corpus proporciónannos información sobre os usos reais das palabras: se una palabra utilizouse máis que outra, como se declinou ou escribe habitualmente, con que palabras combínase...

CorpEus está en liña en http://www.corpeus.org. Máis información na presentación e na páxina de axuda. Ademais, no número de xullo da revista Elhuyar Zientzia eta Teknika publicamos un artigo sobre CorpEus.