La Fundació Elhuyar posa CorpEus en línia

2007/10/01 Lopez Viña, Rakel - Marketin sailaElhuyar Fundazioa

El grup d'I+D de la Fundació Elhuyar, en col·laboració amb el grup IXA de la Facultat d'Informàtica de la UPV, ha posat on-line el servei CorpEus. CorpEus permet consultar Internet com un corpus gegant en basc. Realitza una cerca per mitjà del lema de la paraula (o paraules) introduïda entre les pàgines en basca d'Internet, mostrant en el seu context totes les aparicions de la paraula continguda en aquestes pàgines, juntament amb gràfics per diferents dades.
Els resultats del sistema CorpEus tenen aquest aspecte. Resultat de la cerca corresponent a la paraula anorèxia en l'exemple.

CorpEus es va presentar en el congrés internacional WAC3 (Web as Corpus) celebrat en Louvain-la Neuve (Bèlgica) els dies 15 i 16 de setembre i ha tingut un gran acolliment. Les característiques de l'eina han estat molt interessants per a la resta dels assistents i van comentar que la metodologia utilitzada pot ser d'utilitat per a altres llengües.

Els copuss són molt importants en totes les llengües: elaboració de diccionaris, regulació de la pròpia llengua, ajuda a les traduccions, desenvolupament de tecnologies lingüístiques... En definitiva, els corpus ens proporcionen informació sobre els usos reals de les paraules: si una paraula s'ha utilitzat més que una altra, com es va declinar o escriu habitualment, amb quines paraules es combina...

CorpEus està en línia en http://www.corpeus.org. Més informació en la presentació i en la pàgina d'ajuda. A més, en el número de juliol de la revista Elhuyar Zientzia eta Teknika publiquem un article sobre CorpEus.