La Fondation Elhuyar met CorpEus en ligne

2007/10/01 Lopez Viña, Rakel - Marketin sailaElhuyar Fundazioa

Le groupe de R & D de la Fondation Elhuyar, en collaboration avec le groupe IXA de la Faculté d'Informatique de l'UPV, a mis en ligne le service CorpEus. CorpEus permet de consulter Internet comme un corpus géant en basque. Il effectue une recherche à travers la devise du mot (ou des mots) introduite entre les pages en basque d'Internet, montrant dans son contexte toutes les apparitions du mot contenu dans ces pages, avec des graphiques par différentes données.
Les résultats du système CorpEus ont cet aspect. Résultat de la recherche correspondant au mot anorexie dans l'exemple.

CorpEus a été présenté au congrès international WAC3 (Web as Corpus) qui s'est tenu à Louvain-la Neuve (Belgique) les 15 et 16 septembre et a eu un grand accueil. Les caractéristiques de l'outil ont été très intéressantes pour le reste des participants et ont commenté que la méthodologie utilisée peut être utile pour d'autres langues.

Les copuss sont très importants dans toutes les langues: élaboration de dictionnaires, régulation de leur langue, aide aux traductions, développement de technologies linguistiques... En bref, les corpus nous fournissent des informations sur les utilisations réelles des mots : si un mot a été utilisé plus qu'un autre, comment il s'est décliné ou écrit habituellement, avec quels mots...

CorpEus est en ligne sur http://www.corpeus.org. Plus d'informations sur la présentation et la page d'aide. En outre, dans le numéro de juillet de la revue Elhuyar Zientzia eta Teknika nous publions un article sur CorpEus.