Tecnoloxías lingüísticas de Elhuyar: Procuras multilingües
2012/09/01 Leturia Azkarate, Igor - Informatikaria eta ikertzaileaElhuyar Hizkuntza eta Teknologia Iturria: Elhuyar aldizkaria
Hai dous anos, en leste mesmo apartado desta revista, presentámosvos a evolución dos buscadores de Internet e as súas novas capacidades futuras. Mencionabamos entón que no departamento de I+D das tecnoloxías lingüísticas de Elhuyar estaba a investigarse sobre técnicas paira navegar e buscar mellor en contidos multilingües. Estas tecnoloxías xa son realidade e aquí explicaremos con máis detalle que son e paira que son útiles.
Elezkari, buscador multilingüe
As persoas que temos o costume de falar en eúscaro na rede teñen dous problemas principais cando queremos buscar contido. Un, cando queremos buscar o contido en eúscaro: se o que buscamos é un nome especial, técnico, ou curto, hai moitas opcións paira dicir o mesmo noutras linguas, e aparecerannos resultados noutras linguas en lugar de en eúscaro. O outro, cando buscamos contido sobre algo, si é posible en eúscaro pero non é posible noutro: a primeira procura farase en eúscaro; se non atopamos resultados adecuados (lamentablemente o que pode suceder a miúdo, porque o contido en eúscaro non é tan abundante como nos gustaría), buscaremos noutro idioma que se adapte ben, como o castelán ou o francés, traducindo os termos de procura (cousa que a miúdo non é fácil); e si non quedamos a gusto volvendo a inglés.
Paira evitalo desenvolvemos a tecnoloxía denominada Elezkari. Nela, nós realizaremos una única procura en eúscaro, que se encargará de traducir as palabras a outros idiomas e de buscar nos lugares onde se vaia a buscar, paira logo traducir os resultados máis significativos no idioma no que se atopen.
O punto forte da ferramenta é a tradución de termos de procura. Combina dicionarios e tecnoloxías lingüísticas paira dar una tradución adecuada, e isto non é un tema baladí: resólvense as ambigüidades paira atopar una remuneración adecuada, recórrese aos sinónimos paira obter máis resultados pero rexeitando os resultados non desexados... A ferramenta é moi útil en moitos casos: páxinas web con contido en varios idiomas, portais especializados que queren permitir a procura en varias webs, intranets de empresas, etc. E aínda que no exemplo de uso mencionado anteriormente o idioma inicial era o eúscaro, pode ser calquera outro. Ademais, una posible difusión da ferramenta pode ser a tradución á lingua de partida dos resultados noutras linguas a través da tradución automática, tecnoloxía que tamén traballamos. Elezkari está á altura de ferramentas similares existentes, pero é a única que ten en conta o eúscaro.
Dokusare, relacionador documental multilingüe
Nas versións online dos medios de comunicación, blogs e webs cun gran contido é moi habitual que, estando nunha determinada noticia ou artigo, preséntense ao final enlaces a contidos similares que permitan profundar no tema. Estes enlaces colócanse por métodos automáticos, pero normalmente son de contido propio e están no mesmo idioma, polo que son moi simples, baseados na mera coincidencia de palabras.
A tecnoloxía dokusare fai o mesmo, pero é capaz de relacionar o contido que hai en varios idiomas e buscar o máis parecido. Poden facelo os medios de comunicación e as páxinas web que teñan contido en máis dunha lingua, ou aqueles que queiran mostrar contido relacionado en páxinas externas.
Ambas as en Zientzia.net
Dokusare e Elezkari naceron como proxectos de investigación e durante anos estivemos investigando neles e presentando avances en congresos internacionais, pero son tecnoloxías que funcionan na actualidade. Puxéronse en marcha por primeira vez na web Zientzia.net da Fundación Elhuyar. Zientzia.net ten vocación de ser o portal da ciencia en eúscaro, polo que non limita ao contido interno enlácelos a contidos como o seu buscador. Tamén contempla o contido de varias webs internacionais de referencia sobre ciencia en ambos os casos: Nature, Science , Physics World, Futurity... Así, ademais dos contidos propios de Zientzia.net, podemos acceder e buscar o contido destas webs, sempre partindo do eúscaro.
Dokusare e Elezkari son excelentes exemplos do que as tecnoloxías lingüísticas poden achegar. Estas tecnoloxías supoñen un gran avance paira os usuarios e o eúscaro. Por tanto, esperamos que no futuro estas tecnoloxías véxanse en máis sitios e que este tipo de tecnoloxías fáganse cotiás.
Gai honi buruzko eduki gehiago
Elhuyarrek garatutako teknologia