}

A maxia límites da tradución automática

2014/01/01 Cortés Etxabe, Itziar - Elhuyarreko itzulpengintza-teknologien arduraduna Iturria: Elhuyar aldizkaria

Ed. Stockmonkeys.com/CC-BY

Por definición, a tradución automática é un sistema informático que traduce dun idioma a outro, sen a intervención humana durante o proceso de tradución. Esta tradución, que se produce automaticamente, pode utilizarse como medio de comprensión ou tradución de textos, o que pode ser debido á confusión frecuente entre sistemas de tradución automática e dicionarios. Pero ambos os recursos teñen diferenzas. Por exemplo, os resultados que obtemos ao realizar procuras nos dicionarios foron elaborados manualmente por profesionais. En cambio, nos sistemas de tradución automática, aínda que os datos que se utilizan como base son elaborados por profesionais, a resposta sempre a xera a propia máquina, que se xera automaticamente. Con todo, a principal diferenza desde o punto de vista dos usuarios comúns é que os sistemas de tradución automática poden traducir frases completas ou palabras.

Entre os sistemas de tradución automática máis coñecidos atópase Google Translator. Este sistema permite traducir de forma automática até 70 idiomas, entre os que se atopa o eúscaro desde 2010. Pero por que salguen traducións curiosas neste tipo de sistemas?

Cando viaxamos por Internet, é bastante habitual atopar a información que buscamos noutro idioma e utilizar un sistema de tradución automática paira comprender dita información. Por iso, o usuario debe coñecer as vantaxes e inconvenientes do uso da tradución automática. Un sistema deste tipo non sempre proporciona una tradución exacta e está a disposición do usuario de que facer con esa tradución obtida automaticamente. Os resultados obtidos de forma automática foron vistos na publicidade e noutros carteis.

Algúns exemplos coñecidos son: "Autobuses, mañá e tarde", en eúscaro "Autobuses mañá e tarde"; "Combinación de trens", "Subcomisión de trens"; e "Primeira planta", "Primeira planta".

No mesmo mes de xaneiro, Google mesturaba os sistemas de tradución automática de Guardiola e Iniesta cos seus países de orixe, ben coñecidos no mundo do fútbol, na tradución do catalán ao inglés. Pero, por que xorden de forma automática este tipo de traducións?

Os sistemas de tradución automática pódense clasificar en dous grupos en función das técnicas utilizadas paira a súa creación: sistemas baseados na estatística e sistemas baseados en regras.

O Google Translate antes mencionado é un dos sistemas de tradución automática baseados na estatística máis coñecidos. Este tipo de sistemas baséanse en modelos estatísticos que se xeran a partir da utilización de coleccións de textos. Por exemplo, se queremos crear un sistema entre o eúscaro e o castelán, deberemos basearnos nunha colección de textos do tipo: cada frase en eúscaro deberá ser traducida ao castelán. A partir destas coleccións de textos créanse uns modelos estatísticos que serán o núcleo do sistema de tradución automática.

Na unidade Elhuyar de Lingua e Tecnoloxía tamén dispomos deste tipo de sistemas, e este ano estamos a implantar un sistema deste tipo no MINHAP (Ministerio de Facenda e Administracións Públicas de España). As páxinas web utilizarán este sistema paira traducir do castelán ao eúscaro e ao inglés, e revisarán os resultados obtidos automaticamente mediante un repaso manual.

Pola contra, os sistemas baseados en regras teñen una base lingüística, é dicir, baséanse en dicionarios e en recursos como as regras relacionadas coa lingua. Aínda que habitualmente ofrecen resultados máis razoables que os estatísticos, este tipo de sistemas tamén presenta dificultades e resultados raros. As palabras polisémicas, por exemplo, dan bastante traballo á hora de volver. Tomemos, por exemplo, a palabra "tempo" en castelán, con doce acepcións en eúscaro (hiztegiak.elhuyar.org/é/tempo): tempo, tempo...; hai que ensinar ao sistema de tradución automática a elixir cal das acepcións é máis adecuada.

Matxin é un exemplo dun sistema que traduce automaticamente do castelán ao eúscaro a partir das regras.O sistema Matxin (http://matxin.elhuyar.org) foi desenvolvido conxuntamente por Elhuyar Hizkuntza eta Teknologia e o grupo Ixa da UPV/EHU e, ademais de traducir o mero texto, serve paira traducir documentos e páxinas web de diferentes formatos. Con todo, tal e como se mencionou anteriormente, cando utilizamos a tradución automática, non debemos esquecer que os resultados xerados automaticamente deben ser revisados.

Paira ver a diferenza entre sistemas de base estatística e lingüística, velaquí un par de exemplos. Por exemplo, Google Traslat traduce a frase "O home que veu era o meu tío" da seguinte maneira: "O home veu o meu tío" e Matxin 2.0: "O home que veu era o meu tío". Doutra banda, Google Translat devolve a frase "Dixeron que mañá vai facer bo tempo" e Matxin 2.0, "Dixeron que mañá vai facer bo tempo".

Cando falamos de tradución automática, hai quen nos mira con receo. Con todo, comprender o tema pode cambiar o enfoque da utilización deste recurso. Ao dicir que a tradución se realiza automaticamente, non queremos dicir que o resultado sexa una tradución directa, é dicir, una tradución profesional. O que queremos transmitir é que ofrecerá un resultado xerado automaticamente, que transforma un texto dunha lingua elixida por nós a outra distinta. Se se solicitase una opinión sobre os sistemas de tradución automática, obteriamos, loxicamente, respostas en función do usuario que estea a utilizar o sistema. Por tanto, o uso consciente deste tipo de recursos é imprescindible.

Gai honi buruzko eduki gehiago

Elhuyarrek garatutako teknologia