Andy Way: "El major repte de la traducció automàtica és la qualitat"
Andy Way: "El major repte de la traducció automàtica és la qualitat"

És cert. I en gran manera la traducció automàtica es va desenvolupar també per motius polítics. En un temps els estatunidencs volien saber què deien els russos, per exemple. I en l'actualitat, els Estats Units inverteix molt a desenvolupar la traducció automàtica de l'àrab. En aquest sentit és una qüestió relacionada amb la seguretat.
Un altre nivell de comunicació és la comunicació entre dues persones. Per exemple, la comunicació entre nosaltres seria molt més senzilla, quan jo estic a Dublín i tu aquí a Euskal Herria, si tu escrivint-me a mi en basca i jo la rebés en anglès a través d'un sistema de traducció automàtica. Jo et respondria en anglès i tu ho reculls en basc.
I és que no importa si l'anglès no és correcte, jo ho entenc. I la clau és aquí, per a un anglès que no sap basc és millor un anglès dolent que el basc correcte, i per contra, per a un basc que no sap anglès és millor un euskara dolent que l'anglès més directe. En aquest nivell el més important és rebre el missatge principal.
Per tant, el marc de creixement de la traducció automàtica es basa en l'individu. Que dues persones que no parlen el mateix idioma puguin comunicar-se entre si.
Sens dubte. En Internet hi ha sistemes gratuïts com Babel Fish. No són sistemes molt sofisticats, però la gent es comunica en el seu idioma gràcies a ells. Com hem dit, són devaldos i no és necessari inscriure's en cap lloc. I cada dia s'utilitzen milions de vegades, encara que la qualitat no sigui molt bona. Per tant, si milloren la qualitat d'aquests sistemes, el seu ús serà molt major.
A Europa s'ha produït un gran canvi. En la dècada dels 80 només nou eren les llengües oficials de la Unió Europea, i ara són més de vint. I en els ulls de la Unió totes aquestes llengües són iguals. Per tant, han de traduir els documents a totes aquestes llengües, i hi ha al voltant de 400 parelles lingüístiques.

Prenguem el llautó i el grec. Quants traductors són capaços de traduir entre totes dues llengües? Molt no. Per tant, no hi ha suficients traductors i tenen molts textos per a traduir. Perquè la traducció automàtica és molt útil per a aquests traductors.
A la Unió Europea disposen d'un sistema de traducció automàtica, denominat SYSTRAN, especialment dissenyat per a ús domèstic. No és el mateix sistema SYSTRAN que està a la venda a les botigues, sinó que el van dissenyar i van adaptar per al seu ús intern i ho utilitzen per a elaborar un primer esborrany de traducció. Posteriorment, els traductors han d'editar-ho i corregir-ho. Perquè un document per a enviar a clients o públic ha de ser sense errors.
Al cap i a la fi s'utilitzen màquines, la qual cosa té el seu costat positiu: Poden treballar 24 hores i els traductors no. L'avantatge d'aquestes eines és que poden treballar molt més ràpid, però amb menys qualitat.
Per tant, la gent no hauria de veure el treball del traductor humà com una activitat que ve a substituir; és com qualsevol altre instrument, com el telèfon, el torrador o el cotxe. És una eina que ens ajuda.
Sí, entre altres coses, estem en contacte amb la Universitat del País Basc. Aquests treballen amb les parelles anglès-euskara i espanyol-euskara. I a poc a poc anem sumant més parelles lingüístiques. Així, ens relacionem amb grups que treballen amb diferents llengües, com l'àrab, el xinès, l'italià, el francès, l'alemany, el castellà, i ara també el basc.
D'altra banda, tenim un alumne treballant la traducció entre l'anglès i la llengua de signes d'Irlanda per a entorns concrets, com els aeroports. De fet, en els aeroports no posen tota la informació escrita en les pantalles. Les últimes convocatòries d'embarqui i avisos similars només s'emeten des dels altaveus i els sords no senten. Perquè estem treballant en aquesta mena d'entorns.
Si es redueix l'àmbit d'aplicació, independentment del parell d'idiomes, la traducció és molt més senzilla. Així, si ens limitem a l'àmbit de l'aeroport, la majoria dels problemes que es presenten en traduccions més generals estan superats.
La majoria dels investigadors que actualment treballen en traducció automàtica es dediquen a la traducció automàtica basada en corpus (una recopilació de textos i documents). Per tant, es necessita un corpus; sobretot es necessita un corpus paral·lel, és a dir, a aquesta frase li correspon aquesta altra frase en l'altre idioma. I hi ha un gran corpus paral·lel per a algunes llengües amb molts parlants. Si està entre l'anglès i el francès, com les actes del Parlament canadenc, i per al xinès anglès, les del Parlament d'Hong Kong.

Les tècniques de traducció automàtica que s'utilitzen en l'actualitat són vàlides en principi per a qualsevol parella lingüística, però en general falten corpus paral·lels per a llengües minoritàries. En les llengües amb molts parlants tenim molt més text i més traduccions, en castellà, anglès, francès... Aquest és el major problema de les llengües minoritàries. Per exemple, per a traduir entre el gaèlic i el basc no disposem de textos paral·lels. I això és una gran dificultat.
El major desafiament, sens dubte, és la qualitat, ja que en general encara no és molt bo; i, per descomptat, com acabem d'esmentar, per a determinats paris de llengües no es pot aproximar mitjançant corpus, perquè mancada corpus. Per tant, un dels problemes per a la traducció està en el primer pas: en transferir els recursos existents.
Crec que un dels grans reptes de la traducció automàtica és arribar a les llars de la gent. De fet, en la universitat normalment tractem de resoldre problemes molt difícils, però hi ha solucions relativament senzilles que poden ajudar en la vida quotidiana de la gent, com el llenguatge de signes.
I la gent del carrer té clar que la traducció automàtica és necessària i molt útil. Altres problemes de lingüística computacional són molt difícils de comprendre. Però qualsevol sap què és la traducció i què és un ordinador, i que la traducció automàtica facilita la comunicació i, per tant, és necessària.
En veure que la conversa estava a punt d'acabar, Andy Way va voler afegir alguna cosa: "Al principi hem parlat de comunicació. Jo crec que la traducció de la parla aviat vindrà. D'aquí a uns anys, tu em faràs preguntes en el teu idioma, en basc, i jo les escolto en anglès. Per tant, utilitzarem el coneixement de la parla (speech recognition) i tu m'escoltaràs en basca a través del teu ordinador. Això serà ràpid, i suposarà un gran avanç, ja que la parla és molt més natural que la comunicació escrita".
Buletina
Bidali zure helbide elektronikoa eta jaso asteroko buletina zure sarrera-ontzian