Andy Way: "El major repte de la traducció automàtica és la qualitat"

Els anglesos tenen fama de ser una mica tancats en temes lingüístics, esperen que vagin a qualsevol lloc del món i es comuniquin en anglès. Andy Way està fora d'aquest grup. La idea de què tothom parli la mateixa llengua li sembla totalment encertada. Ens ha dit "good morning" i ens ha saludat amb un "bon dia", la resta de la conversa s'ha realitzat necessàriament en anglès. Per descomptat, no podem faltar les bromes sobre aquest tema: un sistema de traducció automàtica d'anglès i basc ens facilitaria molt la relació. Després, entrem en el nucli de la conversa.

Andy Way: "El major repte de la traducció automàtica és la qualitat"


Expert en traducció automàtica
Andy Way: "El major repte de la traducció automàtica és la qualitat"
01/07/2007 | Rementeria Argote, Nagore | Elhuyar Zientzia Komunikazioa
Andy Way és professor de la Universitat de Dublín i referent en traducció automàtica.
N. Ferreria
Anem a l'origen de la traducció automàtica. Per descomptat, es crearia per a comunicar gent de diferents idiomes.

És cert. I en gran manera la traducció automàtica es va desenvolupar també per motius polítics. En un temps els estatunidencs volien saber què deien els russos, per exemple. I en l'actualitat, els Estats Units inverteix molt a desenvolupar la traducció automàtica de l'àrab. En aquest sentit és una qüestió relacionada amb la seguretat.

Un altre nivell de comunicació és la comunicació entre dues persones. Per exemple, la comunicació entre nosaltres seria molt més senzilla, quan jo estic a Dublín i tu aquí a Euskal Herria, si tu escrivint-me a mi en basca i jo la rebés en anglès a través d'un sistema de traducció automàtica. Jo et respondria en anglès i tu ho reculls en basc.

I és que no importa si l'anglès no és correcte, jo ho entenc. I la clau és aquí, per a un anglès que no sap basc és millor un anglès dolent que el basc correcte, i per contra, per a un basc que no sap anglès és millor un euskara dolent que l'anglès més directe. En aquest nivell el més important és rebre el missatge principal.

Per tant, el marc de creixement de la traducció automàtica es basa en l'individu. Que dues persones que no parlen el mateix idioma puguin comunicar-se entre si.

Internet ha suposat una gran oportunitat en l'àmbit de la comunicació en general, també en la traducció automàtica?

Sens dubte. En Internet hi ha sistemes gratuïts com Babel Fish. No són sistemes molt sofisticats, però la gent es comunica en el seu idioma gràcies a ells. Com hem dit, són devaldos i no és necessari inscriure's en cap lloc. I cada dia s'utilitzen milions de vegades, encara que la qualitat no sigui molt bona. Per tant, si milloren la qualitat d'aquests sistemes, el seu ús serà molt major.

Quant a la qualitat, en l'altre extrem es troba la Unió Europea. He sentit dir que utilitzen molt eficaçment la traducció automàtica.

A Europa s'ha produït un gran canvi. En la dècada dels 80 només nou eren les llengües oficials de la Unió Europea, i ara són més de vint. I en els ulls de la Unió totes aquestes llengües són iguals. Per tant, han de traduir els documents a totes aquestes llengües, i hi ha al voltant de 400 parelles lingüístiques.

(Foto: N. Ferreria)

Prenguem el llautó i el grec. Quants traductors són capaços de traduir entre totes dues llengües? Molt no. Per tant, no hi ha suficients traductors i tenen molts textos per a traduir. Perquè la traducció automàtica és molt útil per a aquests traductors.

A la Unió Europea disposen d'un sistema de traducció automàtica, denominat SYSTRAN, especialment dissenyat per a ús domèstic. No és el mateix sistema SYSTRAN que està a la venda a les botigues, sinó que el van dissenyar i van adaptar per al seu ús intern i ho utilitzen per a elaborar un primer esborrany de traducció. Posteriorment, els traductors han d'editar-ho i corregir-ho. Perquè un document per a enviar a clients o públic ha de ser sense errors.

Al cap i a la fi s'utilitzen màquines, la qual cosa té el seu costat positiu: Poden treballar 24 hores i els traductors no. L'avantatge d'aquestes eines és que poden treballar molt més ràpid, però amb menys qualitat.

Per tant, la gent no hauria de veure el treball del traductor humà com una activitat que ve a substituir; és com qualsevol altre instrument, com el telèfon, el torrador o el cotxe. És una eina que ens ajuda.

Existeixen grups de recerca a tot el món que treballen per a millorar la traducció automàtica. Us convindria treballar amb altres grups, no?

Sí, entre altres coses, estem en contacte amb la Universitat del País Basc. Aquests treballen amb les parelles anglès-euskara i espanyol-euskara. I a poc a poc anem sumant més parelles lingüístiques. Així, ens relacionem amb grups que treballen amb diferents llengües, com l'àrab, el xinès, l'italià, el francès, l'alemany, el castellà, i ara també el basc.

D'altra banda, tenim un alumne treballant la traducció entre l'anglès i la llengua de signes d'Irlanda per a entorns concrets, com els aeroports. De fet, en els aeroports no posen tota la informació escrita en les pantalles. Les últimes convocatòries d'embarqui i avisos similars només s'emeten des dels altaveus i els sords no senten. Perquè estem treballant en aquesta mena d'entorns.

Si es redueix l'àmbit d'aplicació, independentment del parell d'idiomes, la traducció és molt més senzilla. Així, si ens limitem a l'àmbit de l'aeroport, la majoria dels problemes que es presenten en traduccions més generals estan superats.

Quant a la llengua, les llengües minoritàries presenten majors problemes. Quina diferència hi ha entre llengües amb molts parlants i amb pocs parlants?

La majoria dels investigadors que actualment treballen en traducció automàtica es dediquen a la traducció automàtica basada en corpus (una recopilació de textos i documents). Per tant, es necessita un corpus; sobretot es necessita un corpus paral·lel, és a dir, a aquesta frase li correspon aquesta altra frase en l'altre idioma. I hi ha un gran corpus paral·lel per a algunes llengües amb molts parlants. Si està entre l'anglès i el francès, com les actes del Parlament canadenc, i per al xinès anglès, les del Parlament d'Hong Kong.

Treballa amb el grup IXA de la Facultat d'Informàtica de la UPV, Eleka i Elhuyar Fundazioa, entre altres. En la imatge, Way amb el professor Kepa Sarasola de la UPV.
N. Ferreria
I per a la parella anglès-euskara? D'on aconseguir el corpus?

Les tècniques de traducció automàtica que s'utilitzen en l'actualitat són vàlides en principi per a qualsevol parella lingüística, però en general falten corpus paral·lels per a llengües minoritàries. En les llengües amb molts parlants tenim molt més text i més traduccions, en castellà, anglès, francès... Aquest és el major problema de les llengües minoritàries. Per exemple, per a traduir entre el gaèlic i el basc no disposem de textos paral·lels. I això és una gran dificultat.

Per tant, quin és el major repte de la traducció automàtica en l'actualitat?

El major desafiament, sens dubte, és la qualitat, ja que en general encara no és molt bo; i, per descomptat, com acabem d'esmentar, per a determinats paris de llengües no es pot aproximar mitjançant corpus, perquè mancada corpus. Per tant, un dels problemes per a la traducció està en el primer pas: en transferir els recursos existents.

Crec que un dels grans reptes de la traducció automàtica és arribar a les llars de la gent. De fet, en la universitat normalment tractem de resoldre problemes molt difícils, però hi ha solucions relativament senzilles que poden ajudar en la vida quotidiana de la gent, com el llenguatge de signes.

I la gent del carrer té clar que la traducció automàtica és necessària i molt útil. Altres problemes de lingüística computacional són molt difícils de comprendre. Però qualsevol sap què és la traducció i què és un ordinador, i que la traducció automàtica facilita la comunicació i, per tant, és necessària.

En veure que la conversa estava a punt d'acabar, Andy Way va voler afegir alguna cosa: "Al principi hem parlat de comunicació. Jo crec que la traducció de la parla aviat vindrà. D'aquí a uns anys, tu em faràs preguntes en el teu idioma, en basc, i jo les escolto en anglès. Per tant, utilitzarem el coneixement de la parla (speech recognition) i tu m'escoltaràs en basca a través del teu ordinador. Això serà ràpid, i suposarà un gran avanç, ja que la parla és molt més natural que la comunicació escrita".

Rementeria Argote, Nagore
Serveis
233
2007
Uns altres
028
Entrevistes; Informàtica; Programari
Entrevista
Serveis

Buletina

Bidali zure helbide elektronikoa eta jaso asteroko buletina zure sarrera-ontzian

Bidali

Bizitza