“Si les màquines són capaces d'entendre a les persones, hem avançat molt. Les màquines vénen al nostre món”

L'objectiu d'Eneko és l'entesa entre màquines i éssers humans. Poder conversar. Els éssers humans, no obstant això, no som fàcils d'entendre, la qual cosa provoca grans maldecaps. Investigador informàtic de la UPV/EHU i membre del grup IXA, el seu treball va ser reconegut l'any passat per Google. Ara ens rep de Nova York.

“Si les màquines són capaces d'entendre a les persones, hem avançat molt. Les màquines vénen al nostre món”


Fa un any va rebre el premi Google Research. Què t'ha donat aquest premi?

Sobretot, el reconeixement del treball realitzat. És un senyal que la nostra recerca ha despertat interès i ens anima a continuar investigant. I el premi també dóna una mica de diners per a contractar a una persona.

Investigues perquè les màquines comprenguin el llenguatge humà. És tan difícil entendre'ns?

Quan utilitzem traductors automàtics, moltes vegades ens adonem del mal que han entès. Per exemple, a l'hora de tornar “Trens matí i tarda”, en lloc de “Trens matí i tarda”, pot fer “Trens matí i tarda”. Per què? Moltes vegades és perquè no ha entès de què parlem. Hi ha paraules que poden tenir més d'un significat i la màquina no sap quin triar en aquest cas.

De fet, la meva línia de recerca és aquesta, el processament del llenguatge, i dins d'ella té a veure amb la semàntica o significat, la semàntica computacional. Per a això, representem els significats de les paraules en un espai, com en un mapa. Posem paraules de diferents llengües, en el nostre cas anglès, basc i castellà, i en aquest mapa tenim marcats els punts que corresponen als seus significats. Per exemple, tenim una paraula: “banc”, que significa “caixa d'estalvis” en un punt del mapa, però també tenim el significat de “cadira” en un altre punt. Igual la paraula “demà” que pot ser “demà” o “demà”. Si nosaltres fem bé aquest mapa, després, quan la màquina comença a comprendre un text, podrà situar si aquest “banc” és per a asseure's o per a treure diners.

Com se serveix d'aquests mapes?

Analitza les distàncies entre punts. Si és capaç de col·locar qualsevol frase en el mapa, pot actuar amb distàncies per a conèixer el significat de la paraula en aquest cas. El context de la paraula l'aclarirà: sabrà en funció de les altres paraules de la frase quina paraula està prop del seu mapa, de la paraula “caixa” o “cadira”. Per exemple, si preguntem a la màquina: “Quin és el banc més solvent?”. “Solvència” significa “caixa d'estalvis”.

La recerca realitzada enguany després de l'obtenció del premi ha suposat avanços en el vostre camp?

Esperem que enguany es produeixin avanços importants a l'hora de plasmar els conceptes en el mapa. I hem avançat, però encara no hem aconseguit demostrar que aquests mapes que aconseguim són millors que les paraules. Però hem tingut millores en una altra cosa: ara som capaços de prendre mapes independents per a dues llengües i d'unificar tots dos mapes en un. És a dir, podem fer un bon mapa per al basc, un altre per al castellà i un altre per a l'anglès, i després posar els tres en el mateix espai. En això hem tingut bons resultats, ara fem millors mapes.

Ed. Jon Urbe /© Press de Fotos
A més de comprendre aquests termes multidimensionals, quines altres dificultats té actualment una màquina per a entendre a les persones?

Perquè en aquest mapa volem posar frases, no sols paraules. Aquí està el repte. És a dir, per a traduir correctament una frase, la màquina ha de comprendre bé la frase. Això és el que fem els éssers humans, en definitiva. Nosaltres no traduïm literalment. Primer hem d'entendre a què es refereix, el context i després comprenem el nucli de la frase. A la màquina li ocorre el contrari: és capaç d'entendre els fragments literalment, però després li costa molt ajuntar-los. Llavors, un repte actual és posar en el mapa el significat de frases completes. En rebre qualsevol frase, el sistema sabria on està en el mapa i ho entendria en funció d'això.

I altres característiques del nostre llenguatge fan difícil que les màquines ens entenguin? Per exemple, poden entendre l'humor o la ironia?

Si a més dels significats literals vols introduir els segons sentits en el mapa, és possible. La pròpia màquina aprèn moltes vegades significats de segon sentit. És sorprenent, però en aquest mapa, a més del seu significat intrínsec, treballa les connotacions. Per exemple, després d'haver estudiat molts textos, el metge aprèn que en la majoria dels casos són homes. O als Estats Units aprèn que sovint els lladres són negres. També estudia tòpics.

La comprensió humana de les màquines sembla un projecte d'enginyeria enorme. Per què invertir tant en aquesta tecnologia?

Hi ha un gran repte intel·lectual: si les màquines són capaces d'entendre a les persones, hem avançat molt. Les màquines vénen al nostre món, no? La seva comprensió és molt atractiva. L'objectiu és que totes les màquines tinguin més intel·ligència quan interactuin amb nosaltres perquè sàpiguen que quan et despertes vols que s'il·lumini o que s'encengui la ràdio…

Posar el coneixement que tenim els éssers humans en la manera d'entendre les màquines és un gran repte. Per descomptat, hi ha una raó pràctica: el món de la traducció automàtica mou milions i milions d'euros cada any a Europa.

És cert que la tecnologia del processament del llenguatge està condicionant en l'actualitat el progrés de la societat de la informació?

La veritat és que hi ha un dels principals reptes. Moltes vegades això es percep per l'interès de la indústria i avui dia tots els gegants del programari, Microsoft, Google, Facebook, IBM, estan treballant intensament en el processament del llenguatge. Jo crec que un gran pas endavant vindrà d'aquí.

Un altre gran repte és comprendre les imatges. Per exemple, si traguessis una foto com estem nosaltres, que la màquina comprengui que hi ha dues persones, que hi ha una taula, que hi ha un rellotge darrere de tu… Ja entenen algunes coses. Algunes escenes s'adapten bastant bé. Però en altres escenes estan completament perdudes.

Ed. Jon Urbe /© Press de Fotos
Per a què pot ser útil?

Pot ser útil, per exemple, en la domòtica. Si tens un sistema per a ajudar-te a casa, té dues maneres de saber el que està passant a casa: una és la veu i l'altra és la cambra. Si hi ha una cambra mirant a tu i sap el que està passant, sabrà també el que ha de fer: apagar la llum, encendre la llum, apagar el despertador si t'has aixecat abans… Veient el que estàs fent, pot saber què fer.

Això ja dota a la màquina de més capacitat. No es tracta de parlar sol, sinó d'entendre el que veu. Cada vegada estem més a prop. Les persones ens entenem perquè com estem veient el mateix parlem d'això. També és un recurs important per a les màquines.

Hi ha usos més preocupants: ara hi ha moltes cambres al carrer per a prevenir. Comproven si algú està fent alguna cosa estranya. Sense necessitat de mirar, la màquina encendria l'alarma automàticament.

Tornant al processament del llenguatge, si les llengües petites no volen quedar-se enrere, quin camí han de seguir?

Antigament es deia que una llengua quedaria enrere si no tenia un diccionari i una gramàtica darrere. La situació actual és similar: ara necessitem aquests diccionaris i aquestes gramàtiques per a les màquines.

Actualment tenim el basc com a opció per als mòbils. Però si Google ha inclòs el basc dins d'Android i els seus sistemes és perquè hi ha recursos per al basc. Aquests diccionaris són necessaris per a poder realitzar una anàlisi sintàctica o morfològica. Si una llengua no té recursos, si no té diccionaris i gramàtiques electròniques, corre el risc de quedar-se enrere. Les grans companyies no assumiran la creació d'aquests recursos.

En el nostre grup de recerca, el grup IXA, portem 25 anys treballant i des del principi parteix de la motivació era avançar en el procés lingüístic perquè el basc tingués recursos per a no quedar-se al marge i avançar al costat de les grans llengües.

En aquest moment, en el cas del basc, la situació és bastant bona. Hi ha llistes d'idiomes que especifiquen els recursos de cadascun d'ells, i el basc està entre els primers.

Buletina

Bidali zure helbide elektronikoa eta jaso asteroko buletina zure sarrera-ontzian

Bidali

Bizitza