Les regles de Chomsky en conflicte

1993/11/01 Alkizalete, A. Iturria: Elhuyar aldizkaria

Els ordinadors amb talent per a la gramàtica i la sintaxi estan qüestionant la teoria de Chomsky, la lingüística. Si els ordinadors poden aprendre per mitjà d'assaig/error, per què l'ésser humà no pot actuar igual?

D'on ve l'instint gramatical i sintàctic? Dels nostres pares o dels nostres gens? Dels nostres pares, per descomptat, deien els avioristas en les primeres dècades d'aquest segle.

Noam Chomsky, lingüista nord-americà, no obstant això, tenia idees diferents i en 1950 va atacar a l'aviorismo. Segons ell, totes les llengües, malgrat tenir variacions succintes, tenen un conjunt comú de regles gramaticals que els nens no poden adquirir només escoltant als seus pares. Portem en els nostres gens elements fonamentals del llenguatge.

En l'actualitat, després de dècades, la seva teoria està en discussió per la influència d'una generació d'investigadors. Simulant per ordinador el processament d'informació complexa en el cervell, aquests investigadors comencen a investigar el que està darrere de les normes de Chomsky. I el missatge que ve d'alguns aspectes és clar: la teoria de la lingüística moderna pot arribar a decaure.

Noves connexions

Per a entendre el debat cal analitzar detalladament les idees de Chomsky. Les seves normes inclouen tots els aspectes del llenguatge, des de la sintaxi (noms, verbs, etc.). des de la manera de combinació fins a la fonologia (fins a la manera de combinar fonemes i sons de la llengua).

Per què la teoria de Chomsky ha tingut tant de reconeixement? La raó principal és que aquesta teoria expliqui la “producció” de la llengua; en altres paraules, la capacitat de comprendre i produir frases que mai hem completat abans. Chomsky va insistir que la persona que ha adquirit un finit repertori de regles del llenguatge pot comprendre i crear un nombre infinit de frases.

El repte contrari prové d'una escola de pensament dins de la neurociència, el connexionisme. Segons això, les funcions mentals, l'aprenentatge i el coneixement, per exemple, tenen la seva arrel en la forma en què les neurones estan interconnectades i comunicades en el cervell. Aquesta escola ha disparat també la mentalitat de relació entre intel·ligència i cervell. El debat, acompanyat de xarxes neuronals simulades per ordinador, ha arribat avui al món de la lingüística. La idea principal és que el cervell processa la informació utilitzant xarxes neuronals.

Les cèl·lules nervioses que es “parlen” entre si funcionen transmetent polsos elèctrics a través dels “cables” anomenats axons. Encara que el cervell està dividit en zones, cadascuna d'elles processa la informació de manera similar. Aquesta és almenys la teoria. Si tenim en compte l'anatomia, sembla que la majoria de les xarxes cerebrals són molt compactes. Una neurona rep senyals de centenars de milers de neurones. Això pot afectar el nivell de la seva activitat elèctrica i, per tant, als senyals que passa a altres neurones.

Reforçant missatge

Neurones cerebrals. Els conexionistas simulen un model molt simplificat d'aquesta xarxa.

Un dels principis bàsics del connexionisme és que moltes de les xarxes neuronals cerebrals, o la majoria, sofreixen petits canvis relacionats amb la formació. Per a la neurofisiologia aquests canvis es produeixen en les sinapsis neuronals. L'experiència que incorporem excitant a certs subconjunts neuronals amb major freqüència que uns altres pot reforçar selectivament algunes sinapsis, fent que l'aparició de certs models d'activitat elèctrica sigui més probable que uns altres. Aquests models poden ser la base de l'aprenentatge i la memòria.

Els conexionistas estan treballant en la creació de xarxes neuronals artificials i molt simplificades que funcionen de manera similar a com funciona el cervell real. En l'actualitat aquestes xarxes no són més que una petita part de la “grandària” del cervell real, i estan molt simplificades comparant les característiques de les neurones artificials amb les reals. No obstant això, l'estudi de les xarxes neuronals artificials ha començat a suggerir alternatives per a moltes teories psicològiques.

Com aquest plantejament ens pot ajudar a comprendre els processos lingüístics? Al voltant de l'any 1985, dos psicòlegs de la universitat californiana poden respondre a una xarxa neuronal formada per Rumelhart i McClelland. Aquests només van analitzar una petita part de la llengua.

L'explicació de Chomsky reconeix que en el cas de l'anglès tenim un conjunt de regles per a aplicar inconscientment al present i crear el passat. En anglès, es formen afegint “-ed” als verbs regulars i altres 180 en els verbs mitjançant l'aplicació de les denominades “normes d'excepció”. Aquesta divisió de verbs en regulars i irregulars és la idea principal en la teoria de Chomsky. Sense tenir en compte aquests dos grups normatius, als nens els seria impossible crear temps verbals del passat. La xarxa de Rumelhart i McClelland és capaç de construir passades de verbs regulars i irregulars sense utilitzar aquestes regles i sense haver de tractar de diferent manera verbs regulars i irregulars.

Cal destacar la simplicitat de la xarxa: Consisteix a connectar 460 unitats de “entrada” en paral·lel amb 460 unitats de “sortida”. Cadascuna d'aquestes unitats (la neurona de la xarxa) pot quedar connectada o no connectada. Les arrels verbals es poden programar en unitats input. Aquests envien senyals a les unitats output a través de connexions en les quals les formes de pas estan codificades. Cada unitat d'output rep senyals de molts inputs, alguns d'ells activaran i inhibiran. La combinació de tots aquests inputs “decidirà” si s'activarà o no una unitat output.

Com pot aprendre gramàtica un mecanisme d'aquestes característiques? Rumelhart i McClelland van descobrir que la xarxa pot entrenar-se per a completar les passades del verb. Aquesta formació consisteix a mostrar a la xarxa les formes presents i passades d'un determinat nombre de verbs. Després de presentar una paraula, la xarxa ha de trobar la forma adequada de la passada. La falta de correspondència entre l'output de la xarxa i la forma correcta del verb proporcionarà la base per a la formació de la xarxa, aprenent l'algorisme denominat “expansió cap endarrere de l'error”.

Aquest algorisme té dos nivells. En primer lloc, es programa com a exemple un verb en les unitats input, des de les quals s'envien senyals a les unitats output. En segon lloc, es compara el temps verbal de la passada proporcionat per les unitats output amb la forma correcta donada per un “professor”. Els pesos entre connexions canvien de manera que s'asseguri que l'output estigui més prop de ser correcte quan es presenta novament l'input.

McClelland i Rumelhart consideren que aquest procés d'ensenyament imita el feedback que reben els nens en aprendre el seu passat.

El problema amb la teoria de Chomsky és que la xarxa no utilitza normes lingüístiques. Aprenent les formes verbals, compara les seves connexions segons les correlacions que detecta entre les formes input i output. Per exemple, la correlació que detecta entre els terminos “-ow” i “-ew” assegura que les unitats input amb “-ow” estan en estreta connexió amb les unitats output que representen “-ew”.

A pesar que no hi ha regles i que el tractament dels verbs regulars i irregulars és el mateix, després d'un llarg període de temps la xarxa pot donar la forma correcta de la passada. L'amenaça més seriosa contra Chomsky deriva del tractament correcte dels verbs irregulars no familiars. Després d'entrenar per a “wept” “weep”, “clung” per a “cling”, etc. pot donar.

Ha sorgit un intens debat entre investigadors com Steven Pinker i membres de l'Institut Tecnològic de Massachusetts. Per a ells, encara és necessari un sistema basat en normes que permeti aprendre algunes característiques de les formes del passat. Ells han proposat un model d'aprenentatge “híbrid”. En aquest sistema les xarxes neuronals es limiten a recopilar informació sobre verbs irregulars i els verbs regulars es tracten amb regles especials.

Pinker prefereix aquest sistema híbrid per molts motius. En primer lloc, diu que el model de les xarxes neuronals és inapropiat perquè exclou el significat dels verbs. Per exemple, la passada del verb “lie” en frases com “dir una cosa falsa” és “lied”, però prenent “lie” en sentit “tombar-se” és “lay”. El model tractaria totes dues formes per igual, ja que la fonologia és la mateixa en tots dos casos.

En segon lloc, Pinker afirma que la gent tracta de manera diferent verbs regulars i irregulars com en el sistema híbrid. Per exemple, Pinker ha descobert que la freqüència en la qual apareix un verb en el llenguatge afecta al mateix temps que necessitem per a crear la forma del passat, però només si el verb és irregular. Per això, les formes de verbs irregulars simples com “go” es produeixen molt més ràpid que els verbs com “shrink”, però no hi ha diferències d'aquest tipus entre verbs regulars. Els conexionistas investiguen si troben xarxes neuronals més sofisticades per a veure si els descobriments de Pinker es poden imitar sense recórrer a les regles lingüístiques.

Coneixement congènit

Si s'aconseguís un èxit en aquest camí, es reforçaria el plantejament contrari a la teoria que defensa que tenim un ventall de normes en el cervell. El debat és l'última manifestació del vell debat entre els empírics, l'enfocament que tot el coneixement s'ha après, i els racionalistes, que diuen que ja tenim part del nostre coneixement en néixer.

La teoria de Chomsky sobre l'espontaneïtat de la llengua va ser assumida pel racionalisme. En definitiva, encara que el nen senti un nombre limitat de frases, adquireix la capacitat de crear infinites frases gramaticalment correctes. Un psicòleg diria que hi ha pobresa d'estímul. Els nens saben, per exemple, que molts verbs poden convertir-se en passius en anglès. Sembla que, generalitzant, l'aplicació de la regla a tots els verbs seria raonable. Això, per descomptat, donaria frases no gramaticals. Però no hi ha raons òbvies perquè els nens no aprenguin aquesta regla general. Si algunes construccions lingüístiques poden generalitzar-se, per què no totes?

La resposta de Chomsky a aquesta pregunta és que els nens nounats tenen uns mecanismes propis que els porten a aprendre gramàtica correctament. Dit d'una altra manera, en l'adquisició del llenguatge existeixen certs components genètics. La millor manera de demostrar-ho és trobar gent amb alteracions lingüístiques. Per això, hi ha molts lingüistes interessats a analitzar les alteracions lingüístiques d'una família londinenca (16 de cada 30) sobre l'herència. Poden entendre el llenguatge i produir paraules sense problemes, però cometen errors.

Laboratori d'idiomes

Aquesta alteració lingüística hereditària suggereix que pot estar associada a un gen simple. Els genetistes han d'identificar aquest gen, però en estar la recerca en primera fase, la majoria dels investigadors temen treure conclusions.

Ha adoptat ja les normes lingüístiques des de la seva creació o les interioritza des de la relació amb els pares i la interacció amb els altres?

Entre els escèptics destaquen els deixebles de connexionisme. Com hem vist anteriorment, el que defensen és la teoria que els nens aprenen a partir de la llengua pura, i els fan inconscientment adaptant les connexions de les xarxes neuronals en els seus cervells. Un altre dels experiments en aquest camp ha estat realitzat per un investigador d'idiomes de la universitat californiana, Jeffrey Elman, que ha desenvolupat una xarxa neuronal diferent.

La xarxa construïda per Elman pot aprendre una sintaxi senzilla. A diferència de les xarxes de Rumelhart i McClelland, la formada per Elman pot aprendre les relacions entre models inputs consecutius. Aprèn la seqüència contínua de paraules (separada per breus interrupcions) i compon frases gramaticals com “John feeds dogs”. Quan es presenta cada paraula, la xarxa intenta esbrinar quina serà la següent paraula com a output. Pot “recordar” les paraules anteriors a la frase, ja que la representació interna d'aquestes paraules, que són unitats que s'activen en uns models especials, es reposen contínuament a la circulació. Recircular les paraules “velles” afecta a la interpretació que fa la xarxa de qualsevol paraula “nova”.

En un experiment la següent paraula que la xarxa podia inventar-se era el nom o verb i després triar una de les seleccions restringides que tenia a la seva disposició. Una vegada fet això, podia canviar el pes de les seves connexions per a millorar la possible connexió entre la paraula predicida i la paraula correcta.

A mesura que avançava la formació, la xarxa era cada vegada millor per a predir la categoria de la següent paraula, indicant que havia après la relació entre noms singulars i verbs singulars.

També va aprendre detalls gramaticals. Elman va estudiar que els noms i els verbs estaven classificats en categories gramaticals. Fins i tot va classificar els verbs en transitius i intransitivos. La xarxa no va rebre informació directa sobre aquestes categories. Va deduir per inducció tenint en compte les estadístiques de l'input.

El que la xarxa d'Elman posa en evidència és que el coneixement gramatical del nen en lloc d'estar basat en normes, podria estar basat únicament en la informació estitística sobre la relació entre diferents tipus de paraules.

D'una banda, la discussió entre Chomsky i els seguidors i els usuaris de xarxes neuronals per un altre està encara en marxa. Sens dubte, en la mesura en què les xarxes neuronals construïdes estiguin més prop de la realitat, el debat també serà més elaborat i precís. Però ja el connexionisme empeny a alguns lingüistes a replantejar idees sobre l'adquisició de la llengua.

Gai honi buruzko eduki gehiago

Elhuyarrek garatutako teknologia