}

As regras de Chomsky en conflito

1993/11/01 Alkizalete, A. Iturria: Elhuyar aldizkaria

Os computadores con talento paira a gramática e a sintaxe están a cuestionar a teoría de Chomsky, a lingüística. Si os computadores poden aprender por medio de ensaio/erro, por que o ser humano non pode actuar igual?

De onde vén o instinto gramatical e sintáctico? Dos nosos pais ou dos nosos xenes? Dos nosos pais, por suposto, dicían os avioristas nas primeiras décadas deste século.

Noam Chomsky, lingüista norteamericano, con todo, tiña ideas diferentes e en 1950 atacou ao aviorismo. Segundo el, todas as linguas, a pesar de ter variacións someras, teñen un conxunto común de regras gramaticales que os nenos non poden adquirir só escoitando aos seus pais. Levamos nos nosos xenes elementos fundamentais da linguaxe.

Na actualidade, tras décadas, a súa teoría está en discusión pola influencia dunha xeración de investigadores. Simulando por computador o procesamiento de información complexa no cerebro, estes investigadores comezan a investigar o que está detrás das normas de Chomsky. E a mensaxe que vén dalgúns aspectos é claro: a teoría da lingüística moderna pode chegar a decaer.

Novas conexións

Paira entender o debate hai que analizar en detalle as ideas de Chomsky. As súas normas inclúen todos os aspectos da linguaxe, desde a sintaxe (nomes, verbos, etc.). desde o modo de combinación até a fonología (até o modo de combinar fonemas e sons da lingua).

Por que a teoría de Chomsky tivo tanto recoñecemento? A razón principal é que esta teoría explique a “produción” da lingua; noutras palabras, a capacidade de comprender e producir frases que nunca completamos antes. Chomsky insistiu en que a persoa que adquiriu un finito repertorio de regras da linguaxe pode comprender e crear un número infinito de frases.

O reto contrario provén dunha escola de pensamento dentro da neurociencia, o conexionismo. Segundo isto, as funcións mentais, a aprendizaxe e o coñecemento, por exemplo, teñen a súa raíz na forma en que as neuronas están interconectadas e comunicadas no cerebro. Esta escola disparou tamén a mentalidade de relación entre intelixencia e cerebro. O debate, acompañado de redes neuronais simuladas por computador, chegou hoxe ao mundo da lingüística. A idea principal é que o cerebro procesa a información utilizando redes neuronais.

As células nerviosas que se falan” entre si funcionan transmitindo pulsos eléctricos a través dos “cables” chamados axones. Aínda que o cerebro está dividido en zonas, cada una delas procesa a información de forma similar. Esa é polo menos a teoría. Se temos en conta a anatomía, parece que a maioría das redes cerebrais son moi compactas. Una neurona recibe sinais de centos de miles de neuronas. Isto pode afectar o nivel da súa actividade eléctrica e, por tanto, aos sinais que pasa a outras neuronas.

Reforzando mensaxe

Neuronas cerebrais. Os conexionistas simulan un modelo moi simplificado desta rede.

Uno dos principios básicos do conexionismo é que moitas das redes neuronais cerebrais, ou a maioría, sofren pequenos cambios relacionados coa formación. Paira a neurofisiología estes cambios prodúcense nas sinapsis neuronais. A experiencia que incorporamos excitando a certos subconjuntos neuronais con maior frecuencia que outros pode reforzar selectivamente algunhas sinapsis, facendo que a aparición de certos modelos de actividade eléctrica sexa máis probable que outros. Devanditos modelos poden ser a base da aprendizaxe e a memoria.

Os conexionistas están a traballar na creación de redes neuronais artificiais e moi simplificadas que funcionan de maneira similar a como funciona o cerebro real. Na actualidade estas redes non son máis que una pequena parte do “tamaño” do cerebro real, e están moi simplificadas comparando as características das neuronas artificiais coas reais. Con todo, o estudo das redes neuronais artificiais empezou a suxerir alternativas paira moitas teorías psicolóxicas.

Como esta formulación nos pode axudar a comprender os procesos lingüísticos? Ao redor do ano 1985, dous psicólogos da universidade californiana poden responder a unha rede neuronal formada por Rumelhart e McClelland. Estes só analizaron una pequena parte da lingua.

A explicación de Chomsky recoñece que no caso do inglés temos un conxunto de regras paira aplicar inconscientemente ao presente e crear o pasado. En inglés, fórmanse engadindo “-ed” aos verbos regulares e outros 180 nos verbos mediante a aplicación das denominadas “normas de excepción”. Esta división de verbos en regulares e irregulares é a idea principal na teoría de Chomsky. Sen ter en conta estes dous grupos normativos, aos nenos seríalles imposible crear tempos verbais do pasado. A rede de Rumelhart e McClelland é capaz de construír pasadas de verbos regulares e irregulares sen utilizar estas regras e sen ter que tratar de diferente maneira verbos regulares e irregulares.

Cabe destacar a simplicidad da rede: Consiste en conectar 460 unidades de “entrada” en paralelo con 460 unidades de “saída”. Cada una destas unidades (a neurona da rede) pode quedar conectada ou non conectada. As raíces verbais pódense programar en unidades input. Estes envían sinais ás unidades output a través de conexións nas que as formas de paso están codificadas. Cada unidade de output recibe sinais de moitos inputs, algúns deles activarán e inhibirán. A combinación de todos estes inputs “decidirá” si activarase ou non una unidade output.

Como pode aprender gramática un mecanismo destas características? Rumelhart e McClelland descubriron que a rede pode adestrarse paira completar as pasadas do verbo. Esta formación consiste en mostrar á rede as formas presentes e pasadas dun determinado número de verbos. Tras presentar una palabra, a rede debe atopar a forma adecuada da pasada. A falta de correspondencia entre o output da rede e a forma correcta do verbo proporcionará a base paira a formación da rede, aprendendo o algoritmo denominado “expansión cara atrás do erro”.

Este algoritmo ten dous niveis. En primeiro lugar, programar como exemplo un verbo nas unidades input, desde as cales se envían sinais ás unidades output. En segundo lugar, compárase o tempo verbal da pasada proporcionado polas unidades output coa forma correcta dada por un “profesor”. Os pesos entre conexións cambian de forma que se asegure que o output estea máis preto de ser correcto cando se presenta novamente o input.

McClelland e Rumelhart consideran que este proceso de ensino imita o feedback que reciben os nenos ao aprender o seu pasado.

O problema coa teoría de Chomsky é que a rede non utiliza normas lingüísticas. Aprendendo as formas verbais, compara as súas conexións segundo as correlacións que detecta entre as formas input e output. Por exemplo, a correlación que detecta entre os terminos “-ow” e “-ew” asegura que as unidades input con “-ow” están en estreita conexión coas unidades output que representan “-ew”.

A pesar de que non hai regras e de que o tratamento dos verbos regulares e irregulares é o mesmo, tras un longo período de tempo a rede pode dar a forma correcta da pasada. A ameaza máis seria contra Chomsky deriva do tratamento correcto dos verbos irregulares non familiares. Despois de adestrar paira “wept” “weep”, “clung” paira “cling”, etc. pode dar.

Xurdiu un intenso debate entre investigadores como Steven Pinker e membros do Instituto Tecnolóxico de Massachusetts. Paira eles, aínda é necesario un sistema baseado en normas que permita aprender algunhas características das formas do pasado. Eles propuxeron un modelo de aprendizaxe “híbrido”. Neste sistema as redes neuronais limítanse a recompilar información sobre verbos irregulares e os verbos regulares trátanse con regras especiais.

Pinker prefire este sistema híbrido por moitos motivos. En primeiro lugar, di que o modelo das redes neuronais é inapropiado porque exclúe o significado dos verbos. Por exemplo, a pasada do verbo “lie” en frases como “dicir algo falso” é “lied”, pero tomando “lie” en sentido “tombarse” é “lay”. O modelo trataría ambas as formas por igual, xa que a fonología é a mesma en ambos os casos.

En segundo lugar, Pinker afirma que a xente trata de forma diferente verbos regulares e irregulares como no sistema híbrido. Por exemplo, Pinker descubriu que a frecuencia na que aparece un verbo na linguaxe afecta á vez que necesitamos paira crear a forma do pasado, pero só se o verbo é irregular. Por iso, as formas de verbos irregulares simples como “go” prodúcense moito máis rápido que os verbos como “shrink”, pero non hai diferenzas deste tipo entre verbos regulares. Os conexionistas investigan si atopan redes neuronais máis sofisticadas paira ver se os descubrimentos de Pinker pódense imitar sen recorrer ás regras lingüísticas.

Coñecemento congénito

Se se lograse un éxito neste camiño, reforzaríase a formulación contraria á teoría que defende que temos un abanico de normas no cerebro. O debate é a última manifestación do vello debate entre os empíricos, o enfoque de que todo o coñecemento aprendeuse, e os racionalistas, que din que xa temos parte do noso coñecemento ao nacer.

A teoría de Chomsky sobre a espontaneidade da lingua foi asumida polo racionalismo. En definitiva, aínda que o neno ouza un número limitado de frases, adquire a capacidade de crear infinitas frases gramaticalmente correctas. Un psicólogo diría que hai pobreza de estímulo. Os nenos saben, por exemplo, que moitos verbos poden converterse en pasivos en inglés. Parece que, xeneralizando, a aplicación da regra a todos os verbos sería razoable. Isto, por suposto, daría frases non gramaticales. Pero non hai razóns obvias para que os nenos non aprendan esta regra xeral. Se algunhas construcións lingüísticas poden xeneralizarse, por que non todas?

A resposta de Chomsky a esta pregunta é que os nenos recentemente nados teñen uns mecanismos propios que lles levan a aprender gramática correctamente. Dito doutro xeito, na adquisición da linguaxe existen certos compoñentes xenéticos. A mellor maneira de demostralo é atopar xente con alteracións lingüísticas. Por iso, hai moitos lingüistas interesados en analizar as alteracións lingüísticas dunha familia londiniense (16 de cada 30) sobre a herdanza. Poden entender a linguaxe e producir palabras sen problemas, pero cometen erros.

Laboratorio de idiomas

Esta alteración lingüística hereditaria suxire que pode estar asociada a un xene simple. Os genetistas teñen que identificar este xene, pero ao estar a investigación en primeira fase, a maioría dos investigadores temen sacar conclusións.

Adoptou xa as normas lingüísticas desde a súa creación ou as interioriza desde a relación cos pais e a interacción cos demais?

Entre os escépticos destacan os discípulos de conexionismo. Como vimos anteriormente, o que defenden é a teoría de que os nenos aprenden a partir da lingua pura, e fanos inconscientemente adaptando as conexións das redes neuronais nos seus cerebros. Outro dos experimentos neste campo foi realizado por un investigador de idiomas da universidade californiana, Jeffrey Elman, que desenvolveu una rede neuronal diferente.

A rede construída por Elman pode aprender una sintaxe sinxela. A diferenza das redes de Rumelhart e McClelland, a formada por Elman pode aprender as relacións entre modelos inputs consecutivos. Aprende a secuencia continua de palabras (separada por breves interrupcións) e compón frases gramaticales como “John feeds dogs”. Cando se presenta cada palabra, a rede tenta pescudar cal será a seguinte palabra como output. Pode “lembrar” as palabras anteriores á frase, xa que a representación interna destas palabras, que son unidades que se activan nuns modelos especiais, reponse continuamente á circulación. Recircular as palabras “vellas” afecta á interpretación que fai a rede de calquera palabra “nova”.

Nun experimento a seguinte palabra que a rede podía inventarse era o nome ou verbo e despois escoller una das seleccións restrinxidas que tiña á súa disposición. Una vez feito isto, podía cambiar o peso das súas conexións paira mellorar a posible conexión entre a palabra predicida e a palabra correcta.

A medida que avanzaba a formación, a rede era cada vez mellor paira predicir a categoría da seguinte palabra, indicando que aprendera a relación entre nomes singulares e verbos singulares.

Tamén aprendeu detalles gramaticales. Elman estudou que os nomes e os verbos estaban clasificados en categorías gramaticales. Mesmo clasificou os verbos en transitivos e intransitivos. A rede non recibiu información directa sobre estas categorías. Deduciu por indución tendo en conta as estatísticas do input.

O que a rede de Elman pon en evidencia é que o coñecemento gramatical do neno en lugar de estar baseado en normas, podería estar baseado unicamente na información estitística sobre a relación entre distintos tipos de palabras.

Por unha banda, a discusión entre Chomsky e os seguidores e os usuarios de redes neuronais por outro está aínda en marcha. Sen dúbida, na medida en que as redes neuronais construídas estean máis preto da realidade, o debate tamén será máis elaborado e preciso. Pero xa o conexionismo empuxa a algúns lingüistas a reformular ideas sobre a adquisición da lingua.

Gai honi buruzko eduki gehiago

Elhuyarrek garatutako teknologia