}

Las reglas de Chomsky en conflicto

1993/11/01 Alkizalete, A. Iturria: Elhuyar aldizkaria

Los ordenadores con talento para la gramática y la sintaxis están cuestionando la teoría de Chomsky, la lingüística. Si los ordenadores pueden aprender por medio de ensayo/error, ¿por qué el ser humano no puede actuar igual?

¿De dónde viene el instinto gramatical y sintáctico? ¿De nuestros padres o de nuestros genes? De nuestros padres, por supuesto, decían los avioristas en las primeras décadas de este siglo.

Noam Chomsky, lingüista norteamericano, sin embargo, tenía ideas diferentes y en 1950 atacó al aviorismo. Según él, todas las lenguas, a pesar de tener variaciones someras, tienen un conjunto común de reglas gramaticales que los niños no pueden adquirir sólo escuchando a sus padres. Llevamos en nuestros genes elementos fundamentales del lenguaje.

En la actualidad, tras décadas, su teoría está en discusión por la influencia de una generación de investigadores. Simulando por ordenador el procesamiento de información compleja en el cerebro, estos investigadores comienzan a investigar lo que está detrás de las normas de Chomsky. Y el mensaje que viene de algunos aspectos es claro: la teoría de la lingüística moderna puede llegar a decaer.

Nuevas conexiones

Para entender el debate hay que analizar en detalle las ideas de Chomsky. Sus normas incluyen todos los aspectos del lenguaje, desde la sintaxis (nombres, verbos, etc.). desde el modo de combinación hasta la fonología (hasta el modo de combinar fonemas y sonidos de la lengua).

¿Por qué la teoría de Chomsky ha tenido tanto reconocimiento? La razón principal es que esta teoría explique la “producción” de la lengua; en otras palabras, la capacidad de comprender y producir frases que nunca hemos completado antes. Chomsky insistió en que la persona que ha adquirido un finito repertorio de reglas del lenguaje puede comprender y crear un número infinito de frases.

El reto contrario proviene de una escuela de pensamiento dentro de la neurociencia, el conexionismo. Según esto, las funciones mentales, el aprendizaje y el conocimiento, por ejemplo, tienen su raíz en la forma en que las neuronas están interconectadas y comunicadas en el cerebro. Esta escuela ha disparado también la mentalidad de relación entre inteligencia y cerebro. El debate, acompañado de redes neuronales simuladas por ordenador, ha llegado hoy al mundo de la lingüística. La idea principal es que el cerebro procesa la información utilizando redes neuronales.

Las células nerviosas que se “hablan” entre sí funcionan transmitiendo pulsos eléctricos a través de los “cables” llamados axones. Aunque el cerebro está dividido en zonas, cada una de ellas procesa la información de forma similar. Esa es al menos la teoría. Si tenemos en cuenta la anatomía, parece que la mayoría de las redes cerebrales son muy compactas. Una neurona recibe señales de cientos de miles de neuronas. Esto puede afectar al nivel de su actividad eléctrica y, por tanto, a las señales que pasa a otras neuronas.

Reforzando mensaje

Neuronas cerebrales. Los conexionistas simulan un modelo muy simplificado de esta red.

Uno de los principios básicos del conexionismo es que muchas de las redes neuronales cerebrales, o la mayoría, sufren pequeños cambios relacionados con la formación. Para la neurofisiología estos cambios se producen en las sinapsis neuronales. La experiencia que incorporamos excitando a ciertos subconjuntos neuronales con mayor frecuencia que otros puede reforzar selectivamente algunas sinapsis, haciendo que la aparición de ciertos modelos de actividad eléctrica sea más probable que otros. Dichos modelos pueden ser la base del aprendizaje y la memoria.

Los conexionistas están trabajando en la creación de redes neuronales artificiales y muy simplificadas que funcionan de manera similar a como funciona el cerebro real. En la actualidad estas redes no son más que una pequeña parte del “tamaño” del cerebro real, y están muy simplificadas comparando las características de las neuronas artificiales con las reales. Sin embargo, el estudio de las redes neuronales artificiales ha empezado a sugerir alternativas para muchas teorías psicológicas.

¿Cómo este planteamiento nos puede ayudar a comprender los procesos lingüísticos? Alrededor del año 1985, dos psicólogos de la universidad californiana pueden responder a una red neuronal formada por Rumelhart y McClelland. Estos sólo analizaron una pequeña parte de la lengua.

La explicación de Chomsky reconoce que en el caso del inglés tenemos un conjunto de reglas para aplicar inconscientemente al presente y crear el pasado. En inglés, se forman añadiendo “-ed” a los verbos regulares y otros 180 en los verbos mediante la aplicación de las denominadas “normas de excepción”. Esta división de verbos en regulares e irregulares es la idea principal en la teoría de Chomsky. Sin tener en cuenta estos dos grupos normativos, a los niños les sería imposible crear tiempos verbales del pasado. La red de Rumelhart y McClelland es capaz de construir pasadas de verbos regulares e irregulares sin utilizar estas reglas y sin tener que tratar de diferente manera verbos regulares e irregulares.

Cabe destacar la simplicidad de la red: Consiste en conectar 460 unidades de “entrada” en paralelo con 460 unidades de “salida”. Cada una de estas unidades (la neurona de la red) puede quedar conectada o no conectada. Las raíces verbales se pueden programar en unidades input. Estos envían señales a las unidades output a través de conexiones en las que las formas de paso están codificadas. Cada unidad de output recibe señales de muchos inputs, algunos de ellos activarán e inhibirán. La combinación de todos estos inputs “decidirá” si se activará o no una unidad output.

¿Cómo puede aprender gramática un mecanismo de estas características? Rumelhart y McClelland descubrieron que la red puede entrenarse para completar las pasadas del verbo. Esta formación consiste en mostrar a la red las formas presentes y pasadas de un determinado número de verbos. Tras presentar una palabra, la red debe encontrar la forma adecuada de la pasada. La falta de correspondencia entre el output de la red y la forma correcta del verbo proporcionará la base para la formación de la red, aprendiendo el algoritmo denominado “expansión hacia atrás del error”.

Este algoritmo tiene dos niveles. En primer lugar, se programa como ejemplo un verbo en las unidades input, desde las cuales se envían señales a las unidades output. En segundo lugar, se compara el tiempo verbal de la pasada proporcionado por las unidades output con la forma correcta dada por un “profesor”. Los pesos entre conexiones cambian de forma que se asegure que el output esté más cerca de ser correcto cuando se presenta nuevamente el input.

McClelland y Rumelhart consideran que este proceso de enseñanza imita el feedback que reciben los niños al aprender su pasado.

El problema con la teoría de Chomsky es que la red no utiliza normas lingüísticas. Aprendiendo las formas verbales, compara sus conexiones según las correlaciones que detecta entre las formas input y output. Por ejemplo, la correlación que detecta entre los terminos “-ow” y “-ew” asegura que las unidades input con “-ow” están en estrecha conexión con las unidades output que representan “-ew”.

A pesar de que no hay reglas y de que el tratamiento de los verbos regulares e irregulares es el mismo, tras un largo periodo de tiempo la red puede dar la forma correcta de la pasada. La amenaza más seria contra Chomsky deriva del tratamiento correcto de los verbos irregulares no familiares. Después de entrenar para “wept” “weep”, “clung” para “cling”, etc. puede dar.

Ha surgido un intenso debate entre investigadores como Steven Pinker y miembros del Instituto Tecnológico de Massachusetts. Para ellos, todavía es necesario un sistema basado en normas que permita aprender algunas características de las formas del pasado. Ellos han propuesto un modelo de aprendizaje “híbrido”. En este sistema las redes neuronales se limitan a recopilar información sobre verbos irregulares y los verbos regulares se tratan con reglas especiales.

Pinker prefiere este sistema híbrido por muchos motivos. En primer lugar, dice que el modelo de las redes neuronales es inapropiado porque excluye el significado de los verbos. Por ejemplo, la pasada del verbo “lie” en frases como “decir algo falso” es “lied”, pero tomando “lie” en sentido “tumbarse” es “lay”. El modelo trataría ambas formas por igual, ya que la fonología es la misma en ambos casos.

En segundo lugar, Pinker afirma que la gente trata de forma diferente verbos regulares e irregulares como en el sistema híbrido. Por ejemplo, Pinker ha descubierto que la frecuencia en la que aparece un verbo en el lenguaje afecta al tiempo que necesitamos para crear la forma del pasado, pero sólo si el verbo es irregular. Por ello, las formas de verbos irregulares simples como “go” se producen mucho más rápido que los verbos como “shrink”, pero no hay diferencias de este tipo entre verbos regulares. Los conexionistas investigan si encuentran redes neuronales más sofisticadas para ver si los descubrimientos de Pinker se pueden imitar sin recurrir a las reglas lingüísticas.

Conocimiento congénito

Si se lograse un éxito en este camino, se reforzaría el planteamiento contrario a la teoría que defiende que tenemos un abanico de normas en el cerebro. El debate es la última manifestación del viejo debate entre los empíricos, el enfoque de que todo el conocimiento se ha aprendido, y los racionalistas, que dicen que ya tenemos parte de nuestro conocimiento al nacer.

La teoría de Chomsky sobre la espontaneidad de la lengua fue asumida por el racionalismo. En definitiva, aunque el niño oiga un número limitado de frases, adquiere la capacidad de crear infinitas frases gramaticalmente correctas. Un psicólogo diría que hay pobreza de estímulo. Los niños saben, por ejemplo, que muchos verbos pueden convertirse en pasivos en inglés. Parece que, generalizando, la aplicación de la regla a todos los verbos sería razonable. Esto, por supuesto, daría frases no gramaticales. Pero no hay razones obvias para que los niños no aprendan esta regla general. Si algunas construcciones lingüísticas pueden generalizarse, ¿por qué no todas?

La respuesta de Chomsky a esta pregunta es que los niños recién nacidos tienen unos mecanismos propios que les llevan a aprender gramática correctamente. Dicho de otro modo, en la adquisición del lenguaje existen ciertos componentes genéticos. La mejor manera de demostrarlo es encontrar gente con alteraciones lingüísticas. Por ello, hay muchos lingüistas interesados en analizar las alteraciones lingüísticas de una familia londinense (16 de cada 30) sobre la herencia. Pueden entender el lenguaje y producir palabras sin problemas, pero cometen errores.

Laboratorio de idiomas

Esta alteración lingüística hereditaria sugiere que puede estar asociada a un gen simple. Los genetistas tienen que identificar este gen, pero al estar la investigación en primera fase, la mayoría de los investigadores temen sacar conclusiones.

¿Ha adoptado ya las normas lingüísticas desde su creación o las interioriza desde la relación con los padres y la interacción con los demás?

Entre los escépticos destacan los discípulos de conexionismo. Como hemos visto anteriormente, lo que defienden es la teoría de que los niños aprenden a partir de la lengua pura, y los hacen inconscientemente adaptando las conexiones de las redes neuronales en sus cerebros. Otro de los experimentos en este campo ha sido realizado por un investigador de idiomas de la universidad californiana, Jeffrey Elman, que ha desarrollado una red neuronal diferente.

La red construida por Elman puede aprender una sintaxis sencilla. A diferencia de las redes de Rumelhart y McClelland, la formada por Elman puede aprender las relaciones entre modelos inputs consecutivos. Aprende la secuencia continua de palabras (separada por breves interrupciones) y compone frases gramaticales como “John feeds dogs”. Cuando se presenta cada palabra, la red intenta averiguar cuál será la siguiente palabra como output. Puede “recordar” las palabras anteriores a la frase, ya que la representación interna de estas palabras, que son unidades que se activan en unos modelos especiales, se reponen continuamente a la circulación. Recircular las palabras “viejas” afecta a la interpretación que hace la red de cualquier palabra “nueva”.

En un experimento la siguiente palabra que la red podía inventarse era el nombre o verbo y después escoger una de las selecciones restringidas que tenía a su disposición. Una vez hecho esto, podía cambiar el peso de sus conexiones para mejorar la posible conexión entre la palabra predicida y la palabra correcta.

A medida que avanzaba la formación, la red era cada vez mejor para predecir la categoría de la siguiente palabra, indicando que había aprendido la relación entre nombres singulares y verbos singulares.

También aprendió detalles gramaticales. Elman estudió que los nombres y los verbos estaban clasificados en categorías gramaticales. Incluso clasificó los verbos en transitivos e intransitivos. La red no recibió información directa sobre estas categorías. Dedujo por inducción teniendo en cuenta las estadísticas del input.

Lo que la red de Elman pone en evidencia es que el conocimiento gramatical del niño en lugar de estar basado en normas, podría estar basado únicamente en la información estitística sobre la relación entre distintos tipos de palabras.

Por un lado, la discusión entre Chomsky y los seguidores y los usuarios de redes neuronales por otro está aún en marcha. Sin duda, en la medida en que las redes neuronales construidas estén más cerca de la realidad, el debate también será más elaborado y preciso. Pero ya el conexionismo empuja a algunos lingüistas a replantear ideas sobre la adquisición de la lengua.

Gai honi buruzko eduki gehiago

Elhuyarrek garatutako teknologia