JJJ8 perdido en la selva de la lengua
2009/11/01 Roa Zubia, Guillermo - Elhuyar Zientzia Iturria: Elhuyar aldizkaria
Los robots son máquinas, no tienen oído. Para poder escucharlo necesitan un micrófono, digitalizan esa onda de la voz y descubren el mensaje del orador. Ingenieros e informáticos han participado en este sistema de reconocimiento de voz. El objetivo no es fácil: la máquina debe comprender el mensaje con independencia del tono y la dicción del orador.
Para ello es necesario que la máquina se forme previamente. Son técnicas de inteligencia artificial. Tiene que aprender. No es extraño, el hombre también aprende así. Los niños tardan años en conocer las palabras que se les dicen y en atrapar el mensaje que se les da con el habla. Los adultos también hacen lo mismo cuando aprenden un nuevo idioma. Tienen que "hacer oreja". Y con ese hechizo tampoco termina lo que hay que aprender.
El robot JJ8 Es difícil encontrar sal en el salón cuando recibe la frase, tiene que hacer muchas cosas para comprenderla. Ya conoce la sucesión de cinco palabras, pero ahora debe aclarar cuál es la estructura de la frase. Tiene que segmentarse, es decir, tiene que saber que las palabras forman un conjunto inteligente, que la palabra sal es otra, y que la palabra en el salón es otra. Y debe aclarar por qué forman estos conjuntos y no otros.
Además, deberá analizarlo literalmente. Debe saber que es verbo encontrar, sal, etc. Y debe identificar los lemas: identificar el lema que se encuentra detrás de la palabra encontrar. Es decir, tiene que ser la forma básica de las palabras que ha recibido para buscar significado.
A través del mundo humano
De momento, JJ8 no ha entendido nada. Sabe qué palabras componen la frase, cómo están organizadas y por dónde debe partir para buscar el significado de cada palabra, pero no ha entendido nada. No tiene conocimientos ni contexto para comprender la frase. Pero el siguiente paso es comprender lo dicho por Fausto. El cuñado está a punto de sumergirse en el mundo de la ambigüedad.
Afortunadamente, estas palabras no tienen mucho sentido. Al parecer, la sal es la sal, es decir, no parece que esa palabra indique otra cosa que no sea el cloruro sódico. Pero no es del todo cierto: puede ser sinónimo de gracia o de vitalidad. En este caso, JJ8 deberá descartar este significado y aclarar que Fausto se refiere al cloruro sódico.
La forma más eficaz que han inventado los informáticos para hacerlo es el método estadístico. JJJ8 deberá buscar el lema de sal en muchos textos y analizar con qué otras palabras aparece habitualmente. Es un trabajo difícil, que se le explicará con frecuencia en textos de carácter laboratorio, pero que no le ayuda. Claramente, el mensaje de Fausto no tiene ninguna relación con la química (o al menos lo cree). Sin embargo, en la mayoría de los textos que acompañan a la sal y al descubrimiento, la sal será sinónimo de cloruro sódico. No siempre. Pero si es así en la mayoría de los casos, deberá tomar una decisión --difícil - a favor de esa acepción. Hoy en día, los informáticos han hecho un buen trabajo para que las máquinas tomen este tipo de decisiones, y sin embargo, la estadística no siempre es la mejor manera de conseguirlo (es posible que en algunos contextos en los que coexistan palabras de sal y encontrar el significado de la sal sea la gracia o la vitalidad).
Los informáticos (y los lingüistas) llaman desambiguación al trabajo de elegir el sentido correcto de cada palabra. La máquina es imprescindible para entender una conversación y, en muchos casos, el principal problema a superar. Pero no es el único problema.
Para entender a Fausto, JJ8 debería hacer una lectura a otro nivel. Es difícil encontrar el verdadero significado de la frase No lo encontrarás. Sin embargo, el gajo JJ8 cree que sí, que difícilmente la palabra indica que tendrá que hacer un esfuerzo especial.
Pero el lenguaje del hombre no es claro y directo. Está plagado de metáforas, ironía, hipérbolas y otros trucos. Muchas veces utiliza una frase para expresar algo que no significa esa frase. Hasta luego dice que sabiendo que no se va a unir con nadie. ¿Tienes horas? dice preguntarse qué hora es y no para confirmar que el otro tiene un reloj que funciona correctamente. Hay muchos otros ejemplos.
Respuesta
JJJ8 ha entendido lo que ha podido y responde en función de lo que ha entendido. Pero este proceso tampoco es fácil. Y es que en una entrevista se necesitan respuestas de todo tipo. A veces hay que buscar un dato para responder. Otras veces una explicación completa. Otras veces hay que responder a una provocación. Hay de todo.
Y buscar cada tipo implica una estrategia propia. Nuevamente nos encontramos con la inteligencia artificial: técnicas de respuesta a preguntas, búsqueda inteligente, extracciones de información, traducción automática de información en varios idiomas, etc. Y, por supuesto, también son necesarias combinaciones de estas técnicas.
El trabajo del robot está tomando forma. Se puede decir que buscando la respuesta ha hecho lo más difícil. Pero no acaba del todo. Debe dar forma de habla a esta respuesta. Utilizar técnicas de creación lingüística. De alguna manera es un camino hacia atrás. Ha recibido voz, ha analizado el idioma de lo dicho, lo ha entendido, ha buscado una respuesta y ahora tiene que hacer lo contrario. Aplica las reglas del idioma a la respuesta y crea un texto apropiado para hablar.
Y finalmente, JJ8 debe sintetizar la voz para decir lo que está en ese texto. Quizá sea lo más fácil. La creación de la voz sintética está en gran medida desarrollada, salvo que se requieran emociones y un tono muy especial.
¡Por fin! El robot responde. En este caso, Fausto le dice a JJ8 que vaya a la cocina. Nada más. El robot no necesitaba respuesta. De vuelta a la cocina, tenía que buscar allí la sal (salero). Pero ha respondido y la verdad es que gracias a la respuesta sabe lo que ha pensado Fausto JJ8.
Fausto no está muy contento porque el robot cocinero no le entiende del todo, y eso le obliga a hablar de forma concreta y clara. Pero viendo lo difícil que es crear una conversación artificial, Fausto debería estar satisfecho.
Realidad
JJ8 no es real. Nace como ejemplo de las dificultades que tiene capacitar a una máquina para hablar. Pero sus robots reales alternativos deben superar dificultades similares en función de sus aplicaciones. Puede que no den los mismos pasos que el robot JJ8 o lo hagan en el mismo orden. Pero, en todos los casos, la ciencia y la tecnología que hay detrás tienen que ver con el procesamiento del lenguaje. Las principales dificultades que presentan las máquinas expendedoras de verdad son las de procesamiento del lenguaje humano.
Los investigadores han avanzado en este camino. Sin embargo, los expertos coinciden en que todavía falta mucho para que las máquinas puedan hablar como personas. La investigación está sólo en los primeros pasos, pero el trabajo ya realizado es sorprendente; por un lado, la colaboración entre informáticos y lingüistas ha mostrado las dificultades de la conversación artificial y, por otro, ha comenzado a desarrollar estrategias para la mayoría de los pasos. No es poco.
Gai honi buruzko eduki gehiago
Elhuyarrek garatutako teknologia