« Si les machines sont capables de comprendre les gens, nous avons beaucoup avancé. Les machines viennent dans notre monde”

« Si les machines sont capables de comprendre les gens, nous avons beaucoup avancé. Les machines viennent dans notre monde”
Surtout, la reconnaissance du travail accompli. C'est un signe que notre recherche a suscité un intérêt et nous encourage à poursuivre nos recherches. Et le prix donne également un peu d'argent pour embaucher une personne.
Lorsque nous utilisons des traducteurs automatiques, nous réalisons souvent comment ils ont mal compris. Par exemple, au moment de revenir “Trains matin et soir”, au lieu de “Trains matin et soir”, vous pouvez faire “Trains matin et soir”. Pourquoi ? C'est souvent parce qu'il n'a pas compris de quoi nous parlons. Il ya des mots qui peuvent avoir plus d'un sens et la machine ne sait pas ce qu'il faut choisir dans ce cas.
En fait, ma ligne de recherche est celle, le traitement du langage, et à l'intérieur elle a à voir avec la sémantique ou la signification, la sémantique de calcul. Pour cela, nous représentons les significations des mots dans un espace, comme sur une carte. Nous mettons des mots de différentes langues, dans notre cas anglais, basque et espagnol, et dans cette carte nous avons marqué les points correspondant à leurs significations. Par exemple, nous avons un mot: “banque”, qui signifie “caisse d’épargne” sur un point de la carte, mais nous avons aussi le sens de “chaise” sur un autre point. De même le mot “demain” qui peut être “demain” ou “demain”. Si nous faisons bien cette carte, puis lorsque la machine commence à comprendre un texte, vous pouvez localiser si cette “banque” est de s'asseoir ou de retirer de l'argent.
Analysez les distances entre les points. Si vous êtes en mesure de placer une phrase sur la carte, vous pouvez agir avec des distances pour connaître la signification du mot dans ce cas. Le contexte du mot le clarifiera : il saura en fonction des autres mots de la phrase quel mot est proche de sa carte, du mot « boîte » ou « chaise ». Par exemple, si nous demandons à la machine: « Quelle est la banque la plus solvable ? » “Solvabilité” signifie “caisse d’épargne”.
Nous espérons que cette année, des progrès importants seront accomplis dans la réalisation des concepts sur la carte. Et nous avons avancé, mais nous n'avons pas encore réussi à prouver que ces cartes que nous obtenons sont meilleures que les mots. Mais nous avons eu des améliorations sur autre chose : nous sommes maintenant capables de prendre des cartes indépendantes pour deux langues et d'unifier les deux cartes en une seule. Autrement dit, nous pouvons faire une bonne carte pour l'basque, un autre pour l'espagnol et un autre pour l'anglais, puis mettre les trois dans le même espace. En cela, nous avons eu de bons résultats, maintenant nous faisons de meilleures cartes.
Car sur cette carte nous voulons mettre des phrases, pas seulement des mots. Voilà le défi. C'est-à-dire, pour traduire correctement une phrase, la machine doit bien comprendre la phrase. C'est ce que nous faisons les êtres humains, en définitive. Nous ne traduisons pas littéralement. Nous devons d'abord comprendre ce qu'il se réfère, le contexte, puis comprendre le noyau de la phrase. Le contraire arrive à la machine : elle est capable de comprendre les fragments littéralement, mais il lui en coûte beaucoup. Donc, un défi actuel est de mettre sur la carte le sens de phrases complètes. En recevant n'importe quelle phrase, le système saurait où il est sur la carte et le comprendrait en fonction de cela.
Si, en plus des significations littérales vous voulez introduire les deuxièmes sens dans la carte, il est possible. La machine elle-même apprend plusieurs fois des significations de second sens. C'est surprenant, mais sur cette carte, en plus de sa signification intrinsèque, travaille les connotations. Par exemple, après avoir étudié de nombreux textes, le médecin apprend que dans la plupart des cas, ils sont des hommes. Ou aux États-Unis, apprenez que les voleurs sont souvent noirs. Il étudie aussi des sujets.
Il y a un grand défi intellectuel: si les machines sont capables de comprendre les gens, nous avons beaucoup avancé. Les machines viennent dans notre monde, non? Votre compréhension est très attrayante. L'objectif est que toutes les machines aient plus d'intelligence lorsqu'elles interagissent avec nous pour qu'elles sachent que lorsque vous vous réveillez, vous voulez que la radio s'allume ou s'allume…
Mettre la connaissance que nous avons des êtres humains dans la façon de comprendre les machines est un grand défi. Bien sûr, il ya une raison pratique: le monde de la traduction automatique déplace des millions et des millions d'euros chaque année en Europe.
La vérité est qu'il ya un des principaux défis. Souvent cela est perçu par l'intérêt de l'industrie et aujourd'hui tous les géants du logiciel, Microsoft, Google, Facebook, IBM, travaillent intensément sur le traitement de la langue. Je crois qu'un grand pas en avant viendra d'ici.
Un autre grand défi est de comprendre les images. Par exemple, si vous prenez une photo comme nous sommes, que la machine comprenne qu'il y a deux personnes, qu'il y a une table, qu'il y a une horloge derrière vous… Vous comprenez déjà quelques choses. Certaines scènes sont assez bien adaptés. Mais dans d'autres scènes, elles sont complètement perdues.
Il peut être utile, par exemple, dans la domotique. Si vous avez un système pour vous aider à la maison, vous avez deux façons de savoir ce qui se passe à la maison: l'une est la voix et l'autre est la caméra. S'il y a un appareil photo qui vous regarde et sait ce qui se passe, vous saurez aussi ce que vous avez à faire : éteindre la lumière, allumer la lumière, éteindre le réveil si vous vous êtes levé avant… Voir ce que vous faites, vous pouvez savoir quoi faire.
Cela donne déjà à la machine la plus grande capacité. Il ne s'agit pas de parler seul, mais de comprendre ce qu'il voit. Nous sommes de plus en plus proches. Les gens nous entendent parce que, comme nous le voyons, nous en parlons. C'est aussi une ressource importante pour les machines.
Il ya des utilisations plus inquiétantes: il ya maintenant beaucoup de caméras dans la rue pour prévenir. Vérifiez si quelqu'un fait quelque chose de bizarre. Sans regarder, la machine allumerait automatiquement l'alarme.
On disait autrefois qu'une langue serait derrière si elle n'avait pas un dictionnaire et une grammaire derrière elle. La situation actuelle est similaire : nous avons maintenant besoin de ces dictionnaires et de ces grammaires pour les machines.
Nous avons actuellement le basque comme option pour les mobiles. Mais si Google a inclus le basque dans Android et ses systèmes est parce qu'il ya des ressources pour le basque. Ces dictionnaires sont nécessaires pour effectuer une analyse syntaxique ou morphologique. Si une langue n'a pas de ressources, si elle n'a pas de dictionnaires et de grammaires électroniques, elle risque de rester en arrière. Les grandes entreprises ne vont pas assumer la création de ces ressources.
Dans notre groupe de recherche, le groupe IXA, nous travaillons depuis 25 ans et dès le début une partie de la motivation était d'avancer dans le processus linguistique pour que le basque ait des ressources pour ne pas rester à l'écart et avancer aux côtés des grandes langues.
En ce moment, dans le cas de l'euskera, la situation est assez bonne. Il y a des listes de langues qui spécifient les ressources de chacun d'eux, et le basque est parmi les premiers.
Buletina
Bidali zure helbide elektronikoa eta jaso asteroko buletina zure sarrera-ontzian