Je parle aux machines

Communiquer simplement avec les machines avec des mots est une réalité aujourd'hui. Dans un smartphone, par exemple, vous pouvez effectuer une recherche sur Internet ou envoyer un message sans toucher un bouton, en utilisant simplement la voix. Pour le développement des technologies linguistiques, le projet de recherche Berbatek a été lancé par plusieurs centres et institutions de recherche, dont la Fondation Elhuyar. L'une des principales lignes de l'étude a porté sur le traitement de la voix: comment utiliser la voix humaine, nos mots, pour communiquer avec les machines. Les premiers résultats du projet ont été publiés il y a quelques jours, regardons-les.

LITHUANIE La fondation Elhuyar Inma, votre travail ici est de créer la technologie qui permet aux humains et aux machines de communiquer et de se comprendre, non ?

laboratoire INMA HERNAEZ, Aholab (UPV/EHU): Oui, pour qu'on parle ensemble.

LITHUANIE La fondation Elhuyar Et comment fait-on ça ?

laboratoire INMA HERNAEZ, Aholab (UPV/EHU): D'une part, nous créons la voix à partir d'un texte, en utilisant des algorithmes, et d'autre part, nous acquérons la connaissance, la voix, nous l'analysons et nous créons le texte correspondant.

Dans ce que vous entendez, il y a une machine qui parle, ce n'est pas un enregistrement. La parole est produite par un synthétiseur vocal, une technologie développée par Aholab. Aholab est un laboratoire de l'Université du Pays Basque qui développe des technologies vocales. Jusqu'à présent, l'homme et la machine ont communiqué par écrit, avec des boutons, mais aujourd'hui, nous commençons à parler aux smartphones ou aux tablettes, et ils répondent et tiennent leurs promesses.

LITHUANIE La fondation Elhuyar Nous allons maintenant jouer un peu avec la technologie vocale fournie par le système d'exploitation Android. On va essayer de se comprendre.

Aller directement sur un site Web, ouvrir une carte spécifique, programmer le GPS... tout cela ne peut être fait qu’en anglais, espagnol et/ou d’autres grandes langues. Aholab travaille pour que les machines le fassent aussi en basque. Il travaille en particulier sur la synthèse vocale: TTS, Text To Speech. Voici les étapes.

laboratoire INMA HERNAEZ, Aholab (UPV/EHU): Oui, c'est ce que vous avez d'un côté, des modules linguistiques, et d'un autre côté, vous avez besoin de modèles acoustiques, et puis avec quelques algorithmes

LITHUANIE La fondation Elhuyar On l'appellera Sofware pour que les gens comprennent

laboratoire INMA HERNAEZ, Aholab (UPV/EHU): Oui, associer des sons avec un logiciel et en extraire la voix, aussi bien ou aussi naturellement que possible.

LITHUANIE la Fondation Elhuyar Le naturel, c'est peut-être le défi ?

laboratoire INMA HERNAEZ, Aholab (UPV/EHU): Au début, le défi était l’intelligibilité, il y a de nombreuses années. Ensuite, les systèmes étaient très compréhensibles et le défi était le naturel. Et aujourd'hui e... nous mettons plus d'émotions dans la voix synthétique que de naturel.

Les éléments de base, les unités de synthèse ou les phonèmes qui composent le verbe sont obtenus à partir de ce type d'enregistrements audio ou vidéo. Ici, le visage de l'orateur a également été enregistré pour capter le geste correspondant à chaque émotion.

Cette démo de duplication automatique est l'une des branches du projet Berbatek. Le chercheur Igor Leturia de la Fondation Elhuyar a participé au développement.

iGOR LETURIA, Fondation Elhuyar Voici une démo que nous avons réalisée dans le cadre du projet Berbatek pour montrer comment les technologies linguistiques, dans ce cas, peuvent aider le secteur de la traduction, précisément pour faire des doublons.

iGOR LETURIA, Fondation Elhuyar C'est la version originale que nous avons adoptée, en espagnol. Le point de départ est une vidéo en espagnol, la vidéo et sa transcription. À partir de là, un fichier de sous-titres est automatiquement créé, c'est-à-dire quand une phrase commence et finit. Et puis ce fichier de sous-titrage en espagnol est automatiquement traduit en basque et l'audio ou la voix du basque est généré, à nouveau automatiquement.

iGOR LETURIA, Fondation Elhuyar La technologie d’extraction des sous-titres de la transcription appartient à Vicomtech, la traduction automatique à IXA et la création ou synthèse vocale à Aholab.

iGOR LETURIA, Fondation Elhuyar Ici, nous avons sélectionné l'audio basque et les sous-titres basques. Ce que nous entendons et lisons maintenant, c'est ces sous-titres automatiquement traduits en basque et la voix est générée automatiquement avec la technologie de synthèse d'Aholab

LITHUANIE La fondation Elhuyar J'ai dit "magie", je ne sais pas si c'est comme ça...

iGOR LETURIA, Fondation Elhuyar Oui, c'est un peu magique.

Ce n'est qu'un exemple ou une démo de ce qui peut être fait en utilisant ces technologies, mais imaginez, cela peut être la première étape pour écouter un film en russe en direct en basque. Le progrès de la synthèse vocale progresse à une vitesse fulgurante.

LITHUANIE Fondation Elhuyar: Bonjour, Inma, nous allons transformer ma voix en une voix de fille... ou la voix d'une grand-mère, par exemple, nous lui avons mis des choses difficiles.

La synthèse vocale avancée peut avoir un large éventail d'utilisations, telles que le positionnement de la voix aux personnages de dessins animés. Quelqu'un qui perdra définitivement sa voix en raison d'une opération ou d'une maladie peut faire des enregistrements avant, puis utiliser ce son pour le synthétiseur vocal afin qu'il produise exactement la même voix que celle que vous aviez avant. Ou ils étudient également les moyens de faire de la télévision de manière bon marché: les nouvelles seraient lues par une machine, par exemple, la prévision météorologique.

Dans cette autre démo du mot, outre la synthèse vocale, c'est la connaissance qui est en jeu. Il s'agissait ici de démontrer l'utilisation potentielle des technologies linguistiques et vocales dans l'enseignement.

La reconnaissance vocale fait un chemin plus ou moins opposé à la synthèse. La matière première pour la conversion de la voix en texte lui est d'abord donnée, par exemple, les unités acoustiques, les petits morceaux sonores, qui forment 43.

iNMA HERNAEZ, Aholab, UPV/EHU...: 43, quarante-trois. Il a compris.

Et puis vous devez dire à la machine comment vous pouvez recevoir ces éléments organisés, fournir des modèles linguistiques.

LITHUANIE La fondation Elhuyar Vous lui dites de quoi nous allons parler, plus ou moins; "Je ne vous dirai que les chiffres", prévenez la machine

laboratoire INMA HERNAEZ, Aholab (UPV/EHU): Vous fixez le vocabulaire, oui, limitez la zone. Ensuite, vous pouvez le rendre un peu plus compliqué et inclure la grammaire, par exemple, mais aussi la grammaire limitée, afin que vous puissiez reconnaître "où est né Newton"

Si vous lui parlez en utilisant un lexique ou une langue qui n'est pas chargée, le système ne sera pas en mesure de le comprendre.

LITHUANIE La fondation Elhuyar Et si je lui parlais comme à une personne, dans un langage continu ? " Et si nous allions dîner ? " Comprendrait-il ?

laboratoire INMA HERNAEZ, Aholab (UPV/EHU): Oui, il comprendrait s'il avait des modèles de langage. Les modèles de langage sont des modèles linguistiques, des statistiques pour calculer les probabilités des chaînes de mots, ce qui est fait en prenant beaucoup de texte, les relations statistiques entre les mots et les probabilités des chaînes sont calculées. Et avec toutes ces informations, on construit des modèles linguistiques.

Sur Internet, par exemple, la quantité de texte disponible pour effectuer ce travail détermine, entre autres, le niveau de développement d'une langue dans ce domaine. Là encore, l'espace entre les grandes et les petites langues est évident.

iGOR LETURIA, Fondation Elhuyar  Si une langue n'est pas préparée, vous devrez continuer à faire ces choses à la main et nous allons revenir à la technologie. C'est pourquoi il est si important de développer ce genre de choses.

Nous avons juste commencé à utiliser les technologies vocales. Jusqu'où peut-on aller ? Par exemple, comment savez-vous si c'est l'homme ou la machine qui a donné la parole à ce reportage ?

Buletina

Bidali zure helbide elektronikoa eta jaso asteroko buletina zure sarrera-ontzian

Bidali