Future voix
2000/01/01 Kortabarria Olabarria, Beñardo - Elhuyar Zientzia Iturria: Elhuyar aldizkaria
Il y a quelques mois, à l'occasion de la création d'une base de données vocale en basque, Telefónica a convoqué l'enregistrement de 10.000 voix de basques. Pour cela, il a mis un numéro de téléphone gratuit à laquelle l'appelant devait répéter des phrases et des numéros que disait un ordinateur. Ce que disait l'ordinateur a été préparé par le Département de Philologie Basque de l'UPV/EHU avec l'intention de recueillir tous les sons habituels en basque. Pour ce faire, un macrotexte fourni par l'UZEI a été analysé. Bien que les responsables du projet aient besoin d'au moins 5000 appels, ils ont reçu près de 19 000 appels, bien qu'ils aient été utiles – qui ont répété tout ce que l'ordinateur avait dit – 11.200. Le projet a participé à l'ITIE, qui a enregistré tout ce que l'ordinateur disait au personnel local et a mené une campagne de capture de voix.
Les informations recueillies lors des appels téléphoniques ont été recueillies à Leioa, Département de l'électricité et de l'électronique de l'Université du Pays Basque. Les informations numériques recueillies doivent maintenant être traitées et constitueront ensuite la base de données. Cette base de données qui est créée peut être utilisée avec les connaisseurs de la voix, afin qu'ils puissent continuer à étudier dans ce domaine. Pour sa part, la Faculté de Philologie pourra également profiter des informations reçues pour effectuer des recherches sur la phonologie de l'euskera actuel. Si on avance sur le chemin prévu, ce projet permettra bientôt d'accéder à de nouveaux services en basque : marques téléphoniques par voix, télésélection de compteurs, validation de cartes de crédit, banque électronique, achats téléphoniques….
Système de reconnaissance automatique des membranes
Ce qui semble être une question d'avenir sont le pain quotidien au Département de l'électricité et de l'électronique de l'UPV, car l'équipe de la Connaissance de la Voix consacre des heures et des heures à cela. Les ordinateurs vont parler, il semble qu'il n'y a aucun doute à ce sujet. Comment faites-vous parler ? Comment sont-ils enseignés?
Notre cerveau construit un message à l'intérieur en suivant les règles du langage. Ensuite, en utilisant le système de création de la voix du corps, il produit une onde très riche en harmoniques, le signal vocal. Ce signal acoustique a plusieurs caractéristiques: énergie, harmoniques réduits dans la bande de fréquence de 7-8 kHz, fréquence de base, etc. Il y a des bruits dans ce signal. Ces sons, selon les règles du langage, constituent des unités lexicales. Chaque bruit a ses caractéristiques acoustiques. Par conséquent, ces éléments, sons et lecteurs lexicaux qui apparaissent codés dans le signal vocal, doivent être décodés pour connaître le message généré.
Pour pouvoir utiliser le signal vocal sur l'ordinateur, il est nécessaire de l'afficher. Pour ce faire, le signal analogique devient numérique. Ensuite, le signal numérique est paramétré pour réduire l'information redondante de la voix, c'est-à-dire que les caractéristiques les plus caractéristiques du signal sont extraites : énergie, fréquence de base, certains paramètres liés aux fréquences, etc.
La reconnaissance de la voix se fait par deux techniques, l'une basée sur des mots isolés ou silencieux, l'autre étant la membrane continue. Dans les deux cas, pour que le système comprenne le message, il faut disposer d'un décodeur de modèles acoustiques : dans le cas de mots isolés on utilise des modèles de mots et dans le cas de la langue continue, des modèles de sons et des unités lexicales.
Dans le premier cas, le fonctionnement du système est très simple: on compare le signal aux modèles de mots qui ont été étudiés et on choisit le modèle de mot le plus proche. Quant à la connaissance du langage continu, le processus est divisé en deux phases : le décodage acoustique-phonétique et la modélisation du langage. Dans la phase de décodage phonétique, on obtient la chaîne sonore du signal vocal. Ensuite, dans la phase de modélisation du langage, les unités lexicales sont obtenues et, en utilisant des règles syntaxiques et sémantiques, le message contenant le signal est décodé. À ce moment-là, l'ordinateur est déjà capable de connaître la langue.
Le processus est effectué par différentes méthodes mathématiques. Quant aux modèles acoustiques, les approches structurelles stochastiques, modèles cachés de Markov. D'autre part, pour apprendre des modèles et connaître le message, d'autres algorithmes: Baum-Welch, Viterbi.
Et pour que le système fonctionne correctement, vous devez connaître chaque bruit. Vous devez donc apprendre différents échantillons de chaque son, car les sons produits par une personne et une autre sont différents. C'est pourquoi, dans cette phase de connaissance automatique du langage, il est impératif d'avoir une grande base de données, car plus il y a de locuteurs, plus il y aura de caractéristiques, plus il pourra recueillir et connaître le système. Autrement dit, pour que le système puisse connaître chacun des sons, il faut beaucoup d'échantillons de chacun d'eux.
Euskera spécial ?
À ce jour, et aussi à l'UPV, on a travaillé principalement avec des modèles en espagnol, mais le travail du groupe de reconnaissance automatique de la langue va arriver bientôt, car depuis des années, on travaille principalement avec l'euskera. Du point de vue des caractéristiques de la langue, l'euskera peut avoir des particularités. "En ce qui concerne les sons, dit Karmele Lopez de Ianas, membre du Groupe de Reconnaissance Automatique Mintzo, il ne semble pas être plus difficile que les autres langues, car il n'y a rien d'étrange. Quant au lexique, l'euskera est spécial, puisque la langue est autocollant. Par exemple, pour nous, le mot maison est maison, mais pour eux, ce qui est de maison — le mot ne change pas — pour nous est de maison, et c'est un mot nouveau. Le basque a un grand avenir dans le domaine de la connaissance orale automatique, surtout pour l'intérêt qu'il a suscité dans la communauté scientifique grâce à ses caractéristiques spécifiques".
La base de données de Telefonica a eu un écho, mais au Département d'Électricité et Électronique de l'UPV/EHU de Leioa ont collaboré avec le soutien du Département de Filologie Basque de Vitoria-Gasteiz et avec la subvention du Gouvernement Basque. "Depuis de nombreuses années notre groupe a commencé à développer un système de reconnaissance automatique de la langue basque. En particulier, deux bases de données vocales ont été conçues, une pour une utilisation dans des applications téléphoniques et une pour le développement de systèmes de tout type. Ainsi, en ce qui concerne les bases de données phonétiques, nous avons réussi à les assimiler à d'autres langues. Si nous regardons les gens qui travaillent dans ce domaine dans le monde, nous pouvons dire que nous ne sommes pas si mal, nous sommes sur une paire ».
Gai honi buruzko eduki gehiago
Elhuyarrek garatutako teknologia