AskHezi, Les technologies de la parole au service de la langue basque, de l’éducation des enfants et de l’inclusion

2025/06/01 Leturia Azkarate, Igor - Informatikaria eta ikertzailea Iturria: Elhuyar aldizkaria

L'intelligence artificielle et les technologies du langage et de la parole peuvent avoir des utilisations controversées, mais elles ont des applications vraiment utiles qui ne laissent aucun doute, comme celles destinées aux langues minoritaires et à l'accessibilité. Le projet AskHezi combine ceux-ci et plus encore : un système a été développé pour permettre aux enfants ayant des problèmes moteurs d'utilisation des claviers d'effectuer des écritures en basque par dictée. Dans le cadre de ce projet, plusieurs réseaux d'établissements ont collaboré dans tout le Pays basque et nous avons réalisé le développement au centre Orai NLP Technologies.

ARG Orai NLP Technologies

Il est évident que les technologies linguistiques et vocales peuvent grandement contribuer à l'accessibilité et à l'inclusion des groupes ayant une diversité fonctionnelle. Et ces technologies peuvent aussi aider le basque, à condition qu’elles soient développées aussi pour notre langue. Les technologies Orai NLP, créées par Elhuyar, sont au cœur du centre, le basque et l’accessibilité, et dans cette section de la revue, nous avons déjà eu des travaux fréquents sur ces sujets: les personnes ayant des difficultés de lecture de texte, basés sur la technologie de synthèse vocale TTS (Text-To-Speech) ou la technologie de synthèse vocale, des outils qui leur permettent d’écouter du contenu Web au lieu de lire, comme le lecteur de barre de site Web, le guide de voyage multilingue ou les experts en lecture de Recasech ou en technologie de sous-titrage numérique.

AskHezi, un projet pour répondre à un besoin

Le service d’experts, en fait, non seulement crée des sous-titres pour une vidéo ou un audio, mais transcrit également directement ce qui est dit du microphone, c’est-à-dire qu’il sert à écrire dicté par la parole et fonctionne très bien en basque. A cet égard, nous avons reçu des demandes de la part d'un certain nombre d'écoles — de différentes régions du Pays basque et, par hasard, en très peu de temps — qui avaient entendu parler d'Expert et qui nous ont demandé si les enfants ayant des problèmes de mobilité dans les bras pouvaient en profiter pour écrire des ouvrages et des textes scolaires. Bien sûr, nous avons été très satisfaits de ces demandes; pourquoi faisons-nous de la technologie si ce n'est pour soutenir le basque, les enfants et l'inclusion? Mais quand nous fûmes testés sur les enfants, nous fûmes tous giflés : La dictée des experts ne fonctionne pas aussi bien avec les voix des enfants. En fait, ces technologies sont basées sur des réseaux neuronaux qui sont développés avec des données entraînées, dans ce cas avec des audios transcrits; et les collections audio transcrites utilisées pour l'entraînement sont des enregistrements pour adultes, et les voix des enfants ne sont pas comme celles des adultes...

Mais il était également clair quelle pourrait être la solution: former le système de transcription automatique avec des enregistrements d'enfants. En outre, les établissements scolaires étaient également prêts à contribuer à l'enregistrement des enfants.

C'est ainsi qu'en 2022, un consortium a été constitué avec un réseau d'établissements d'enseignement dans les trois zones administratives du Pays basque: Depuis les E.A.U., l'Asociación de Ikastoles; depuis le Nord, le Comité d'intégration de Seaska; et depuis la Navarre, l'Asociación de Escuelas du réseau scolaire public. Le travail technique serait effectué et coordonné par Orai, et les tâches administratives et de gestion par l'association des industries linguistiques Langune. Et l'objectif, comme je l'ai déjà dit, est de développer un système de dictée dans lequel les enfants peuvent faire des œuvres littéraires en utilisant la langue basque.

Le projet a été soutenu pendant deux ans par l'appel à la citoyenneté de l'Eurorégion et une autre année par l'appel à l'intelligence artificielle appliquée de la SPRI. Au début de cette année 2025, nous avons achevé le développement du système et l'avons présenté au public le 20 mars.

Enregistrements: une collaboration incroyable

En un peu plus de deux ans, le projet AskHezi a connu plusieurs phases. Le plus long d'entre eux (qui a duré presque autant que le projet) et qui a exigé une forte participation de tous les membres a été celui de l'enregistrement. Dans ce cas, Orai a développé une plate-forme Web pour pouvoir faire des enregistrements en premier. Cette plate-forme permettait à un enfant de rester enregistré en lisant une phrase qui lui était montrée et de l'envoyer à la collection d'enregistrements.

Par la suite, chaque membre du consortium a réalisé une diffusion dans les écoles de son réseau, avec la participation d'une cinquantaine de centres. Dans chacun d’eux, des enfants, des familles et des enseignants se sont montrés prêts à aider. Les parents ont été contraints de signer les documents de consentement requis par la loi sur la protection des données et la vie privée. Et avec l'aide d'enseignants ou de parents, parfois dans les écoles et parfois à la maison, environ 480 enfants ont enregistré environ 150 phrases chacun. Au total, plus de 70 000 enregistrements ont été réalisés et près de 100 heures d'audio ont été obtenues pour l'entraînement. Tous les partenaires du projet ont fait un effort énorme à ce stade et les résultats obtenus ont été également impressionnants.

Développement: systèmes de dictée et de correction

Sans attendre la fin du processus d'enregistrement et avec lui — après avoir atteint un nombre minimal d'enregistrements — nous avons entamé le développement au centre d'Orai. La première phase a consisté à former des modèles de transcription automatique adaptés à la voix des enfants. Différents modèles ont été testés, comme le modèle modulaire plus classique Kaldi et le modèle intégral Whisper end-to-end. Dans les deux cas, des améliorations ont été apportées, c'est-à-dire que les voix des enfants sont mieux transcrites et que les résultats de Whisper sont un peu meilleurs. Ensuite, dans les deux cas, la méthode de transcription en direct et en temps quasi réel a également été développée. En outre, on a aussi mis en place un mode d’écriture naturel des nombres, dates, sigles et autres semblables (“2025” et non “deux mille vingt-cinq”, “EAJ” et non “e a touché”...).

La prochaine étape a été la mise en place d'un système permettant d'apporter des corrections. En fait, même avec un très bon système de dictée automatique, il fera toujours quelques erreurs et même les enfants feront parfois des erreurs quand ils dictent le système. Mais il fallait aussi permettre de corriger ces erreurs par la parole, sans utiliser le clavier. Ainsi, la voie de la compréhension et de l'exécution des commandes de correction habituelles a été mise en œuvre: “aller deux mots à gauche”, “supprimer les cinq caractères à droite”, “sélectionner la phrase à gauche”, “copier”, “défaire”...

Événement de lancement de la plateforme de dictée AskHezi. ARG Orai NLP Technologies

En tout état de cause, il s'est avéré que certains mots mal transcrits, même effacés et répétés, étaient mal transcrits encore et encore (par exemple certains noms spéciaux, notamment étrangers), et le seul moyen de résoudre ce problème a été de leur permettre d'épeler. Mais nous avons découvert que ces systèmes automatiques se confondaient avec l’épelage de lettres d’une seule syllabe (« e », « be », « de », « ge », « pe », « te »...). C'est aussi le cas pour nous, et c'est la raison pour laquelle, lorsque nous donnons la lettre de la carte d'identité par téléphone, nous disons «Bilbao», et c'est la raison pour laquelle l'alphabet radio ou d'autres alphabets d'écriture ont été inventés il y a longtemps pour les radiocommunications militaires. Et dans notre cas aussi, la solution a été d'offrir l'alphabet lettré, en lui donnant autant de possibilités que possible: chaque lettre peut être dite de façon normale («a», «be», «ce»...), en utilisant l'alphabet international des avions («alpha», «bravo», «charlie»...), en utilisant l'alphabet lettré basque proposé par Xabier Artola («Araba», «Baiona»...), en utilisant l'alphabet international des avions («alpha», «bravo», «charlie».....

L'ensemble du système AskHezi est fourni via une interface Web dans laquelle, après avoir appuyé sur le bouton de démarrage de l'enregistrement, tout ce que l'enfant dit sera écrit dans une boîte, vous pouvez passer à tout moment à faire des corrections ou à épeler et revenir à tout moment à dicter jusqu'à ce que le texte que vous voulez écrire soit terminé.

Déploiement: encore à faire

Le système de dictée mis au point dans le cadre du projet AskHezi est très satisfaisant pour tous les membres du consortium et nous pensons qu'il sera très utile pour les enfants présentant une diversité fonctionnelle, et pas seulement pour nous, mais aussi pour les parents des enfants qui sont venus avec la demande, qui ont à nouveau manifesté le désir de commencer à en profiter le plus tôt possible.

Mais la prochaine étape est là. Les techniques de réseau neuronal les plus modernes sont utilisées dans le système de dictée AskHezi et, comme nous le savons, ce type de système a des exigences de ressources élevées. Ils ne sont pas faciles à mettre en service sur des ordinateurs ordinaires, ils doivent être mis en service sur des serveurs puissants, et plus il y a d'utilisateurs simultanés, plus les serveurs sont puissants. Et ces serveurs coûtent souvent très cher.

Le défi auquel nous sommes confrontés aujourd'hui est donc de voir comment nous pouvons payer les coûts des serveurs et de leur maintenance, ou profiter des serveurs des organismes publics. Nous montrons AskHezi aux différents départements de l'éducation des différentes administrations et nous percevons un accueil et une bonne attitude. Nous sommes maintenant en mesure, grâce à la collaboration, de mettre en place dès que possible le système de dictée en basque AskHezi et d'en profiter pour tous les enfants de tout le Pays basque et de tout réseau qui en ont besoin.

Gai honi buruzko eduki gehiago

Elhuyarrek garatutako teknologia