ElkarOla: Technologies linguistiques au service d'un territoire intelligent, industriel, inclusif et multilingue

2017/06/19 Leturia Azkarate, Igor - Informatikaria eta ikertzaileaElhuyar Hizkuntza eta Teknologia Iturria: Elhuyar aldizkaria

Le projet ElkarOla est le résultat final de 15 ans de collaboration entre les organisations les plus représentatives du Pays Basque dans la recherche et le développement de technologies linguistiques et de la parole. Comme preuve du travail accompli, trois démos ont été travaillées qui reflètent ce que ces technologies peuvent faire dans trois domaines stratégiques.
Démo pour la zone de fabrication avancée. Il s'agit d'un système de téléassistance de réalité augmentée pour une utilisation entre un expert et un employé. Ed. Igor Leturia

ElkarOla est un projet de recherche stratégique développé en 2015 et 2016 dans le domaine des technologies linguistiques et de la parole. Des exemples de ces technologies sont les outils pour la traduction, la gestion de l'information (chercheurs, extraction d'information, analyse de sentiments), les ressources linguistiques (dictionnaires, corpus, correcteurs) et les outils pour la parole (connaissance de la parole, création de la parole). Le projet a travaillé spécialement pour l'euskera, mais aussi pour d'autres langues locales et proches.

Elhuyar, les groupes de recherche de l'UPV-EHU Ixa et Aholab, le centre technologique Vicomtech-IK4 et la fondation Tecnalia Research Innovation, en coordination avec Elhuyar.

Depuis 15 ans, cinq institutions collaborent à la recherche et au développement de technologies linguistiques et parlant pour le basque. Quatre autres ont été réalisées avant ce projet : Hizking21 (2002-2004), AnHitz (2006-2008), BerbaTek (2009-2011) et Ber2Tek (2012-2014). Alors que les précédents étaient orientés vers l'industrie des langues, ElkarOla met l'accent sur les domaines du RIS3 Euskadi.

La stratégie de spécialisation intelligente RIS3 est une stratégie régionale axée sur l'innovation et le développement en Europe. Dans cette stratégie, chaque région, en tenant compte de ses capacités productives et potentialités, définit et concentre des ressources et des investissements dans des domaines stratégiques. Dans le cas de la CAPV, RIS3 Euskadi établit trois priorités : fabrication avancée, énergie, biociences et santé.

Bien que les technologies linguistiques et parlantes ne soient pas parmi ces priorités, elles sont une ligne transversale importante avec application dans toutes ces priorités. En ce sens, ElkarOla, en plus de la recherche fondamentale, a également mené la recherche appliquée dans les domaines mentionnés du RIS3 et, grâce au transfert technologique, plusieurs outils et applications ont été commercialisés et socialisés.

Démos pour les domaines prioritaires

La démo en biocience et santé est un chercheur de termes et de relations sanitaires. Ed. Igor Leturia

Comme résultat final du projet, nous avons développé trois démos qui reflètent la contribution possible de ces technologies et de la collaboration entre les entités du consortium dans ces domaines du RIS3.

La démo pour le domaine de la fabrication avancée est un système de téléassistance de réalité augmentée pour une utilisation entre un expert et un opérateur. Cette démo montre en quoi les technologies linguistiques et de parole peuvent contribuer dans un environnement industriel bruyant. Si l'opérateur veut avoir les mains libres pour travailler, il mettra quelques smartglass ou aura à sa disposition une tablette. L'expert vous aidera à distance via une autre tablette ou ordinateur. L'expert recevra en temps réel ce que l'employé indique et ce qu'il voit avec sa tablette ou ses lunettes. Ainsi, l'expert informera verbalement le travailleur, mais puisque le travailleur peut se trouver dans un environnement bruyant provoqué par les machines, le système transcrit automatiquement (par la connaissance de la parole) et traduit (par traduction automatique) ces instructions pour qu'il arrive par écrit au travailleur. Ce texte sera montré à l'employé sur votre appareil, en temps réel, sur ce que vous voyez et guidé pas à pas dans votre tâche. En outre, l'application montrera au travailleur effectivement augmenté les instructions à distance, par des flèches et similaires.

La démo biociences et santé est un chercheur de termes et de relations sanitaires. Ce premier prototype d'un chercheur de relations entre les entités médicales (maladies et médicaments) fonctionne sur un corpus d'extraits d'articles scientifiques en espagnol sur des sujets médicaux. Ce corpus a été étiqueté manuellement pour former et évaluer un système de détection automatique des réactions indésirables aux médicaments. Parmi les entités étiquetées se trouvent, d'une part, les médicaments génériques, les marques de médicaments et les substances et, d'autre part, les maladies et les symptômes. Les relations étiquetées comprennent les causes (quelles sont les causes de la maladie) et les traitements (avec quels médicaments il s'agit ou la maladie). Dans le moteur de recherche, vous pouvez effectuer des recherches par entités ou relations et voir graphiquement les entités et relations détectées dans chaque document.

Démo d'un agent de dialogue pour le service à la clientèle. Ed. Igor Leturia

Enfin, pour avoir une démo territoriale, nous avons développé un agent de dialogue pour le service clientèle. Les services de service à la clientèle sont un élément clé pour offrir un service de qualité dans certains secteurs, mais beaucoup de ces services ont des tâches ou des phases répétitives de faible valeur (identification de l'utilisateur, remplir des formulaires, requêtes simples…). Les technologies des systèmes de dialogue, ainsi que le traitement du langage naturel et de l'intelligence artificielle, permettent d'automatiser ces tâches afin que les techniciens puissent utiliser le temps plus efficacement. La démo est un système de dialogue intégré dans une interface web qui utilise des techniques de traitement du langage naturel et des algorithmes statistiques de classification pour identifier l'utilisateur et quel département doit être transféré l'événement décrit par l'utilisateur. Les réponses du système sont données à la fois par texte et par synthèse de la parole et peuvent être donnés des ordres écrits et verbaux.

Gai honi buruzko eduki gehiago

Elhuyarrek garatutako teknologia