}

Dépasser les limites vocales

2002/02/01 Anega, Iker | Jubete, Juan Jose | Lopez de Ipina, Karmele Iturria: Elhuyar aldizkaria

Ces dernières années, nous avons subi une petite invasion de nouvelles technologies. Les ordinateurs, Internet, le téléphone mobile... peuvent être trouvés n'importe où ; comme beaucoup d'autres dispositifs technologiques, ils sont déjà devenus un outil habituel de notre vie quotidienne. En fait, aujourd'hui, il est de plus en plus facile d'avoir un ordinateur à la maison.

Il ne fait aucun doute que la technologie continuera à changer notre mode de vie. D'une certaine façon, l'influence de la technologie dans l'habitat humain tout au long de l'histoire a été énorme, dans la plupart des cas, pour améliorer la qualité de vie, mais dans certains cas, malheureusement, même pour s'aggraver (dans le cas de l'industrie des armes). Cependant, l'attitude face à ce fait n'est généralement pas tiède.

Autrefois, l'électricité, le téléphone, la télévision, la radio et d'autres nouvelles avancées technologiques sont devenues une partie de notre vie et ont provoqué un changement radical dans la vie quotidienne. Alors qu'au début, la plupart des gens pensaient que ces éléments technologiques devaient être utilisés par quelques privilégiés… il est clair qu'ils avaient tort ! Le temps a montré que la société a besoin d'un processus d'adaptation pour accepter toute nouvelle technologie, mais qui devient finalement un outil habituel.

Malheureusement, le processus d'apparition de la technologie et le temps d'adaptation dont l'utilisateur a besoin ne coïncident pas, et l'utilisateur est souvent perdu et effrayé. Le processus d'apprentissage est très complexe et laborieux.

Ces derniers temps, afin de dépasser les limites des nouvelles technologies, certaines interfaces de soutien ont été introduites. Ces interfaces cherchent le naturel de la communication entre les machines et l'utilisateur et essaient de simuler des formes de communication humaines. Par conséquent, la voix étant le moyen le plus naturel avec lequel les gens communiquent, peut être un instrument idéal pour communiquer avec l'ordinateur. Surtout parce que la voix adoucit en quelque sorte les machines et l'utilisateur se sent plus à l'aise.

L'incapacité des êtres humains face aux nouvelles technologies (pour ne pas être en mesure de les contrôler) est le sentiment que les personnes à mobilité réduite (handicapés, personnes âgées) ont souvent les choses habituelles. Par exemple, ouvrir la porte pour une personne en bonne condition physique n'implique pas beaucoup d'effort. Au contraire, si la personne a un problème physique qui réduit sa mobilité, cette porte peut devenir une limite insurmontable.

Dans le cas de ces personnes, la technologie a souvent été très utile pour faciliter leur vie: fauteuils roulants motorisés, claviers adaptés, ascenseurs spéciaux, etc. Et pour eux, la voix peut aussi être un outil très utile pour surmonter les limites quotidiennes.

Alors... Pourquoi ne pas contrôler le fauteuil roulant par la voix? Et… pourquoi ne pas contrôler les éléments communs de la maison : télévision, portes, lumières, fenêtres, etc. en utilisant les commandes vocales? Est-ce la science-fiction ? Non, c'est une nouvelle technologie appelée la domotique. La domotique comprend la conception, le contrôle et le développement de bâtiments intelligents. Alors appliquons la science Domotique pour construire une maison contrôlée par la voix pour les personnes à mobilité réduite. Enfin, pourquoi ne pas utiliser le basque pour contrôler la maison de nos rêves?

Pour rapprocher ce rêve de la réalité, le système AHOTSDOMO a été développé. Grâce à ce système, les éléments d'utilisation commune d'une maison peuvent être contrôlés par voix en basque.

Présentation du système AHOTSDOMO

La figure 1 montre le schéma général du système AHOTSDOMO. Ici, vous pouvez voir le fonctionnement du système.

Lorsque l'utilisateur donne une commande, le système de contrôle vocal traite. Si l'ordre donné n'est pas dans l'ensemble des commandes système, il ignore. Au contraire, s'il s'agit d'une commande, le système la connaît et lui assigne un code.

La commande codée, via le port de communication, est envoyée à l'interface de contrôle et aux interfaces au système de décodage. Cela décode et active les éléments nécessaires pour exécuter la commande.

Dans certains cas, lorsque la commande a été exécutée, les capteurs du système envoient une réponse au système de codage. Cela code la réponse et l'envoie au système de contrôle via l'interface. Le système de contrôle exécute la commande et est prêt à recevoir la commande suivante.

Système de commande vocale

Ce composant du système contrôle les commandes vocales en utilisant le langage de contrôle du système. Comme dans n'importe quel langage, la définition du langage de contrôle requiert deux ressources : le vocabulaire (les mots du langage) et la grammaire (les règles du langage).

Dans le cas de ce système, tant pour le développement du système vocal que pour la définition du vocabulaire et de la grammaire, l'outil logiciel a été utilisé pour le développement d'applications de reconnaissance vocale du Software Development Kit (SDK) du ViVoice de l'IBM. Cet outil utilise le moteur de connaissance ViVoice pour contrôler n'importe quel langage défini.

Nous analysons ensuite la définition du langage de contrôle (vocabulaire et grammaire) à l'aide du logiciel SDK ViVoice.

Création de langage de contrôle

Le vocabulaire d'un système de reconnaissance de la parole est formé de mots capables de comprendre les systèmes (par exemple, dans le système AHOTSDOMO: 'piztu', 'argia' ...). D'autre part, la grammaire du système définit les ensembles de phrases que le système peut comprendre (par exemple: 'Allume la lumière', 'Allume le lieu la particule claire'...).

Les définitions de grammaire et de vocabulaire doivent être exhaustives et doivent être conçues selon un certain nombre de critères linguistiques permettant un bon fonctionnement du système :

  • Utilisation confortable. La grammaire doit être confortable pour l'utilisateur, simple à utiliser et à mémoriser le langage habituel. Dans la mesure du possible, des phrases courtes et un vocabulaire commun et réduit seront utilisés.
  • Flexibilité. L'ensemble des instructions que l'utilisateur peut utiliser doit être large.
  • Différence significative entre les mots du dictionnaire. L'utilisation de mots pas très semblables dans la composition du dictionnaire est indispensable pour que le mélange du système soit peu probable.
Figure . Panneau de commande du système AHOTSDOMO.

Dans le cas du système AHOTSDOMO, un dictionnaire de 18 mots a été utilisé et une grammaire très simple et simple a été conçue pour contrôler les éléments de base du logement.

Pour exprimer la grammaire, nous avons la forme Backus-Naur ou grammaire BNF. La syntaxe et la notation du langage à utiliser sont décrites. Parmi ce type de grammaires BNF se trouve un type adapté à la connaissance de la parole, le Langage de Contrôle pour la Connaissance de la Parole (Speech Recognition Control Language SRCL). Pour définir la grammaire du système AHOTSDOMO, la notation de la grammaire SRCL-BNF a été utilisée.

Les règles de production du système sont les suivantes (éléments de la grammaire ", """ ont été indiqués entre les symboles, "" éléments qui ne peuvent pas être utilisés simultanément; et "?" avec le symbole apparaissent des éléments optionnels) (Figure 2).

L'ensemble des phrases acceptées est large et offre à l'utilisateur flexibilité et facilité. Exemples de phrases acceptées par le système sont:

  • "Ouvrir la fenêtre de cuisine", "Ouvrir la fenêtre".
  • "Allume la lumière de la cuisine", "Allume la lumière".
  • "Branchez la première fiche", "Branchez la fiche".

Adéquation du SDK de ViVoice d'IBM pour le basque

ViVoice

Le logiciel SDK peut être configuré pour plusieurs langues. Malheureusement, l'euskera n'est pas encore parmi eux. Cependant, il a un outil utile pour introduire un nouveau dictionnaire : un outil pour ajouter du vocabulaire. Ceci sert à définir de nouveaux mots pour employer les moteurs de Via-Voice d'IBM. Dans cet instrument, le mot n'est pas seulement orthographiquement, mais aussi phonétiquement. Il s'agit donc d'une opportunité imbattable de définir des mots en basque en utilisant la phonétique castillane. Le tableau 1 montre le rapport de commande que le système utilise en basque.

Comme vous pouvez le voir dans le tableau ci-dessous, les mots ont été adaptés pour utiliser les moteurs ViVoice. Pour cela, les sons en basque

Des équivalents ont été recherchés parmi les sons du castillan (par exemple : ts = ch , z = s , ge = gue ...). C'est la 'clé' de ce travail, car le coût de développement de ce type d'applications diminue considérablement.

Grâce à cette méthodologie, de nombreuses applications de contrôle peuvent être réalisées en basque. D'une part, parce que les mots en basque et les mots du dictionnaire de ViVoice en espagnol sont très différents (et le mélange entre eux est très petit); d'autre part, parce que dans ces applications la grammaire est composée de mots simples.

Système de contrôle de commande

Comme vu dans le schéma général, l'ordre connu est encodé et envoyé aux éléments de contrôle pour son exécution. Il existe deux types de commandes dans le système :

  1. Éléments du code de contrôle immédiat. Éléments simples: lumières, télévision, etc. L'exécution du précepte ne nécessite pas d'accréditation: "allume la lumière", "connecte la fiche". Le contrôle de ces éléments peut être effectué par deux systèmes:

    a) Protocole X10. C'est le protocole standard utilisé dans la domotique. Le principal avantage de cette méthodologie de codage des commandes est qu'il ne nécessite pas de câblage spécial, car il utilise l'installation électrique comme autoroute de communication pour envoyer et recevoir des

    commandes. b) Microcontrôleur 8051. Le microcontrôleur envoie un signal amplifié pour agir sur l'élément sélectionné.
  2. Éléments de vérification du code. Éléments complexes: volets roulants, portes, etc. Ceux qui, lors de l'exécution de la commande, nécessitent nécessairement un capteur pour répondre au système. Ce contrôle de sécurité est utilisé pour protéger les moteurs associés aux éléments et éviter autant que possible leur détérioration. Par conséquent, dans le cas de ces éléments, le système de reconnaissance des commandes vocales ne traitera pas de nouvelles commandes avant la réception de la réponse des capteurs. Dans ce cas, il existe plusieurs voies de contrôle:

    a) Automate programmable. Cette méthodologie permet de contrôler correctement les éléments complexes.

    b) Microcontrôleur 8051. Dans ce cas, un signal amplifié est envoyé au moteur de l'élément pour son activation ou désactivation.
Panneau de contrôle du système

La figure 3 affiche le panneau de contrôle du système. Le panneau de contrôle est utilisé pour le contrôle du système. Il permet d'effectuer plusieurs tâches:

  • Simulation du système. Dans le panneau de contrôle, vous pouvez voir les endroits et l'état des éléments de la maison que vous contrôlez.
  • Support de l'utilisateur. En haut, le système dispose d'un menu déroulant pour pouvoir consulter les commandes système à tout moment.
  • Contrôle du volume. En bas à gauche se trouve l'outil de contrôle du volume vocal de l'utilisateur.
  • Configuration de communication. En bas à droite se trouve l'outil de configuration du port de communication.
  • Fenêtre de commande. Dans la partie inférieure centrale apparaît la commande qui traite le système.
En regardant vers l'avenir

Le système AHOTSDOMO (système domotique contrôlé par la voix) est né dans le but de faciliter la vie des personnes à mobilité réduite. Même si le système développé n'est qu'un pas en avant, il ouvre un chemin pour contrôler en basque les bâtiments intelligents dans le monde de la Domotique. L'avenir est également encourageant dans ce domaine technologique, tant pour les personnes à mobilité réduite que pour le basque. La porte s'est ouverte pour que nous entrions dans ce monde des rêves et commencions à imaginer un merveilleux avenir sans limites...

Figure . Schéma général du système AHOTSDOMO.
Figure . Règles de production de grammaire du système AHOTSDOMO.
Tableau . Définition de l'ensemble des commandes du système AHOTSDOMO pour le logiciel SDK de ViVoice d'IBM.

Gai honi buruzko eduki gehiago

Elhuyarrek garatutako teknologia