Andy Way: "Le plus grand défi de la traduction automatique est la qualité"

Les Anglais ont la réputation d'être un peu fermés sur des sujets linguistiques, ils espèrent qu'ils aillent partout dans le monde et communiquent en anglais. Andy Way est en dehors de ce groupe. L'idée que tout le monde parle la même langue lui semble tout à fait réussie. Il nous a dit "good morning" et nous a salués avec un "bon jour", le reste de la conversation a nécessairement eu lieu en anglais. Bien sûr, nous ne pouvons pas manquer les plaisanteries à ce sujet: un système de traduction automatique de l'anglais et euskera nous faciliterait beaucoup la relation. Ensuite, nous entrons au cœur de la conversation.

Andy Way: "Le plus grand défi de la traduction automatique est la qualité"


Expert en traduction automatique
Andy Way: "Le plus grand défi de la traduction automatique est la qualité"
01/07/2007 Rementeria Argote, Nagore Elhuyar Zientzia Komunikazioa
Andy Way est professeur à l'Université de Dublin et référent en traduction automatique.
N. Forgeron
Nous allons à l'origine de la traduction automatique. Bien sûr, il serait créé pour communiquer des gens de différentes langues.

C'est vrai. Et dans une large mesure, la traduction automatique a également été développé pour des raisons politiques. En un temps, les Américains voulaient savoir ce que les Russes disaient, par exemple. Et aujourd'hui, les États-Unis investissent beaucoup dans le développement de la traduction automatique de l'arabe. En ce sens, c'est une question liée à la sécurité.

Un autre niveau de communication est la communication entre deux personnes. Par exemple, la communication entre nous serait beaucoup plus simple, quand je suis à Dublin et vous ici en Euskal Herria, si vous m'écrivez en basque et je la reçois en anglais via un système de traduction automatique. Je vous répondrais en anglais et vous le recueillerez en basque.

Et ce n'est pas grave si l'anglais n'est pas correct, je comprends. Et la clé est là, pour un anglais qui ne sait pas euskera c'est mieux un anglais mauvais que l'euskera correct, et au contraire, pour un basque qui ne sait pas anglais c'est mieux un euskara malo que l'anglais plus direct. À ce niveau, le plus important est de recevoir le message principal.

Par conséquent, le cadre de croissance de la traduction automatique est basé sur l'individu. Que deux personnes qui ne parlent pas la même langue puissent communiquer entre elles.

Internet a été une grande opportunité dans le domaine de la communication en général, également dans la traduction automatique?

Sans doute. Sur Internet, il existe des systèmes gratuits comme Babel Fish. Ce ne sont pas des systèmes très sophistiqués, mais les gens communiquent dans leur langue grâce à eux. Comme nous l'avons dit, ils sont dévalués et il n'est pas nécessaire de s'inscrire nulle part. Et des millions de fois sont utilisés chaque jour, même si la qualité n'est pas très bonne. Par conséquent, si vous améliorez la qualité de ces systèmes, leur utilisation sera beaucoup plus grande.

Quant à la qualité, à l'autre extrémité se trouve l'Union européenne. J'ai entendu dire qu'ils utilisent très efficacement la traduction automatique.

En Europe, il y a eu un grand changement. Dans les années 80 seulement neuf étaient les langues officielles de l'Union européenne, et sont maintenant plus de vingt. Et dans les yeux de l'Union toutes ces langues sont égales. Par conséquent, ils doivent traduire les documents dans toutes ces langues, et il ya environ 400 couples linguistiques.

(Photo: N. Forge)

Prenons le laiton et le grec. Combien de traducteurs sont capables de traduire entre les deux langues? Beaucoup non. Par conséquent, il n'y a pas assez de traducteurs et ils ont beaucoup de textes à traduire. Car la traduction automatique est très utile pour ces traducteurs.

Dans l'Union européenne, ils disposent d'un système de traduction automatique, appelé SYSTRAN, spécialement conçu pour un usage domestique. Ce n'est pas le même système SYSTRAN qui est en vente dans les magasins, mais ils l'ont conçu et adapté pour une utilisation interne et l'utilisent pour élaborer un premier brouillon de traduction. Par la suite, les traducteurs doivent l'éditer et le corriger. Parce qu'un document à envoyer à des clients ou public doit être sans erreur.

Après tout, on utilise des machines, ce qui a son côté positif: Ils peuvent travailler 24 heures et non traducteurs. L'avantage de ces outils est qu'ils peuvent travailler beaucoup plus vite, mais avec moins de qualité.

Par conséquent, les gens ne devraient pas voir le travail du traducteur humain comme une activité qui vient à remplacer; il est comme tout autre instrument, comme le téléphone, le grille-pain ou la voiture. C'est un outil qui nous aide.

Il existe des groupes de recherche dans le monde entier qui travaillent à améliorer la traduction automatique. Il vous conviendrait de travailler avec d'autres groupes, non ?

Oui, entre autres choses, nous sommes en contact avec l'Université du Pays Basque. Ceux-ci travaillent avec les couples anglais-euskara et espagnol-euskara. Et lentement, nous ajoutons plus de couples linguistiques. Ainsi, nous nous relions à des groupes qui travaillent avec différentes langues, comme l'arabe, le chinois, l'italien, le français, l'allemand, l'espagnol, et maintenant aussi l'euskera.

D'autre part, nous avons un élève travaillant la traduction entre l'anglais et la langue des signes de l'Irlande pour des environnements spécifiques, tels que les aéroports. En fait, dans les aéroports ne mettent pas toutes les informations écrites sur les écrans. Les derniers appels d'embarquement et avis similaires ne sont émis que par les haut-parleurs et les sourds n'entendent pas. Car nous travaillons dans ce type d'environnements.

Si le champ d'application est réduit, indépendamment du couple de langues, la traduction est beaucoup plus simple. Ainsi, si nous nous limitons au domaine de l'aéroport, la plupart des problèmes présentés dans les traductions plus générales sont surmontés.

Quant à la langue, les langues minoritaires présentent des problèmes majeurs. Quelle différence y a-t-il entre les langues avec beaucoup de locuteurs et avec peu de locuteurs ?

La plupart des chercheurs qui travaillent actuellement en traduction automatique sont engagés dans la traduction automatique basée sur corpus (une compilation de textes et de documents). Il faut donc un corpus, surtout un corpus parallèle est nécessaire, c'est-à-dire que cette phrase correspond à cette autre phrase dans l'autre langue. Et il y a un grand corpus parallèle pour certaines langues avec beaucoup de locuteurs. Si vous êtes entre l'anglais et le français, comme les procès-verbaux du Parlement canadien, et pour le chinois anglais, ceux du Parlement de Hong Kong.

Il travaille avec le groupe IXA de la Faculté d'Informatique de l'UPV, Eleka et Elhuyar Fundazioa, entre autres. Dans l'image, Way avec le professeur Kepa Sarasola de l'UPV.
N. Forgeron
Et pour le couple anglais-basque ? Où obtenir le corpus ?

Les techniques de traduction automatique qui sont actuellement utilisées sont valables en principe pour tout couple linguistique, mais en général manquent corpus parallèles pour les langues minoritaires. Dans les langues avec beaucoup de locuteurs, nous avons beaucoup plus de texte et plus de traductions, en espagnol, anglais, français... C'est le plus gros problème des langues minoritaires. Par exemple, pour traduire entre le gaélique et le basque, nous n'avons pas de textes parallèles. Et c'est une grande difficulté.

Donc, quel est le plus grand défi de la traduction automatique aujourd'hui?

Le plus grand défi, sans doute, est la qualité, car en général il n'est pas encore très bon; et, bien sûr, comme nous venons de le mentionner, pour certaines paires de langues ne peut pas être approché par corpus, parce qu'il manque corpus. Par conséquent, l'un des problèmes de traduction est dans la première étape: lors du transfert des ressources existantes.

Je pense que l'un des grands défis de la traduction automatique est d'atteindre les maisons des gens. En fait, à l'université, nous essayons généralement de résoudre des problèmes très difficiles, mais il existe des solutions relativement simples qui peuvent aider dans la vie quotidienne des gens, comme le langage des signes.

Et les gens de la rue ont clairement que la traduction automatique est nécessaire et très utile. D'autres problèmes de linguistique informatique sont très difficiles à comprendre. Mais quiconque sait ce qu'est la traduction et ce qu'est un ordinateur, et que la traduction automatique facilite la communication et est donc nécessaire.

Voyant que la conversation était sur le point de se terminer, Andy Way a voulu ajouter quelque chose: « Au début, nous avons parlé de communication. Je pense que la traduction de la parole viendra bientôt. Dans quelques années, vous me poserez des questions dans votre langue, en basque, et je les entends en anglais. Par conséquent, nous utiliserons la connaissance de la parole (speech recognition) et vous m'écouterez en basque à travers votre ordinateur. Cela va être bientôt, et va supposer une grande avancée, car la parole est beaucoup plus naturel que la communication écrite".

Rementeria Argote, Nagore
Services
233 233
2007 2007 2007 2007
Autres
028 028
Interviews; Informatique; Logiciel
Entrevue Entretien Entretien
Services

Buletina

Bidali zure helbide elektronikoa eta jaso asteroko buletina zure sarrera-ontzian

Bidali

Bizitza