L’évolution de la traduction basque à la lumière de la technologie

2025/06/01 Uxoa Iñurrieta Urmeneta - UEUko GOI institutuko irakasle eta ikertzailea Iturria: Elhuyar aldizkaria

Plusieurs dictionnaires basques, sur papier. ARG Kepa Sarasola/Wikimedia Commons

Essayons, pour un moment, d’imaginer Joannes Leizarraga, au XVIe siècle, dans son travail de confinement de la Bible. Il devait y avoir une plume, un pot d'encre et du papier sur la table, et un rouleau de latin devant lui posé sur une sorte de pupitre. Cinq siècles se sont écoulés depuis la création de ce qui est considéré comme le premier détour en euskara, et les choses ont bien changé, comme elles ont changé !... Mais peut-être que plus d'un lecteur sera surpris si nous lui disons que certains traducteurs encore actifs aujourd'hui n'ont pas fait leurs premières traductions dans des conditions si différentes. En effet, la plupart de ces caractéristiques dont nous avons parlé faisaient partie du quotidien des traducteurs basques jusqu’à il y a une quarantaine d’années : en plus de la traduction, du cahier et du stylo ou du crayon, il n’y avait sur la table que quelques dictionnaires de référence (et ceux-ci, bien sûr, en papier). Ils effectuaient la majeure partie du travail à la main et, après avoir découpé les pages du cahier et avoir terminé le travail, ils utilisaient la machine à écrire pour passer à la version finale.

Si nous devions compter chronologiquement les changements suivants depuis lors, nous devrions inévitablement mentionner plusieurs outils qui ont été des jalons dans la performance des traducteurs: l’ordinateur, le CD, l’Internet... et, bien sûr, les technologies linguistiques qui se sont développées de plus en plus rapidement depuis des décennies. Passons en revue.

Des bureaux physiques aux bureaux virtuels

Les traducteurs travaillaient à peu près comme décrit jusqu'au milieu des années 1980. Au cours de cette décennie, cependant, les ordinateurs personnels sont venus chez nous et j'ai rapidement pris la place parmi les outils de travail de nombreux traducteurs. Il n'est pas surprenant, en effet, qu'il y ait une différence entre travailler sur des feuilles de cahier en forme de croquis et voir toujours clairement à l'écran ce qui est écrit, même si la même phrase a été réécrite quatre ou cinq fois.

La revue de traduction Senez est née à cette époque, en 1984, et a témoigné dès le début des grandes tendances qui se sont manifestées parmi les traducteurs basques. On peut voir, par exemple, que le mot ordinateur a été mentionné pour la première fois en 1985[1] et que l'ordinateur a été mentionné deux ans plus tard[2] comme un «outil utile» pour les travaux de traduction. Au début, il n'était pas à la portée de tout le monde d'avoir un ordinateur à la maison, mais en quelques années, il est devenu non seulement un outil utile (presque) indispensable.

Mots soulignés et consultations immédiates

La transition vers l'écran n'a pas encore été faite par tout le monde et qu'est-ce que c'est, et rapidement d'autres ressources ont commencé à apparaître qui changeraient complètement la performance de travail des traducteurs: les correcteurs orthographiques et, en harmonie avec eux, les dictionnaires électroniques. Xuxen est le premier correcteur orthographique basque[3] et est sorti en 1994 au format disquette. Tous ceux qui travaillent dans le secteur de la rédaction savent parfaitement l'aide qu'ils apportent, car ils attirent l'attention sur ce qu'il faut faire en mettant l'accent sur des mots qui pourraient être mal écrits. Mais Xuxen n'est pas arrivé à n'importe quelle époque : il n'y avait que deux décennies et demie que le basque unifié a été créé et les règles d'écriture étaient encore en cours de consolidation. Ils ont donc été un excellent moyen d'aider les traducteurs (et beaucoup d'autres locuteurs) à diffuser ces règles.

La première version du correcteur orthographique Xux sur la disquette. ARG Ajouter à Ajouté Iñaki Alegria/Wikimedia Commons

Quant aux dictionnaires, le Dictionnaire 3000[4] et le dictionnaire électronique Elhuyar[5] ont été parmi les premiers à apparaître sur CD en 1996. La tâche de consultation a été grandement facilitée : ce que l'on ne pouvait rechercher sur le papier que par l'entrée de vocabulaire, on pouvait maintenant le rechercher par catégorie grammaticale, sous-rubriques et autres caractéristiques, beaucoup plus rapidement qu'auparavant et sans faire défiler les pages.

Un réseau, le monde entier

Cependant, la vague de disquettes et de CD n'a pas duré longtemps: avant l'avènement du nouveau millénaire, Internet a explosé et, en peu de temps, il est devenu le principal support de nombreuses sources d'information. À partir de là, non seulement les correcteurs et les dictionnaires ont commencé à apparaître, mais aussi d'autres ressources linguistiques, y compris des corpus consultables. L'Euskaltzaindia met à disposition un corpus statistique du basque du XXe siècle[6]. L'UPV/EHU propose aujourd'hui le modèle Prosa[7]. Elhuyar et l'équipe de recherche Ixa mettent à disposition le corpus ZT[8] et Corpeus[9]. Pour ainsi dire, les corpus consultables permettent aux traducteurs de faire des recherches dans de grandes collections de textes et ainsi de voir beaucoup d'autres exemples que ceux qui viennent dans les dictionnaires.

On pourrait même citer d’autres ressources créées conjointement avec le début du millénaire, mais apportons au moins deux autres à cette brève révision: Liste de diffusion ItzuL[10] et Euskalbar. [11] La première a été créée par l'association EIZIE en 2004 et a en fait une technologie assez simple derrière elle; une liste de diffusion n'est rien d'autre qu'une liste de diffusion, après tout... Pour les traducteurs, ce n'est pas une mince affaire : s'ils ont des doutes qui ne peuvent être résolus, ils ont le forum à leur disposition et aussitôt commence l'échange d'opinions par e-mail. Le Euskalbar, quant à lui, est un supplément d’installation dans le navigateur, créé en 2006, qui permet d’effectuer des requêtes linguistiques simultanément sur plusieurs supports. Dans la première version, il était possible de faire des recherches dans quatre dictionnaires, mais au fur et à mesure que de nouvelles ressources sont apparues, les tentacules du supplément se sont également élargis. Aujourd’hui, ItzuLe compte plus de 900 abonnés et Euskalbar permet d’accéder à plus de 70 ressources linguistiques, ce qui n’est pas négligeable, n’est-ce pas ?

Exemple d'une requête en dialecte avec les résultats de deux dictionnaires affichés en même temps. ARG Hurree Soir et Soir

Les mémoires extra-cérébrales...

Les mémoires de traduction ont également commencé à pénétrer dans les ordinateurs des traducteurs basques à l’époque du changement de millénaire et, aujourd’hui, il n’y a guère de traducteurs qui n’en utilisent pas. Pour résumer, il existe plusieurs programmes qui stockent les travaux des traducteurs de manière structurée et les convertissent en mémoire, en plaçant les textes des deux langues face à face : divisez la traduction par segment (plus ou moins phrase par phrase) et enregistrent la façon dont l’utilisateur a traduit chacun d’eux.

Mais non seulement cela: non seulement ils se souviennent, mais ils se souviennent aussi. En fait, au fur et à mesure que vous avancez dans le travail, vous cherchez dans les textes que vous avez déjà traduits, et si vous constatez qu'un segment similaire a déjà été traduit, vous montrez la traduction de l'heure comme une suggestion.

En général, les mémoires de traduction (et les glossaires qui les accompagnent, etc.) favorisent la cohérence interne des textes traduits et, si on les place dans la peau de ceux qui traduisent des textes dont les structures sont un peu rigides et répétitives, on comprend aisément pourquoi elles se sont répandues en si peu de temps. Cependant, nous mentirons si nous disons qu'ils sont adaptés à tous les types de travail: par exemple, pour traduire de la poésie, il est évident qu'il serait peu judicieux de traduire le texte en morceaux. Pour cette raison et pour d'autres raisons similaires, ils ont également été critiqués, en particulier parce qu'ils limitent la créativité, car si vous regardez ce qui a déjà été fait, il est souvent difficile de penser à d'autres traductions possibles.

Exemple d'un logiciel de gestion des mémoires de traduction. ARG Hurree Soir et Soir

...et les cerveaux extérieurs à la personne

Et nous arrivons, petit à petit, à l'ère de l'intelligence artificielle, celle d'aujourd'hui. Il convient de noter que les traducteurs automatiques ne sont plus un problème aussi récent (le premier pour la paire linguistique Espagnol-Français, Machin[12] a été créé en 2006), mais dans le cas de l'euskara, ceux qui étaient disponibles jusqu'à récemment n'avaient pas une très bonne qualité et il était presque impensable qu'ils aient jamais été un outil de travail dans notre pays. En 2018, naît Modela, le premier traducteur neuronal basque[13], suivi des actuels traducteurs, dont Elia[14], Traducción[15] et Unido[15]. [16]

On ne peut pas dire que tous les traducteurs sont amateurs (si certains regardaient les mémoires de traduction avec méfiance, les traducteurs automatiques, bien sûr! ), mais ils ont de tels services dans un nombre croissant de services de traduction, le plus souvent intégrés dans les outils de gestion des mémoires de traduction eux-mêmes: la préférence est donnée aux textes déjà traduits par soi-même, mais s’il n’y a pas dans les mémoires de traduction un segment correspondant à celui qui est traduit, la traduction automatique est proposée comme une suggestion.

Interface du traducteur automatique Elia. ARG Elhuyar/Wikimedia Commons.

Quelqu’un pourrait penser à la raison pour laquelle la personne se trouve alors, si les traductions sont générées par un système automatique... Mais, même si quelqu’un a des doutes, précisons que l’intervention de la personne est toujours indispensable dans le processus de traduction et qu’elle le sera si nous voulons que le texte final soit de la plus haute qualité. En effet, ils servent à travailler plus confortablement, oui, mais le travail de correction (ou, comme on dit dans le cas de la traduction automatique, la post-édition) est un travail qui doit être effectué en utilisant tous les sens, afin qu’ils ne s’évadent pas camouflés par des changements de signification parmi des résultats un peu naturels, que le langage dans tout le texte soit cohérent et que, en définitive, toutes les nuances prises en compte par un traducteur professionnel soient correctement prises en compte.

Et à partir de maintenant ?

En tout cas, une chose est claire : la communauté des traducteurs basques a connu d’énormes changements au cours des dernières décennies et a su s’adapter parfaitement à l’époque. Or, si tous ces changements ont été pour le meilleur ou pour le pire... Eh bien, on demande à qui: pour ceux qui aiment jouer avec le langage, peut-être un métier qui a beaucoup de créativité en soi deviendra mécanique et inhumain, tandis que d'autres verront des possibilités de réduire la fatigue mentale et de faciliter les travaux dans les progrès technologiques.

Dans tous les cas, compte tenu de la rapidité des changements, nous devrons continuer à faire preuve de prudence afin de profiter des opportunités qui se présentent, mais aussi de prendre en compte les risques. En effet, c'est une chose de changer avec le temps les tâches qui font partie d'une profession, et c'en est une autre, bien différente, d'accepter une révolution incontrôlée par une obsession aveugle pour les technologies numériques, sans tenir compte des conséquences que cela peut avoir non seulement sur la profession, mais aussi sur l'évolution du basque lui-même, entre autres sur les habitudes d'utilisation et la qualité des textes.

Que dirait Leizarraga s'il levait la tête...

Bibliographie

[1] Ibarzabaleta, A. 1985. “VI été de Saint-Sébastien. Cours». Instinct: revue de traduction et de terminologie, (3), 141-143. https://eizie.eus/eu/argitalpenak/senez/19850901 [2]
Mendiguren, X. 1987. “Les maisons du traducteur en Europe”. Instinct: revue de traduction et de terminologie, (6), 241-243.
[3] Aguirre, E., Gaieté, I., Trop profond, X. Toison, X., Diaz de Ilarraza, A., Homère, M., Sarasol, K. et Urkia, M. 1992. “Sur Xux: a spelling checker/corrector for Basque based on two-level morphology”. Third Conference on Applied Natural Language Processing, 119–125.
[4] Un cinq. 1996. Dictionnaire 3000.
[5] Fondation Elhuyar. 1996. “Dictionnaire électronique Elhuyar”. Elhuyar science et technologie, (114), 44-47.
[6] Euskaltzaindia. 2002. Le corpus statistique de la langue basque du XXe siècle.
[7] Sarasol, I., Salaburu, P., Campo, J. et Zabaleta, J. 2007. Prose Modèle Aujourd'hui (EPG).
[8] Fondation Elhuyar et groupe Ixa. 2006. Corpus Science et Technologie.
[9] Fondation Elhuyar et groupe Ixa 2007. Article détaillé : Internet des Corpus.
[10] Association EIZIE (d.g. ). Liste de diffusion ItzuL.
[11] Euskalbar (consulté le 1er juillet 2024). Wikipédia.
[12] Major, A., Gaieté, I., Diaz de Ilarraza, A., La lave, G., Lersundi, M. et Sarasola, K. 2011. “Machin, an open-source rule-based machine translation system for Basque”. Machine Translation, (25), 53-82.
[13] Etchegoyhen, T., Martinez, E., Sous-partie, A., La lave, G., Joie, I. Cort-es, I., Palace, A., Ellakuria, I., Martin, M. et Calonge, E. 2018. “Neural Machine Translation of Basque”. Proceedings of the 21st Annual Conference of the European Association for Machine Translation, 139-148.
[14] Fondation Elhuyar. 2021. Elia.eus.
[15] Gouvernement basque. 2019. Itzuli.eus.
[16] Vicomtech. 2019. Batua.eus.

 

Gai honi buruzko eduki gehiago

Elhuyarrek garatutako teknologia