Duplication automatique, nouvelle option pour Aditu.eus
Depuis plus de 20 ans, à Elhuyar, nous travaillons sur les technologies de la langue et de la parole pour la langue basque, et nous avons récemment introduit dans la société l'un des exemples les plus significatifs de ce travail. En fait, bien que nous ayons offert ces dernières années, entre autres, des services basés sur nos propres technologies avancées de transcription automatique, de traduction automatique et de synthèse vocale, nous avons intégré cette fois, en combinant toutes ces technologies, l’option de duplication audio ou vidéo entièrement automatique Aditu.eus sur la plate-forme.
Il y a cinq ans, juste à la veille du confinement en raison de la pandémie de COVID-19, nous avons lancé le service Aditu.eus, la première plate-forme basque de transcription et de sous-titrage automatique audio et vidéo fonctionnant en basque ou en espagnol. Depuis lors, nous avons constamment ajouté des fonctionnalités au service Expert : peu de temps après, nous avons ajouté quelques fonctionnalités d'édition avancées ; à l'âge d'un an, nous avons commencé à offrir la possibilité de transcrire du contenu bilingue basque-espagnol et de traduire des sous-titres en utilisant notre plateforme de traduction automatique Elia.eus ; plus tard, nous avons permis la transcription dans quatre autres langues (catalan, galicien, anglais et français)... D'autre part, nous avons lancé le service neuronal TTS au début de 2023, un service de synthèse vocale qui offre plusieurs langues et voix.
Eh bien, en combinant cette technologie de synthèse vocale avec les technologies de transcription et de traduction automatique que vous possédiez déjà, nous avons fait de Aditu.eus une plate-forme de doublage. En téléchargeant un audio ou une vidéo, vous pouvez d'abord lui demander de créer des sous-titres, de traduire des sous-titres et enfin de créer de l'audio à partir de ces sous-titres traduits. Avec seulement trois clics, vous obtenez un doublon audio ou vidéo. Il s'agit de la première plate-forme de duplication automatique du Pays Basque qui fonctionne en six langues: espagnol, français, catalan, galicien et anglais. Nous pouvons dupliquer un contenu audiovisuel à n'importe lequel d'entre eux avec Expert.
Nous avons fait tout cela, comme nous le faisons dans tous nos outils, avec notre propre technologie. En effet, nous avons développé au centre Orai NLP Technologies, créé par Elhuyar, des technologies de transcription, de traduction et de génération de parole Aditu.eus, avec un soin particulier de la qualité des résultats obtenus avec le contenu basque. Hala, bikoizketa-lanak askoz errazago egin daitezke orain, euskaraz ongi dabilen teknologiarekin eta gure konfidentzialtasun-bermearekin.
Sélection de voix, édition...
Le sous-titrage automatique d'un contenu dans Aditu.eus identifie les locuteurs présents et, si nous le voulons, nous pouvons donner un nom à chacun d'eux. Ensuite, lorsque nous allons créer la duplication avec les sous-titres traduits, le système nous demande quelle voix nous voulons utiliser pour chacun de ces orateurs. Nous avons le choix entre des voix masculines et féminines que nous créons, les mêmes voix qui sont offertes dans le service de TTS neuronal.
Mais cela nous permet également d'imiter la voix originale du rapporteur. La technologie qui permet de le faire – c’est-à-dire la technologie qui synthétise la parole en imitant la voix à l’aide d’un petit échantillon de parole (qui peut également être présent dans une autre langue) et d’un texte (bien que le modèle n’ait jamais vu cette voix pendant l’entraînement) – a été créée spécifiquement pour cela.
« Il a de nombreuses applications, telles que des conversations formelles, des documentaires, des voix off, des vidéos d’entreprise ou de marketing, du matériel didactique pour l’éducation... »
D'autre part, nous avons déjà mentionné que la duplication de Aditu.eus peut être créée complètement automatiquement en seulement trois clics. Mais tout comme il peut y avoir des erreurs dans la transcription et la traduction automatique et que la plate-forme vous permet de les corriger manuellement, même dans cette phase finale de la création audio de la duplication, il peut y avoir des erreurs indésirables que nous pouvons éditer. Par exemple, il peut arriver que, pour une raison ou une autre, la traduction d'une phrase soit beaucoup plus longue que l'original. Pour que les audios traduits puissent s'adapter dans le même laps de temps que l'original (parce que d'autres choses sont dites avant et après), il n'y a pas d'autre choix que d'accélérer cette conversation, qui parfois ne s'arrête pas bien. C'est pourquoi, sur l'écran d'édition de la duplication, vous pouvez voir combien de caractères par seconde chaque phrase est lue et aussi si la vitesse a dû être accélérée et combien. Si vous passez par les normes appropriées, il est également indiqué en rouge. Dans de tels cas, nous pouvons raccourcir le texte et recréer l'audio de cette phrase. Ou nous pouvons diviser une phrase et la déplacer dans le temps pour l'adapter aux intervalles de silence à l'intérieur de la phrase et la synchroniser avec le mouvement des lèvres, puis répéter cette phrase.
Pour beaucoup de choses, mais pas pour n'importe quoi
La parole qui se produit en doublant, comme vous le savez si vous avez déjà essayé la plate-forme de TTS neuronal, est de très bonne qualité. Il est conforme aux normes phonétiques, à l'intonation, etc. du basque (ou de la langue correspondante) et semble très naturel (à tel point qu'il ne donne pas de parole synthétique et qu'en écoutant à l'aveugle, nous ne saurions souvent pas si c'est naturel ou synthétique). L'imitation de la voix originale est également de très bonne qualité. Mais un discours d'intonation neutre sans expressivité se produit. Par conséquent, il ne convient pas à certains types de contenu: films, contenus fictifs, podcasts informels et, en général, tout contexte dans lequel la parole n'est pas neutre, sérieuse ou formelle.
Malgré ces limites, il existe également de nombreuses applications Aditu.eus qui peuvent être dupliquées: conversations formelles, documentaires, voix off, vidéos d’entreprise ou de marketing, matériel didactique pour l’éducation... Nous pouvons les dupliquer dans de nombreuses langues très facilement et avec de très bons résultats. Ainsi, nous pouvons élargir la portée de notre contenu et l'étendre au marché mondial, par exemple; ou l'utiliser dans les écoles pour apporter du matériel didactique intéressant en basque; ou pour dupliquer des vidéos créées en basque dans d'autres langues, comme solution provisoire pour les étudiants immigrés qui viennent d'arriver et qui ne maîtrisent pas le basque; et ainsi de suite.
Mais je voudrais conclure en mentionnant un cas réel d'utilisation qui nous réjouit particulièrement. Vous connaissez sans doute l'émission télévisée Technopolis, produite par Elhuyar, avec une édition en basque et en espagnol sur les chaînes ETB1 et ETB2. Eh bien, la plupart des enregistrements se font en deux langues, mais dans les cas où les personnes interrogées ne connaissent pas le basque, elles ne peuvent évidemment s'entretenir qu'en espagnol. Les membres du groupe de travail devaient ensuite procéder eux-mêmes à la transcription, à la traduction et à la duplication. Eh bien, maintenant ils le font en utilisant la duplication automatique Aditu.eus! Dans ces parties, il est indiqué par un symbole et un texte qu'il s'agit d'une voix synthétique. C'est génial, non ?
Buletina
Bidali zure helbide elektronikoa eta jaso asteroko buletina zure sarrera-ontzian







