Duplicació automàtica, nova opció d'Aditu.eus
Des de fa més de 20 anys treballem en Elhuyar en tecnologies de la llengua i la parla per al basc, i recentment hem socialitzat una de les mostres més significatives d'aquest treball. De fet, encara que en els últims anys hem anat oferint, entre altres coses, serveis basats en tecnologies avançades pròpies de transcripció automàtica, traducció automàtica i síntesi de veu, en aquesta ocasió hem integrat en la plataforma Aditu.eus la possibilitat de duplicar àudio o vídeo de forma totalment automàtica, mitjançant una combinació de totes elles.
Fa cinc anys, just en la vespra del confinament per la pandèmia de la COVID-19, presentem el servei Aditu.eus, la primera plataforma basca de transcripció automàtica i subtitulat d'àudios i vídeos, que funcionava en basc o castellà. Des de llavors, hem anat incorporant funcionalitats de forma continuada en el servei d'Expert: poc després li afegim algunes funcions d'edició avançades; en complir un any, comencem a oferir la possibilitat de transcriure continguts bilingües basc-castellà i –utilitzant la nostra plataforma de traducció automàtica Elia.eus– traduir subtítols; més tard, vam poder transcriure'ls en altres quatre idiomes (català, gallec, anglès i francès)... D'altra banda, a principis de 2023 llancem el servei TTS neuronal, un servei de síntesi de parla que ofereix diversos idiomes i veus.
Doncs bé, sumant aquesta tecnologia de síntesi de parla i les tecnologies de transcripció i traducció automàtiques que ja tenia, l'hem convertit en una plataforma de duplicació Aditu.eus. Pujant un àudio o vídeo, podem demanar-li que creï subtítols primer, traduir subtítols cada vegada i finalment generar àudio d'aquests subtítols traduïts. D'aquesta manera, amb només tres clics, s'obté àudio o vídeo duplicat. Es tracta de la primera plataforma de doblatge automàtic d'Euskal Herria, i està disponible en sis idiomes: basc, castellà, francès, català, gallec i anglès. Amb Expert podem duplicar un contingut audiovisual a qualsevol d'ells.
Hem fet tot això, com fem en totes les nostres eines, amb la nostra pròpia tecnologia. De fet, en el centre Orai NLP Teknologia creat per Elhuyar hem desenvolupat les tecnologies de transcripció, traducció i creació de la parla en Aditu.eus, cuidant especialment la qualitat dels resultats que s'obtenen amb els continguts en basc. Hala, bikoizketa-lanak askoz errazago egin daitezke orain, euskaraz ongi dabilen teknologiarekin eta gure konfidentzialtasun-bermearekin.
Selecció de veus, edició...
En subtitular automàticament un contingut en Aditu.eus, s'identifiquen els conferenciants presents i, si volem, podem donar nom a cadascun d'ells. A continuació, quan crearem el doblatge amb els subtítols traduïts, el sistema ens pregunta quina veu volem utilitzar per a cadascun d'aquests oradors. Se'ns dona a triar entre diverses veus masculines i femenines, creades per nosaltres, les mateixes que s'ofereixen en el servei de TTS neuronal.
Però també ens permet imitar la veu original de l'orador. La tecnologia per a poder fer-ho —és a dir, una petita mostra de parla (que pot estar també en un altre idioma) i la tecnologia que sintetitza la parla imitant la veu (encara que el model mai vegi aquesta veu en l'entrenament) donant un text— ha estat creada específicament per a aquest propòsit.
«Té múltiples aplicacions: entrevistes formals, documentals, veus en off, vídeos corporatius o de màrqueting, materials didàctics per a educació...»
D'altra banda, ja hem esmentat que la duplicació d'Aditu.eus pot generar-se de forma totalment automàtica amb només tres clics. Però així com pot haver-hi errors en la transcripció i traducció automàtica i la plataforma permet corregir-los manualment, també poden ocórrer els no desitjats en aquesta última fase de la generació d'àudio del doblatge, que podem editar. Per exemple, pot ocórrer que, per la raó que sigui, la traducció d'una frase sigui bastant més llarga que l'original. Per a poder adaptar els àudios traduïts en el mateix interval de temps que l'original (perquè es diuen altres coses abans i després), no hi ha més remei que accelerar aquest parla i, a vegades, no queda bé. Per això, en la pantalla d'edició del doblatge es pot veure a quants caràcters per segon es llegeix cada frase i també si hi ha hagut que accelerar la velocitat i quant. Si es passa pels estàndards recomanats, a més queda indicat en color vermell. En aquests casos, podem resumir el text i tornar a crear l'àudio d'aquesta frase. O podem distribuir i desplaçar una frase en el temps per a adaptar-la als espais de silenci que hi ha dins de la frase i sincronitzar-la amb el moviment dels llavis i després tornar a duplicar-la.
Per a moltes coses, però no per a tot
La parla que es produeix en el doblatge, com vostè sabrà si alguna vegada ha provat la plataforma de TTS neuronal, és de molt bona qualitat. Compleix amb les normes fonètiques, l'entonació, etc., del basc (o de la llengua corresponent) i el dona molt natural (tant que no proporciona una parla sintètica, i si se sent cegues moltes vegades no sabríem si és natural o sintètic). La imitació de la veu original també és de molt bona qualitat. Però es produeix una parla amb entonació neutra, sense expressivitat. Per tant, no queda bé en uns certs tipus de contingut: pel·lícules, continguts ficticis, pòdcasts informals i, en general, qualsevol context en el qual la parla no és neutra, seriosa o formal.
Malgrat aquestes limitacions, la possibilitat del doblatge en Aditu.eus també té múltiples aplicacions en les existents: entrevistes formals, documentals, veus en off, vídeos corporatius o de màrqueting, materials didàctics per a educació... Podem doblegar a molts idiomes molt fàcilment i amb molt bons resultats. Així, podem ampliar l'abast del nostre contingut i ampliar-lo al mercat global, per exemple, o bé utilitzar-lo a les escoles per a traduir al basc material didàctic d'interès, o doblegar els vídeos generats en basc a altres idiomes, com a solució provisional per als alumnes immigrants nouvinguts i que no dominen el basc, i així molts més.
Però vull acabar esmentant un cas real d'ús que ens alegra especialment. Segurament coneixereu el programa de televisió Teknopolis, produït per Elhuyar, que inclou edicions en basca i castellà en ETB1 i ETB2. Doncs bé, la majoria de les gravacions són bilingües, però, evidentment, en aquells casos en els quals els entrevistats no saben basc, l'entrevista s'ha de fer exclusivament en castellà. Després, la transcripció, traducció i doblatge era tasca dels propis membres de l'equip de treball. Perquè ara ho fan aprofitant el doblatge automàtic d'Aditu.eus! En aquestes parts s'indica mitjançant un símbol i un text que es tracta d'una veu sintètica. Enorme, no?
Buletina
Bidali zure helbide elektronikoa eta jaso asteroko buletina zure sarrera-ontzian







