Bikoizketa automatikoa, Aditu.eus-en aukera berria

Badira 20 urte baino gehiago Elhuyarren euskararentzako hizkuntza- eta hizketa-­teknologien inguruan lanean dihardugula, eta berriki lan horren erakusgarri esanguratsuenetako bat gizarteratu dugu. Izan ere, azken urteotan, besteren artean, transkripzio automatikoko, itzulpen automatikoko eta hizketa-sintesiko teknologia aurreratu propioetan oinarritutako zerbitzuak eskaintzen joan bagara ere, oraingoan, horien guztien konbinazioz, audio edo bideoak guztiz automatikoki bikoizteko aukera integratu dugu Aditu.eus plataforman.

Duela bost urte, justu COVID-19aren pandemiagatiko konfinamenduaren bezperan, aurkeztu genuen Aditu.eus zerbitzua, audio eta bideoak automatikoki transkribatzeko eta azpititulatzeko lehen euskal plataforma, euskaraz edo gaztelaniaz funtzionatzen zuena. Geroztik, Aditu zerbitzuan funtzionalitateak etengabe eransten joan gara: handik gutxira zenbait edizio-funtzio aurreratu gehitu genizkion; urte bat betetzean, euskara-gaztelaniako eduki elebidunak transkribatzeko eta —Elia.eus gure itzulpen automatikoko plataforma baliatuta— azpitituluak itzultzeko aukera eskaintzen hasi ginen; geroago, beste lau hizkuntzatan transkribatzea ahalbidetu genuen (katalana, galegoa, ingelesa eta frantsesa)... Bestalde, 2023 hasieran kaleratu genuen TTS neuronala zerbitzua, hainbat hizkuntza eta ahots eskaintzen dituen hizketa-sintesiko zerbitzua.

Bada, hizketa-sintesiko teknologia hori eta jada bazituen transkripzio eta itzulpen automatikoko teknologiak batuta, Aditu.eus bikoizketarako plataforma bihurtu dugu. Audio edo bideo bat igota, azpitituluak sortzeko eska diezaiokegu lehenengo, azpitituluak itzultzeko gero eta, azkenik, itzulitako azpititulu horietatik audioa sortzeko. Horrela, hiru klik soilekin, audio edo bideo bikoiztua lortzen da. Bikoizketa automatikoko Euskal Herriko lehenengo plataforma da, eta sei hizkuntzatan dabil: euskara, gaztelania, frantsesa, katalana, galegoa eta ingelesa. Horietako edozeinetatik edozeinetara bikoiztu dezakegu ikus-entzunezko eduki bat Aditu-­rekin.

Hori guztia egin dugu, gure tresna guztietan egiten dugun bezala, gure teknologia propioarekin. Izan ere, Elhuyarrek sortutako Orai NLP Teknologiak zentroan garatu ditugu Aditu.eus-eko transkripzio, itzulpen eta hizketa-sorkuntzako teknologiak, bereziki zainduz euskarazko edukiekin lortzen diren emaitzen kalitatea. Hala, bikoizketa-lanak askoz errazago egin daitezke orain, euskaraz ongi dabilen teknologiarekin eta gure konfidentzialtasun-­bermearekin.

Ahotsen aukeraketa, edizioa...

Aditu.eus-en eduki bat automatikoki azpititulatzean, bertan dauden hizlariak identifikatzen dira, eta, nahi badugu, horietako bakoitzari izena eman diezaiokegu. Ondoren, itzulitako azpitituluekin bikoizketa sortzera goazenean, hizlari horietako bakoitzarentzat zein ahots erabili nahi dugun galdetzen digu sistemak. Gizonezko eta emakumezkoen ahots batzuk ematen zaizkigu aukeran, guk sortutakoak, TTS neuronalaren zerbitzuan eskaintzen diren ahots berak.

Baina, horrez gain, hizlariaren jatorrizko ahotsa imitatzeko aukera ere ematen digu. Hori egin ahal izateko teknologia —alegia, hizketa-lagin txiki bat (beste hizkuntza batean ere egon daitekeena) eta testu bat emanda ahotsa imitatuz (nahiz eta ereduak entrenamenduan ahots hori inoiz ikusi ez) hizketa sintetizatzen duen teknologia— honetarako berariaz sortu da.

«Aplikazio ugari ditu: elkarrizketa formalak, dokumentalak, off-eko ahotsak, bideo korporatiboak edo marketinekoak, hezkuntzarako material didaktikoak...»

Bestalde, aipatu dugu Aditu.eus-en bikoizketa guztiz automatikoki sor daitekeela hiru klik soil eginez. Baina transkripzio eta itzulpen automatikoan akatsak egon daitezkeen bezala eta plataformak horiek eskuz zuzentzeko aukera ematen duen bezala, bikoizketaren audioa sortzearen azken fase honetan ere nahi ez direnak gerta daitezke, eta horiek editatu ditzakegu. Adibidez, gerta daiteke, dena delakoagatik, esaldi baten itzulpena jatorrizkoa baino dezente luzeagoa izatea. Itzulitako audioak jatorrizkoaren denbora-tarte berean egokitu ahal izateko (aurretik eta ondoren beste gauza batzuk esaten direlako), hizketa hori azkartu beste erremediorik ez dago, eta, batzuetan, ez da ongi gelditzen. Horregatik, bikoizketaren edizio-pantailan, ikus daiteke zenbat karaktere segundoko abiaduran irakurtzen den esaldi bakoitza eta, baita ere, abiadura azkartu behar izan den, eta zenbat. Komeni diren estandarretatik pasatuz gero, kolore gorriz adierazita geratzen da, gainera. Horrelako kasuetan, testua laburtu dezakegu, eta esaldi horren audioa berriz sortu. Edo esaldi bat banatu eta denboran mugitu dezakegu, esaldiaren barneko isiltasun-­tarteei egokitu eta ezpainen mugimenduarekin sinkronizatzeko, eta, ondoren, esaldi hori berriz bikoiztu.

Gauza askotarako, baina ez edozertarako

Bikoizketan sortzen den hizketa, TTS neuronalaren plataforma inoiz probatu baduzu jakingo duzun bezala, oso kalitate onekoa da. Euskararen (edo dagokion hizkuntzaren) arau fonetikoak, intonazioa eta abarrak betetzen ditu, eta oso natural ematen du (hainbeste non ez duen hizketa sintetikoa ematen, eta, itsuan entzunez gero, sarritan, ez genuke jakingo antzematen naturala edo sintetikoa den). Jatorrizko ahotsaren imitazioa ere oso kalitate onekoa da. Baina intonazio neutrodun hizketa sortzen da, adierazkortasunik gabekoa. Beraz, ez da ongi gelditzen zenbait eduki-motatan: filmetan, fikziozko edukietan, podcast informaletan eta, oro har, hizketa neutro, serio edo formala ez den edozein testuingurutan.

Muga horiek gorabehera, dagoenetan ere aplikazio ugari ditu Aditu.eus-eko bikoizketaren aukerak: elkarrizketa formalak, dokumentalak, off-eko ahotsak, bideo korporatiboak edo marketinekoak, hezkuntzarako material didaktikoak... Hizkuntza askotara oso erraz eta emaitza oso onekin bikoiztu ditzakegu. Hala, gure edukiaren irismena handitu dezakegu, eta merkatu globalera zabaldu, adibidez; edo eskoletan baliatu daiteke, material didaktiko interesgarria euskarara ekartzeko; edo euskaraz sortutako bideoak beste hizkuntza batzuetara bikoizteko, iritsi berri diren eta euskara menperatzen ez duten ikasle etorkinentzako irtenbide behin-­behineko gisa; eta horrela beste asko.

Baina bereziki pozten gaituen erabilera-kasu erreal bat aipatuz bukatu nahi dut. Ziurrenik ezagutuko duzue Elhuyarrek ekoizten duen Teknopolis telebista-­saioa, euskarazko eta gaztelaniazko edizio bana duena ETB1 eta ETB2 kateetan. Bada, grabaketa gehienak bi hizkuntzatan egiten dituzte, baina, elkarrizketatuek euskaraz ez dakiten kasuetan, elkarrizketa gaztelaniaz soilik egin beharrean daude, jakina. Gero, lantaldekoek eurek egin behar izaten zuten transkripzioa, itzulpena eta bikoizketa. Bada, orain hori Aditu.eus-eko bikoizketa automatikoa baliatuta egiten dute! Zati horietan, ikur baten eta testu baten bidez adierazten da ahots sintetikoa dela. Itzela, ezta?

Leturia Azkarate, Igor

Informatikaria eta ikertzailea

2003tik Elhuyar Fundazioko Hizkuntza Teknologien I+G sailean egiten du lan, eta beronen arduraduna de 2011z geroztik. Lehenago SOME Software Innovation informatika-enpresa sortu zuen beste bazkide batzuekin batera eta bertan zuzendari teknikoa izan zen. Euskararen normalizazioan diharduen EMUN kooperatiba-elkartean ere aritu zen IKTen arduradun gisa ia bere sorreratik bost urtez.

Informatika eta beste gai batzuei buruzko blog bat du 2004tik eta Elhuyar aldizkarian "Mundu digitala" atalaz arduratzen da 2009tik.

Arrasaten jaioa 1971n, Informatikako Ingeniaritza Teknikoko ikasketak egin zituen Mondragon Unibertsitatean, Informatikako Lizentziatura Toulouseko Université Paul Sabatier-en eta Sistemen Elektronikako Ingeniaritza berriz ere Mondragon Unibertsitatean. EHUko hizkuntza-teknologien inguruko HizTek (Hizkuntza-Teknologiak) eta HAP (Hizkuntzaren Azterketa eta Prozesamendua) masterrak egin ditu eta egun doktoretza egiten ari da "Web-a euskarazko corpus gisa" gaiaren inguruan.

Buletina

Bidali zure helbide elektronikoa eta jaso asteroko buletina zure sarrera-ontzian

Bidali