AskHezi, Hizketa-teknologiak euskararen, haurren hezkuntzaren eta inklusioaren zerbitzura
2025/06/01 Leturia Azkarate, Igor - Informatikaria eta ikertzailea Iturria: Elhuyar aldizkaria
Adimen artifizialak eta hizkuntza- eta hizketa-teknologiek erabilera polemikoak izan ditzakete, baina badituzte aplikazio benetan erabilgarriak, inongo zalantzarik sortzen ez dutenak, hala nola hizkuntza minorizatuei eta irisgarritasunari bideratutakoak. AskHezi proiektuak horiek eta gehiago konbinatzen ditu: teklatuak erabiltzeko arazo motorrak dituzten haurrentzat euskarazko idazlanak diktaketa bidez egin ahal izateko sistema bat garatu da. Proiektuan, elkarlanean aritu dira Euskal Herri osoko zenbait ikastetxe-sare, eta garapena Orai NLP Teknologiak zentroan egin dugu.
Argi dago hizkuntza- eta hizketa-teknologiek asko lagundu dezaketela irisgarritasunean, eta ekarpen handia egin dezaketela aniztasun funtzionala duten taldeen inklusioan. Eta euskarari ere lagundu diezaiokete teknologiok, baldin eta gure hizkuntzarako ere garatzen badira. Elhuyarrek sortutako Orai NLP Teknologiak zentroaren muin-muinean daude bi-biak, euskara eta irisgarritasuna, eta aldizkariko atal honetan lehenago ere sarri izan ditugu aipagai horien inguruan egin ditugun lanak: testuak irakurtzeko zailtasunak dituzten pertsonei, TTS (Text-To-Speech) edo hizketaren sintesiko teknologian oinarrituta, web-edukia irakurri beharrean entzutea ahalbidetzen dieten tresnak, hala nola webguneen barra irakurgailua, Bidaide gida eleaniztun irisgarriak edo Irakurle Digitala; edo entzumen-arazoak dituztenentzat, ASR (Automatic Speech Recognition) edo hizketaren ezagutza teknologian oinarrituta, azpitituluak automatikoki sortzeko Aditu web-zerbitzua.
AskHezi, behar bati erantzuteko proiektua
Aditu zerbitzuak, izatez, bideo edo audio batentzako azpitituluak sortzeaz gain, mikrofonotik esaten zaiona zuzenean transkribatu ere egiten du, hau da, hitz eginez diktatuta idazteko balio du, eta euskaraz oso ongi dabil. Horrekin lotuta, Orai zentrora zenbait eskaera iritsi zitzaizkigun ikastetxe batzuetatik —Euskal Herriko lurralde ezberdinetakoak eta, kasualitatez-edo, oso denbora gutxian—, Adituren berri izan zutela eta ea baliatu zezaketen esku-besoetan mugikortasun-arazoak dituzten haurrek eskolako idazlanak eta testuak idazteko. Jakina, oso pozik hartu genituen eskaerok; zertarako egiten dugu teknologia ez bada euskarari, haurrei eta inklusioari laguntzeko? Baina haurrokin probak egin genituenean, zaplazteko galanta jaso genuen denok: Adituren diktaketak ez du hain ongi funtzionatzen haurren ahotsekin. Izan ere, teknologia horiek sare neuronaletan oinarrituta daude, eta horiek datuekin entrenatuta garatzen dira, kasu honetan audio transkribatuekin; eta entrenamendurako erabiltzen diren audio transkribatuen bildumak helduen grabaketak dira, eta haurren ahotsak ez dira helduenak bezalakoak...
Baina, era berean, argi zegoen zein izan zitekeen konponbidea: transkripzio automatikoko sistema haurren grabaketekin entrenatzea. Gainera, haurren grabaketa horiek lortzen laguntzeko ere prest zeuden ikastetxeak.
Horrela, 2022an partzuergo bat osatu zen Euskal Herriko hiru eremu administratiboetako ikastetxe-sare banarekin: EAEtik, Ikastolen Elkartea; Iparraldetik, Seaskako Integrazio Batzordea; eta Nafarroatik, eskola-sare publikoko ikastetxeen Sortzen elkartea. Lan teknikoa egin eta koordinatzeaz Orai arduratuko zen, eta lan administratiboez eta kudeaketaz Langune hizkuntza-industrien elkartea. Eta helburua, esan bezala, haurrek euskaraz hizketa baliatuta idazlanak egin ahal izateko diktaketa-sistema bat garatzea.
Proiektuak bi urtez jaso zuen Euroeskualdearen Hiritartasuna deialdiko laguntza, eta beste urte batez SPRIko Adimen Artifizial Aplikatua deialdikoa. 2025 urte honen hasieran eman dugu amaitutzat sistemaren garapena, eta jendaurrean aurkeztu genuen martxoaren 20an.
Grabaketak: elkarlan ikaragarria
AskHezi proiektuak, bi urte pasatxoan, hainbat fase izan ditu. Horietako luzeena (ia proiektuak adina iraun duena) eta kide guztien parte-hartze handia eskatu duena grabaketena izan da. Hartan, lehenbizi grabaketak egin ahal izateko web-plataforma bat garatu zuen Oraik. Plataforma horrek ahalbidetzen zuen haur batek erakusten zitzaion esaldi bat irakurtzean grabatuta geratzea eta grabaketen bildumara bidaltzea.
Ondoren, partzuergoko kide bakoitzak bere sareko ikastetxeetan zabalkundea egin zuen, eta 50 bat zentrok parte hartzea lortu zuten. Horietako bakoitzean, hainbat haur, familia eta irakasle agertu ziren prest laguntzeko. Gurasoek baimenen dokumentuak sinatu behar izan zituzten, datuen babeserako eta pribatutasunerako legeak behartuta. Eta irakasleen edo gurasoen laguntzarekin, batzuetan ikastetxeetan eta beste batzuetan etxean, 480 bat haurrek 150 esaldi inguru grabatu zituzten bakoitzak. Guztira 70.000 grabaketa baino gehiago egin ziren, eta entrenamendurako baliagarriak izango ziren 100 audio-ordu inguru lortu ziren. Ikaragarrizko esfortzua egin dute proiektuko kide denek fase horretan, eta lortutako emaitzak ere halakoak izan dira.
Garapena: diktaketa- eta zuzenketa-sistemak
Grabaketa-prozesuaren amaierara itxaron gabe, eta harekin batera —gutxieneko grabaketa-kopuru bat lortu ondoren—, garapenari ekin genion Orai zentroan. Lehenengo fasea izan zen haurren ahotsetara egokitutako transkripzio automatikoko ereduak entrenatzea. Eredu ezberdinak probatu dira, hala nola Kaldi eredu modular klasikoagoa eta Whisper end-to-end eredu integrala. Bietan lortu dira hobekuntzak, hau da, biekin lortu da haurren ahotsak hobeto transkribatzea, eta Whisper-en emaitzak hobexeagoak dira. Ondoren, bi kasuetan, transkripzioa zuzenean eta ia denbora errealean egiteko modua ere garatu da. Gainera, zenbakiak, datak, siglak eta antzekoak euren idatzizko forma naturalean idazteko modua ere jarri da (“2025” eta ez “bi mila eta hogeita bost”, “EAJ” eta ez “e a jota”...).
Hurrengo egin beharrekoa zuzenketak egin ahal izateko sistema bat inplementatzea izan da. Izan ere, diktaketa-sistema automatiko oso-oso ona eginda ere, beti egingo ditu akatsen batzuk, eta haurrek ere okerrak egingo dituzte batzuetan sistemari diktatzen ari direnean. Baina akats horiek ere hizketa bidez zuzentzeko bidea eman behar zen, teklatua baliatu gabe. Hala, ohiko zuzenketa-komandoak ulertu eta egiteko bidea inplementatu da: “joan bi hitz ezkerrera”, “ezabatu eskuineko bost karaktereak”, “aukeratu ezkerreko esaldia”, “kopiatu”, “desegin”...
Edozein modutan, ikusi zen gaizki transkribatutako hitz batzuk, ezabatuta eta berriz saiatuta ere, gaizki transkribatzen zituela behin eta berriz (adibidez izen berezi batzuk, bereziki atzerrikoak), eta hori konpontzeko bide bakarra letreiatzeko aukera ematea izan da. Baina konturatu ginen sistema automatiko horiek nahastu egiten zirela silaba bakarreko letren letreiatzearekin (“e”, “be”, “de”, “ge”, “pe”, “te”...). Guri ere gertatzen zaigu, eta telefonoz nortasun-agiriaren letra ematean horregatik esaten ditugu “Bilboko be” bezalakoak, eta horregatik asmatu ziren aspaldi irrati-komunikazio militarretarako irrati-alfabetoa edo bestelako letreiatze-alfabetoak. Eta gure kasuan ere letreiatze-alfabetoa eskaintzea izan da soluzioa, ahalik eta aukera gehienak emanez: letra bakoitza modu normalean esan daiteke (“a”, “be”, “ce”...), hegazkinen nazioarteko alfabetoa erabiliz (“alfa”, “bravo”, “charlie”...), Xabier Artolak proposatutako letreiatze-alfabeto euskalduna erabilita (“Araba”, “Baiona”...) edo beste hainbat euskal herriren izenen bidez (“Bilbo”, “Bizkaia”...).
AskHezi sistema osoa web-interfaze baten bidez eskaintzen da, zeinean grabaketa hasteko botoia sakatu ondoren haurrak esaten duen guztia idazten joango den kutxa batean; edozein momentutan pasatu daiteke zuzenketak egitera edo letreiatzera, eta edozein momentutan itzuli diktaketara, idatzi nahi genuen testua osatu arte.
Hedapena: oraindik egiteko
AskHezi proiektuan zehar garatutako diktaketa-sistemarekin oso gustura gaude partzuergoko kide guztiok, eta uste dugu sistema oso baliagarria izango dela aniztasun funtzionala duten haurrentzat; eta ez guk soilik, baita eskaerarekin etorri ziren haurren gurasoek ere —lehenbailehen baliatzen hasteko gogoa azaldu dute berriz ere—.
Alabaina, hor dugu hurrengo koska. Sare neuronaleko teknika modernoenak erabiltzen dira AskHezi diktaketa-sisteman eta, dakigun bezala, horrelako sistemek baliabide-eskakizun handiak dituzte. Ez dira ordenagailu normaletan martxan erraz jartzeko modukoak, zerbitzari ahaltsuetan jarri behar izaten dira martxan, eta zenbat eta aldibereko erabiltzaile gehiago, orduan eta zerbitzari ahaltsuagoak behar dira. Eta zerbitzari horiek oso garestiak izaten dira.
Beraz, orain esku artean dugun erronka da ikustea ea nola ordaindu ditzakegun zerbitzarien eta horien mantentze-lanen kostuak, edo baliatu ditzakegun erakunde publikoen zerbitzariak. Administrazio ezberdinetako hezkuntza-sailei AskHezi erakusten ari gara, eta oso harrera eta jarrera ona sumatzen dugu. Ea gai garen orain ere elkarlanaren bidez ahalik eta azkarren AskHezi euskarazko diktaketa-sistema martxan jartzeko eta horrelako baten beharra duten Euskal Herri osoko eta edozein saretako haur guztiek baliatzeko.

Gai honi buruzko eduki gehiago
Elhuyarrek garatutako teknologia