Etorkizunean ahotsak aginduko du
2000/01/01 Kortabarria Olabarria, Beñardo - Elhuyar Zientzia Iturria: Elhuyar aldizkaria
ere badu berea.
Duela hilabete batzuk, euskarazko ahotsen datu-basea eratu nahi zuela eta, Telefonicak 10.000 euskaldunen ahotsak grabatzeko deialdia egin zuen. Horretarako dohaineko telefono-zenbakia jarri zen, eta hara deitzen zuenak ordenagailu batek esaten zituen esaldiak eta zenbakiak errepikatu behar zituen. Ordenagailuak esan behar zuena EHUko Euskal Filologia Departamentuak prestatu zuen, asmo jakin batekin: euskaraz ohiko diren hots guztiak jasotzea. Horretarako, UZEIk emandako makrotestu bat aztertu zen. Proiektuaren arduradunek gutxienez 5.000 dei behar bazituzten ere, 19.000 inguru jaso zituzten, nahiz eta baliagarriak —ordenagailuak esandako guztia errepikatu zutenak— 11.200 izan. EITBk ere hartu zuen parte proiektuan; ordenagailuak esaten zuen guztia hango langileek grabatu zuten, eta ahotsak lortzeko kanpaina ere egin zuen.
Telefono-deietan bildutako informazioa Leioan, Euskal Herriko Unibertsitateko Elektrizitate eta Elektronika Departamentuan, jaso zen. Bildutako informazio digital hura orain prozesatu egin behar da eta gero datu-basea eratuko dute. Eratzen den datu-base hori ahotsaren ezagutzaileekin erabili ahal izango denez, arlo horretan ikerketa egiten jarraitu ahal izango dute. Bere aldetik, Filologia Fakultateak ere aprobetxatu ahal izango du jaso den informazioa gaur egungo euskararen fonologiari buruzko ikerketak egiteko. Uste den bidean aurrera egiten bada, proiektu honi esker laster euskaraz ere zerbitzu berriak eskuratu ahal izango dira: ahotsaren bidezko markazio telefonikoak, kontagailuen teleirakurketa, kreditu-txartelen baliozkotzea, banku elektronikoa, telefono bidezko erosketak….
Mintzo-ezagutza automatikorako sistema
Etorkizuneko kontuak diruditen horiek EHUko Elektrizitate eta Elektronika Departamentuan eguneroko ogi dira, Ahotsaren Ezagutzaren arloko taldeak horretan orduak eta orduak ematen baititu. Ordenagailuak hitz egitera iritsiko dira, badirudi horretan ez dagoela dudarik. Nola mintzarazten zaie, ordea? Nola irakasten zaie?
Gure burmuinak hizkuntzaren arauei jarraituz mezua eratzen du bere baitan. Ondoren, gorputzaren ahotsa sortzeko sistema erabiliz, harmonikotan oso aberatsa den uhina sortzen du; ahots seinalea hain zuzen. Seinale akustiko horrek zenbait ezaugarri ditu: energia, 7-8 kHz-eko maiztasun bandan murrizturik dauden harmonikoak, oinarrizko maiztasuna, etab. Seinale horretan hotsak daude. Hots horiek, hizkuntzaren arauen arabera, unitate lexikoak osatzen dituzte. Hots bakoitzak bere ezaugarri akustikoak ditu. Beraz, ahots-seinalean kodeturik agertzen diren elementu horiek, hotsak eta unitate lexikoak, deskodetu egin behar dira sortutako mezua ezagutzeko.
Ahots-seinalea ordenagailuan erabili ahal izateko, lagindu egin behar da. Horretarako, berez analogikoa den seinalea digital bihurtzen da. Ondoren ahotsak duen informazio erredundantea gutxitzeko seinale digitala parametrizatu egiten da, hau da, seinaletik ezaugarri bereizgarrienak erauzten dira: energia, oinarrizko maiztasuna, maiztasunekiko erlazionaturik dauden zenbait parametro, etab.
Ahotsa ezagutzeko bi teknika erabiltzen dira, bata hitz isolatuetan edo isiluneetan oinarritutakoa da, eta bestea mintzo jarraitua izenez ezagutzen dena da. Bi kasuetan sistemak mezua uler dezan, eredu akustikoez osaturiko deskodifikatzailea eduki behar du: hitz isolatuen kasuan hitzen ereduak erabiltzen dira eta mintzo jarraituaren kasuan, berriz, hotsen eta unitate lexikoen ereduak.
Lehenengo kasuari dagokionez, sistemaren funtzionamendua oso sinplea da: seinalea ikasi diren hitz-ereduekin konparatzen da eta antz handiena duen hitz-eredua aukeratzen da. Mintzo jarraituaren ezagutzan berriz, prozesua bi fasetan banaturik dago: deskodetze akustiko-fonetikoa eta lengoaiaren modelizazioa. Deskodetze akustiko-fonetikoaren fasean ahots-seinaletik hotsen katea lortzen da. Ondoren, lengoaiaren modelizazioaren fasean, unitate lexikoak lortzen dira eta, arau sintaktikoak eta semantikoak erabilita, seinaleak duen mezua deskodifikatzen da. Une horretan jada, ordenagailua hizkuntza ezagutzeko gai da.
Prozesua gauzatzeko zenbait metodo matematiko erabiltzen dira. Eredu akustikoei dagokienez, hurbilketa estruktural-estokastikoak, Markov-en eredu ezkutuak alegia. Bestetik, ereduak ikasteko eta mezua ezagutzeko, beste algoritmoak: Baum-Welch, Viterbi.
Izan ere, sistemak ondo funtziona dezan, hots bakoitza ezagutu behar izaten du. Beraz, hots bakoitzaren lagin desberdinak ikasi behar ditu, pertsona batek eta beste batek sortzen dituen hotsak desberdinak izaten direlako. Horregatik, mintzo-ezagutza automatikorako fase honetan ezinbestekoa da datu-base handia izatea, zenbat eta hiztun gehiago izan hainbat eta ezaugarri gehiago jaso eta ezagutu ahal izango dituelako sistemak. Alegia, sistemak hots bakoitza ezagutu ahal izateko hots bakoitzaren lagin ugari behar izaten ditu.
Euskara berezia?
Orain arte, baita EHUn ere, gehienbat gaztelaniazko ereduekin lan egin da, baina mintzo-ezagutza automatikorako taldearen lanera oreka laster iritsiko da, duela urte batzuetatik hona gehienbat euskararekin ari baitira lanean. Hizkuntzaren ezaugarrien aldetik begiratuta, euskarak izan dezake berezitasunik. "Soinuei dagokienez —dio Karmele Lopez de Ipiñak, Mintzo Ezagutza Automatikorako Taldeko partaideak—, ez du ematen gainerako hizkuntzak baino zailagoa izango denik, horretan ez baitago ezer arrarorik. Lexikoaren aldetik, berriz, euskara berezia da, hizkuntza eranskaria delako. Esate baterako, gaztelaniaz casa hitza guretzat etxe da, baina haientzat de casa dena —hitza ez da aldatzen— guretzat etxekoa da, eta hori hitz berria da. Euskarak etorkizun handia du mintzo-ezagutza automatikoaren alorrean, batez ere bere ezaugarri bereziei esker komunitate zientifikoan sortu duen interesagatik".
Telefonicaren datu-baseak izan du oihartzuna, baina Leioako EHUko Elektrizitate eta Elektronika Departamentuan horrekin batera beste lan batzuk ere egin dituzte, Gasteizko Euskal Filologiaren Departamentuaren laguntzaz eta Eusko Jaurlaritzaren dirulaguntzaz. "Urte asko dira gure taldea euskarazko mintzo-ezagutza automatikorako sistema garatzen hasi zela. Zehazki, bi ahots datu-base diseinatu ditugu: bata aplikazio telefonikoetan erabili ahal izateko eta bestea edozein motatako sistemak garatzeko. Horrekin, datu-base fonetikoei dagokienez, beste hizkuntzekin parekatzea lortu dugu. Munduan alor honetan lanean ari direnei begiratuz gero, esan genezake ez gaudela hain gaizki, pare samarrean gaude".
Gai honi buruzko eduki gehiago
Elhuyarrek garatutako teknologia