2019an argitaratu zuen Rich Suttonek The Bitter Lesson saiakera laburra. Argitaratu bazuen argitaratu zuen, bai ederki inarrosi ere adimen artifizialean zihardutenen zenbait uste. Esan zituenak sumatzen ziren idatzi zituenerako. Ordurako praktikak erakutsia zuen aldaketa sakonaren aroan geundela. Astinduaren zergatia ez zen horrenbeste jaulkitako ideien originaltasuna, baizik eta ideia horien formulazioa hain orokorra eta kategorikoa izatea.
Eta zer argudiatu zuen, bada, Suttonek delako The Bitter Lesson horretan?
Esan zuen adimen artifizialak izandako aurrerapen esanguratsuenak ez zirela giza adimena imitatzetik etorri, baizik eta konputazio-ahalmena eskalatuz metodo orokorrei probetxua ateratzetik. Alegia, giza jakintza espezializatua baliatzea baino, hobe zela bilaketa- eta ikasketa-algoritmo orokorrak erabiltzea konputazio-ahalmen handiko makinetan. Suttonek bazekien idatzi zuenerako baieztapen horrek frustrazioa eragiten zuela luzaz ikerketa-lan xehean aritutakoengan. Horregatik deitu zion “lezio mingotsa”.
Adibideak bazituen ordurako. Kasparovi 1997an irabazi zion konputagailuaren metodoa bilaketa masiboan eta sakonean oinarritzen zen, eta ez xake konputazionaleko ikertzaileek ordura arte landutako xakearen ezagutza espezifikoan.
Lezio hori indartzera etorri da ikasketa sakona, non giza jakintzarekiko dependentzia are txikiagoa den. Datu-multzo handiak eta horiek prozesatzeko konputazio-gaitasuna izanez gero, ikaste-prozesu orokorrek hainbat zereginetarako balio dute. Patroi orokorra da eta hala aplikatzen da arlo askotan.
Hizkuntzaren prozesamenduan ere paradigma hori nagusitu da, eta horrek krisia eragin du hizkuntzalaritza konputazional klasikoan. Zertarako irakatsi sistemei morfologiak, sintaxiak eta abarrak? Zertarako, testuen bilduma handietatik aski ondo ikasten badute ezagutza linguistiko gehigarririk gabe? Non geratu dira hizkuntzaren deskribapen konputazionala xehatzeko txingurri-lan haiek? Nostalgia zer den.
Egia da, ordea, zenbait autore ez daudela guztiz ados Suttonen lezioarekin, eta, askok printzipio orientatzaile gisa onartzen badute ere, ez dute hartzen dogma unibertsal gisa. Kritiken artean hiru nabarmentzen dira. Lehena: "konputazio gero eta gehiago" printzipioa ez da bideragarria, konputazioa ez delako baliabide infinitua.
Bigarrena: eraginkortasuna garrantzitsua denez, eskalatzean modu optimoa bilatu behar da, datuak eta ereduaren gaitasuna orekatuta. Hirugarrena: metodo orokorrak ahaltsuak diren arren, adituen ezagutza gehitzea onuragarria da oraindik testuinguru askotan, bereziki datu mugatuak daudenean.
Hain zuzen ere, hirugarren kritika horren haritik, zer gertatzen da euskaraz diharduten hizkuntza-ereduekin? Txukun ari dira horietako batzuk (lan-taldeetan euskaldunik izan gabe ere), baina gabeziak ere antzematen dira, bai euskararen kalitatean bai euskal kulturak duen islan.
Horra, bada, euskaldunok badakigu nola egin aurre Suttonen lezioak eragindako frustrazioari: aurkitu ditzagun bideak gure ezagutzaz aberasteko datu-irensle diren sistema beltz horiek.
Xabier Arregi Iparragirre,