Datos, datos de felicitación

“Dar e dar datos, temos que alimentar ao monstro nós mesmos?”, preguntoume unha vez un amigo. Ademais da simple pregunta, pareceume unha demanda: en realidade quería dicirme “en que andas, coa escusa de alimentar a intelixencia artificial, menosprezando o traballo dos creadores”. A idea da intelixencia artificial como un monstro tamén tiña importancia na pregunta.

E deume que pensar. A miña amiga debuxoume claramente as dúas partes, nunha delas o emisor de datos, na outra os consumidores de datos que estamos na investigación e desenvolvemento da denominada intelixencia artificial creativa (AAS, polo demais). Para evitar brechas entre as dúas partes, é conveniente aclarar en que consisten os roles e as perspectivas dunhas e outras.

O autor é o propietario da obra que creou, sexa cal for o seu formato, e os dereitos de autor non son susceptibles de alleamento. O autor decide si publicar ou non e, en caso afirmativo, como facelo. No caso de que se opte pola posta a disposición dunha editorial, establécense os dereitos de explotación mediante contrato coa editorial, que contén as condicións das autorizacións de reprodución, distribución e venda da obra. Até aí nada novo.

Estas obras, llamémosles datos, son imprescindibles no desenvolvemento da AAS. Os xigantes tecnolóxicos empezaron a recompilar sistematicamente textos, audios e vídeos para cando nos decatamos diso, e esta recollida non cesou desde entón. É incrible como se ha masificado a recollida de datos. A recollida de datos realízase en calquera momento e desde calquera lugar durante a succión intensiva.

Existe unha gran confusión en canto á legalidade e lexitimidade desta recadación. Para empezar, si publícanse con licenza aberta, supoñamos na web, están dispoñibles e, por tanto, dispoñibles. Nestes casos, o desarrollador de modelos lingüísticos poderá utilizar e publicar devanditos datos, a menos que o titular dos mesmos indique o contrario. En cambio, si publícase con licenzas máis restritivas, pódese denegar a reedición por un terceiro. Pero a pregunta é, poden adestrarse os modelos lingüísticos con estes datos?

Hai razóns de peso para dicir que si. De feito, os modelos lingüísticos non reproducen, distribúen ou venden os datos tal cal. Utilizan os datos. Isto, sendo rigoroso, non é un plaxio ou unha copia. Aí hai unha innovación radical traída pola AAS. Até agora só eramos as persoas as que utilizabamos os datos para vestirnos, e por iso dise que desde o momento en que se publican os datos convértense en coñecemento colectivo. Pois ben, os modelos lingüísticos fan precisamente iso, aproveitar ese coñecemento para construír o modelo matemático que conteñen. Por tanto, non parece existir obxección legal evidente respecto diso. Este enfoque ten forza entre os investigadores e desarrolladores no campo da AAS.

Pero aí hai que destacar que o uso tecnolóxico deste coñecemento colectivo ten tanto valor económico, como se debe xestionar todo isto? Detrás disto está, por suposto, a cuestión da distribución de beneficios, o que require o recoñecemento do traballo dos autores e provedores de datos. Como? É un asunto complexo, demasiado complexo para abordalo neste pequeno intervalo.

O que está claro é que a solución non é pór límites e obstáculos ao coñecemento colectivizado, aos datos que se publicaron. Este comportamento atenta contra os datos e o coñecemento aberto e, en última instancia, prexudica ás linguas pequenas e de escasos recursos.

As linguas como o eúscaro necesitan facilitar o uso dos datos, e optar pola vía das licenzas abertas, para que o que os vascos creamos en euskera quede tamén recollido nos servizos e produtos tecnolóxicos. O que realmente necesitamos é que eses produtos se fagan tamén en eúscaro, nunha linguaxe potente.

Mencionamos a autores, editoriais, recolectores e desarrolladores, pero os usuarios tamén están aí, e na era da AAS os usuarios non son só usuarios, senón que tamén son doantes de datos. Cando facemos consultas, cando aceptamos ou rexeitamos as respostas, estamos a informar. A primeira tarefa é ser consciente diso e a segunda é actuar con responsabilidade.

O meu amigo falábame do medo a alimentar ao monstro. A responsabilidade e o recoñecemento dos creadores son necesarios, si, pero o medo paralizador e a negación de datos non nos traerá ningún beneficio aos vascos.

Buletina

Bidali zure helbide elektronikoa eta jaso asteroko buletina zure sarrera-ontzian

Bidali