}

Tendències de futur de la web

2012/07/01 Leturia Azkarate, Igor - Informatikaria eta ikertzaileaElhuyar Hizkuntza eta Teknologia Iturria: Elhuyar aldizkaria

El mes d'abril passat va tenir lloc a Lió (França) el Congrés WWW2012, que l'organització W3C, que defineix les directrius de la web, celebra anualment. Atesa la presentació del congrés i als temes dels workshops, podem fer una idea de l'actualitat i reptes de la web i, per tant, de les tendències futures.
400

Un dels temes estrella dels últims anys és la personalization, és a dir, mostrar a cada usuari de la web el seu contingut en funció dels seus gustos, idees i aficions. Això ja s'aplica en molts llocs. Per exemple, diversos cercadors ofereixen la possibilitat de mostrar resultats personalitzats a partir dels nostres històrics de navegació: cerques realitzades prèviament, en quin dels resultats d'aquestes cerques hem premut, quin contingut hem seleccionat per a compartir-ho en xarxes socials, etc. Els llocs web i els serveis per a escoltar música, a partir de les cançons que hem escoltat nosaltres o els nostres amics, ens suggereixen noves cançons que ens agraden. Les botigues en línia tracten d'igual manera, basant-se en les nostres compres anteriors o ateses les compres d'altres clients que han adquirit les mateixes que les adquirides per nosaltres. També alguns mitjans de comunicació han començat a mostrar una portada diferent a cada usuari, utilitzant la informació dels articles que hem llegit anteriorment.

En principi, encara que la personalització sembla una bona idea, també hi ha qui qüestiona la seva idoneïtat. En una conferència TED realment recomanable, Eli Parise adverteix que cadascun d'ells corre el perill de quedar-se tranquil en la seva pròpia bombolla, de rebre únicament informació limitada i parcial de tot el que hi ha en el món. Abans els mitjans de comunicació i les cadenes de televisió filtraven la informació per a nosaltres, i si només llegíem i vèiem un tipus de periòdics i cadenes de televisió, només rebíem informació unilateral. Internet ens va obrir la vista, però ara els filtres de personalització poden danyar de nou la diversitat.

D'altra banda, per a poder mostrar un contingut personalitzat, aquestes gegants empreses recullen informació sobre nosaltres, la qual cosa genera una inquietud per la privacitat entre moltes persones. És molt interessant l'opinió de Tim Berners-Lee, inventor de la web, i fundador i director de W3C, en el seu discurs d'entrada en www2012. En la seva opinió, la utilització de la informació que les empreses tenen sobre nosaltres per a vendre-la a uns altres o per a altres usos incorrectes no és correcta ni hauria de fer-se, però no creu que aquesta pràctica sigui tan habitual, perquè al cap i a la fi no és l'essència del negoci de la majoria de les empreses, i els qui el fan penalitza els mercats a llarg termini. No comparteix la preocupació d'alguns per l'ús d'informació de les empreses sobre nosaltres, si es limita a utilitzar-la per a oferir un millor servei. Va posar l'exemple d'una botiga de roba: el venedor de la botiga que compra els pantalons recorda la talla dels seus pantalons de l'anterior vegada, sempre sense haver de provar (la màxima d'oferir un bon servei sempre ha estat “coneix al teu client”).

No obstant això, considera que els interessats en què les empreses no guardin i utilitzin la seva informació per a res tenen dret a això i que les empreses han de respectar-la, per al que W3C proposa que en el protocol HTTP s'inclogui un encapçalat “do not track” opcional, ja que quan un lloc web rebi una sol·licitud que el contingui no hauria d'emmagatzemar cap dada del client. Gairebé tots els navegadors ja han implementat aquesta opció, però cal veure si les empreses respectessin...

La defensa de la privacitat pot arribar a ser desfavorable. A la Unió Europea, per exemple, una llei prohibeix l'emmagatzematge de cookies (sistema utilitzat per a guardar les preferències de l'usuari i unes altres) sense el consentiment de l'usuari. Sense cookies, no es tracta únicament que un lloc web no pugui personalitzar-se, ni tan sols pot logearse! Segons aquesta llei, més del 90% dels llocs web estan il·legalitzats. Fins al moment, els Estats no han fet complir la llei, però recentment han permès a Gran Bretanya imposar multes de fins a mig milió de lliures, i algunes dels seus webs han començat a realitzar una molesta sol·licitud d'autorització de cookies.

Web semàntica

Un altre tema que s'escolta molt en els últims anys és el de la web semàntica, i ho ha estat també en el congrés d'enguany. Ho escrivim sobre aquest tema en els números de maig i juny de 2009. Es tracta d'una web paral·lela, composta d'informació estructurada significativa en lloc de text, a diferència de la textual, més fàcil d'entendre i tractar adequadament les màquines. Serveis avançats intel·ligents sobre ell, projectes per a extreure contingut estructurat del text, etc. Va haver-hi moltes presentacions d'aquest tipus.

El producte Knowledge Graph, recentment presentat per Google, es basa també en la web semàntica. Si hem buscat una persona, lloc o cosa concreta, a més de la llista de pàgines web habituals, mostra una taula amb informació estructurada i relacionada.

Es tracta d'un tema de moda que no hi ha dubte que en els pròxims mesos i anys apareixeran molts serveis d'aquest tipus. Encara que la veritat és que fa temps que s'està dient que l'any en què s'explotarà la web semàntica serà el següent, i aquesta explosió no arriba, també és cert que a poc a poc van apareixent cada vegada més serveis.

Processament del Llenguatge Natural

Una novetat en el congrés d'enguany ha estat la gran presència del Processament del Llenguatge Natural i de les tecnologies lingüístiques. Aquestes tecnologies que des de fa una dècada treballem en el Grup d'I+D d'Elhuyar, sobre les que hem parlat amb freqüència en aquest apartat (corpus, traducció automàtica, tecnologies per a fer millors cercadors, sistemes de resposta a preguntes, agents de diàleg...), han tingut tradicionalment poc espai en congressos relacionats amb la web i els cercadors. Aquest tipus de temes es tractaven en congressos relacionats amb la llengua o amb les tecnologies lingüístiques, però fins ara el món de la web i dels cercadors no ha vist la seva necessitat. Han tractat molt succintament la llengua: un simple stemming o matoll, una simple cerca de paraules...

Una de les raons principals de l'interès actual per aquestes tecnologies és que els mètodes anteriors simples han culminat i han vist la necessitat d'aprofundir en l'anàlisi de la llengua per a millorar els resultats. En el cas dels cercadors, per exemple, s'han adonat que per a traduir millors resultats és necessària la cerca per idioma, la cerca multilingüe, la cerca de sinònims o paraules similars, l'anàlisi automàtica de l'opinió de la gent per a elaborar rànquings per ella, el resum automàtic, la resposta a preguntes, i tècniques tan profundes com aquestes.

Una altra de les raons és la web semàntica, paradoxal. En teoria, amb la web semàntica, la màquina és capaç de comprendre la informació estructurada que conté sense necessitat de comprendre el llenguatge. Però per a resoldre determinats problemes (per exemple, per a respondre a preguntes plantejades per l'usuari en llenguatge natural) és necessari desambiguar (conèixer a quins objectes concrets de la web semàntica es refereix la pregunta o a quines propietats concretes es refereix). O si dels textos es vol extreure automàticament contingut estructurat en la web semàntica, són necessàries les tecnologies lingüístiques.

A més dels tres grans temes esmentats, es va parlar molt de les xarxes socials. I web mòbil, html5, vídeo, 3D... La web continua tenint moltes possibilitats i camins per a evolucionar i en els pròxims anys estarem segurs que aquesta evolució tan sorprenent.

Gai honi buruzko eduki gehiago

Elhuyarrek garatutako teknologia