}

Tendencias de futuro da web

2012/07/01 Leturia Azkarate, Igor - Informatikaria eta ikertzaileaElhuyar Hizkuntza eta Teknologia Iturria: Elhuyar aldizkaria

O pasado mes de abril tivo lugar en Lyon (Francia) o Congreso WWW2012, que a organización W3C, que define as directrices da web, celebra anualmente. Atendendo á presentación do congreso e aos temas dos workshops, podemos facer una idea da actualidade e retos da web e, por tanto, das tendencias futuras.
400

Un dos temas estrela dos últimos anos é a personalization, é dicir, mostrar a cada usuario da web o seu contido en función dos seus gustos, ideas e afeccións. Isto xa se aplica en moitos lugares. Por exemplo, varios buscadores ofrecen a posibilidade de mostrar resultados personalizados a partir dos nosos históricos de navegación: procuras realizadas previamente, en cal dos resultados desas procuras pulsamos, que contido seleccionamos paira compartilo en redes sociais, etc. Os sitios web e os servizos paira escoitar música, a partir das cancións que escoitamos nós ou os nosos amigos, suxírennos novas cancións que nos gustan. As tendas en liña tratan de igual maneira, baseándose nas nosas compras anteriores ou atendendo ás compras doutros clientes que adquiriron as mesmas que as adquiridas por nós. Tamén algúns medios de comunicación empezaron a mostrar una portada diferente a cada usuario, utilizando a información dos artigos que lemos anteriormente.

En principio, aínda que a personalización parece una boa idea, tamén hai quen cuestiona a súa idoneidade. Nunha conferencia TED realmente recomendable, Eli Parise advirte de que cada un deles corre o perigo de quedar tranquilo na súa propia burbulla, de recibir unicamente información limitada e parcial de todo o que hai no mundo. Antes os medios de comunicación e as cadeas de televisión filtraban a información paira nós, e si só liamos e viamos un tipo de xornais e cadeas de televisión, só recibiamos información unilateral. Internet abriunos a vista, pero agora os filtros de personalización poden danar de novo a diversidade.

Doutra banda, paira poder mostrar un contido personalizado, estas xigantes empresas recollen información sobre nós, o que xera una inquietude pola privacidade entre moitas persoas. É moi interesante a opinión de Tim Berners-Le, inventor da web, e fundador e director de W3C, no seu discurso de entrada en www2012. Na súa opinión, a utilización da información que as empresas teñen sobre nós paira vendela a outros ou paira outros usos incorrectos non é correcta nin debería facerse, pero non cre que esta práctica sexa tan habitual, porque á fin e ao cabo non é a esencia do negocio da maioría das empresas, e quen o fan penaliza os mercados a longo prazo. Non comparte a preocupación dalgúns polo uso de información das empresas sobre nós, se se limita a utilizala paira ofrecer un mellor servizo. Puxo o exemplo dunha tenda de roupa: o vendedor da tenda que compra os pantalóns lembra a talla dos seus pantalóns da anterior vez, sempre sen ter que probar (a máxima de ofrecer un bo servizo sempre foi “coñece ao teu cliente”).

No entanto, considera que os interesados en que as empresas non garden e utilicen a súa información para nada teñen dereito a iso e que as empresas deben respectala, paira o que W3C propón que no protocolo HTTP inclúase un encabezado “do not track” opcional, xa que cando un sitio web reciba una solicitude que o conteña non debería almacenar ningún dato do cliente. Case todos os navegadores xa han implementado esta opción, pero hai que ver se as empresas respectasen...

A defensa da privacidade pode chegar a ser desfavorable. Na Unión Europea, por exemplo, una lei prohibe o almacenamento de cookies (sistema utilizado paira gardar as preferencias do usuario e outras) sen o consentimento do usuario. Sen cookies, non se trata unicamente de que un sitio web non poida personalizarse, nin sequera pode logearse! Segundo esta lei, máis do 90% dos sitios web están ilegalizados. Até o momento, os Estados non fixeron cumprir a lei, pero recentemente permitiron en Gran Bretaña impor multas de até medio millón de libras, e algunhas das súas webs comezaron a realizar una molesta solicitude de autorización de cookies.

Web semántica

Outro tema que se escoita moito nos últimos anos é o da web semántica, e foino tamén no congreso deste ano. Escribímolo respecto diso nos números de maio e xuño de 2009. Trátase dunha web paralela, composta de información estruturada significativa en lugar de texto, a diferenza da textual, máis fácil de entender e tratar adecuadamente as máquinas. Servizos avanzados intelixentes sobre el, proxectos paira extraer contido estruturado do texto, etc. Houbo moitas presentacións deste tipo.

O produto Knowledge Graph, recentemente presentado por Google, baséase tamén na web semántica. Se buscamos una persoa, lugar ou cousa concreta, ademais da lista de páxinas web habituais, mostra una táboa con información estruturada e relacionada.

Trátase dun tema de moda que non cabe dúbida de que nos próximos meses e anos aparecerán moitos servizos deste tipo. Aínda que a verdade é que hai tempo que se está dicindo que o ano no que se vai a explotar a web semántica vai ser o seguinte, e esa explosión non chega, tamén é certo que aos poucos van aparecendo cada vez máis servizos.

Procesamiento da Linguaxe Natural

Una novidade no congreso deste ano foi a gran presenza do Procesamiento da Linguaxe Natural e das tecnoloxías lingüísticas. Estas tecnoloxías que desde fai una década traballamos no Grupo de I+D de Elhuyar, sobre as que falamos con frecuencia neste apartado (corpus, tradución automática, tecnoloxías paira facer mellores buscadores, sistemas de resposta a preguntas, axentes de diálogo...), tiveron tradicionalmente pouco espazo en congresos relacionados coa web e os buscadores. Este tipo de temas tratábanse en congresos relacionados coa lingua ou coas tecnoloxías lingüísticas, pero até agora o mundo da web e dos buscadores non viu a súa necesidade. Trataron moi someramente a lingua: un simple stemming ou matogueira, una simple procura de palabras...

Una das razóns principais do interese actual por estas tecnoloxías é que os métodos anteriores simples culminaron e viron a necesidade de profundar na análise da lingua paira mellorar os resultados. No caso dos buscadores, por exemplo, déronse conta de que paira traducir mellores resultados é necesaria a procura por idioma, a procura multilingüe, a procura de sinónimos ou palabras similares, a análise automática da opinión da xente paira elaborar rankings por ela, o resumo automático, a resposta a preguntas, e técnicas tan profundas como estas.

Outra das razóns é a web semántica, paradoxal. En teoría, coa web semántica, a máquina é capaz de comprender a información estruturada que contén sen necesidade de comprender a linguaxe. Pero paira resolver determinados problemas (por exemplo, paira responder a preguntas expostas polo usuario en linguaxe natural) é necesario desambiguar (coñecer a que obxectos concretos da web semántica refírese a pregunta ou a que propiedades concretas refírese). Ou si dos textos quérese extraer automaticamente contido estruturado na web semántica, son necesarias as tecnoloxías lingüísticas.

Ademais do tres grandes temas mencionados, falouse moito das redes sociais. E web móbil, html5, vídeo, 3D... A web segue tendo moitas posibilidades e camiños paira evolucionar e nos próximos anos estaremos seguros de que esta evolución tan sorprendente.

Gai honi buruzko eduki gehiago

Elhuyarrek garatutako teknologia