Ricardo Baeza-Yates: "Nous analysons l'interaction entre les utilisateurs de Yahoo! et tous les sites Web"
Ricardo Baeza-Yates: "Nous analysons l'interaction entre les utilisateurs de Yahoo! et tous les sites Web"

Il s'agit du premier travail dans lequel l'analyse statistique est réalisée, mais l'objectif n'est pas seulement cela. L'objectif principal est de collecter des données sur le comportement des personnes pour améliorer les recherches futures ou pour trouver d'autres utilisations qui pourraient intéresser. D'une certaine manière, nous employons la sagesse intérieure du comportement des personnes, pour que ces mêmes personnes puissent faire de meilleures recherches à l'avenir.
La seule chose qui change, c'est comment les gens cherchent, quels mots ils utilisent et dans quelle langue ils le font. Dans le cas contraire, les utilisateurs d'un endroit ou d'un autre cherchent des choses similaires; ils leur demandent des choses similaires à Internet. En cela, nous ne sommes pas si différents.
Oui, bien sûr, la tendance est d'augmenter le nombre de langues des recherches. Ce qui se passe, c'est que nous le faisons peu à peu, en commençant par les langues les plus parlantes. Maintenant, les recherches peuvent être faites sur Yahoo! en langues autour de 10 millions de locuteurs, et pas encore.

Le basque a environ un million de locuteurs, donc nous ne sommes pas encore arrivés à offrir la possibilité de faire des recherches uniquement dans cette langue. Mais nous arriverons avant ou après.
Le problème n'est pas que l'information soit objective ou subjective, mais véridique ou non, et cela est directement lié à la personne qui l'a écrite ou à l'entité qui la protège. Les chercheurs fournissent toutes les informations sur le sujet que nous recherchons et essaient de mettre au début les informations les plus pertinentes. Chaque utilisateur choisit ensuite ce qui vaut et ce qui n'est pas. Par exemple, il peut arriver que sur une page d'opinion il y ait des informations très intéressantes et que cela vaut la peine de la lire, même si nous ne sommes pas d'accord avec ce qu'elle dit. Les utilisateurs eux-mêmes indiquent quelles pages sont les plus intéressantes dans la recherche effectuée et les gestionnaires de moteurs de recherche utilisent cette information pour définir l'ordre des résultats.
Aujourd'hui, il est vrai que dans les recherches on recherche des mots; même si on recherche une photo, dans les textes qui accompagnent les photos, ou dans les étiquettes qui ont les photos, les chercheurs recherchent les mots et montrent la photo qui apparaît sur la page. Dans le futur, cependant, il sera possible de remplacer un mot par une photo dans le moteur de recherche ou de rechercher des mots enregistrés dans les vidéos, ainsi que de rechercher des informations dans différents formats. Nous y travaillons.

La vérité est qu'il existe actuellement la possibilité d'effectuer ce genre de recherches. Le problème est qu'ils ont développé très peu et qu'ils ne peuvent pas être utilisés avec l'énorme volume d'informations sur Internet. Si nous faisions une recherche de ce type, nous aurions besoin de beaucoup de temps pour obtenir des résultats, il ne serait pas aussi rapide que les recherches conventionnelles, et les gens sont habitués à cette vitesse normale, ne pas accepter d'attendre. Cependant, je pense que ce type de recherche ne sera jamais aussi rapide que les mots.
Dans tout Yahoo!Research - dans les centres aux États-Unis et que je dirige, au Chili et à Barcelone -, les principales voies d'analyse sont basées sur des recherches. Concrètement, nous réalisons l'exploitation minière de données, c'est-à-dire l'obtention de données sur la structure et l'utilisation des sites Web, le développement de technologies liées à l'apprentissage automatique des ordinateurs, l'amélioration des aspects liés à l'économie d'Internet --enchères, publicité, etc.- et aux expériences des utilisateurs: multimédia, interfaces, mobiles, etc. Autrement dit, nous analysons l'interaction entre tous les sites Web de Yahoo! et les utilisateurs. Nous analysons également la publicité pour savoir comment obtenir la bonne publicité à la bonne personne et au bon moment pour répondre à vos besoins et ne pas déranger.
En outre, nous avons commencé avec un nouveau thème: Nous analysons comment fonctionne un écosystème de personnes travaillant avec Internet. Par exemple, Yahoo! Dans le service appelé Réponses, un utilisateur pose une question et peut être répondu par quelqu'un, puis celui qui a posé la question décide lequel des réponses reçues est le meilleur, mais toute personne qui le lit peut donner son avis. Ainsi, nous analysons l'évolution des sites Web et vérifions quels sont les succès et qui échouent.
Deux sources d'information centrent la recherche. La première source d'information sont les produits offerts par Yahoo!, à savoir, nous cherchons des moyens pour améliorer les produits que nous avons déjà, car il est impératif d'améliorer constamment. D'autre part, nous analysons l'information qui est extraite de tous ces services et produits, pour savoir ce que les gens disent et pensent d'eux, pour trouver des choses nouvelles et des choses que nous ne connaissons pas et que nous n'attendons pas, car avec elles nous pouvons créer un nouveau produit, un service très utile pour les gens.

En dehors du réseau il n'y a pas de facteurs qui conditionnent la recherche, en bref, notre objectif est de créer un site Web capable de répondre aux besoins des gens, ce qui doit être indépendant des facteurs externes.
Non, ce n'est pas possible ou c'est très difficile. Je travaille avec Internet depuis vingt ans ; il y a quatorze ans, j'ai fondé le premier serveur web d'Amérique latine et l'intuition me manque encore. Souvent, l'intuition ne sert pas à prédire ce qui se passera sur le net. Par exemple, si nous reculons plusieurs années et que nous écoutions quelqu'un qui a l'intention de lancer quelque chose comme Wikipedia, nous penserions: "Il est devenu fou, une encyclopédie basée sur la collaboration ne fonctionnera jamais". Et regardez ce qui a été formé.
En outre, de l'extérieur, nous ne connaissons que les sites Web qui réussissent et sont très peu nombreux, et nous ne savons pas qu'il y a eu des centaines de sites Web qui ont échoué, donc nous ne savons pas ce que les gens veulent.
Buletina
Bidali zure helbide elektronikoa eta jaso asteroko buletina zure sarrera-ontzian