Une leçon amère ?
en 2019, Rich Sutton a publié son court essai The Bitter Lesson. Il publia, et émit admirablement quelques opinions de ceux qui pratiquaient l'intelligence artificielle. On devinait ce qu'il avait dit quand il l'avait écrit. La pratique avait déjà montré que nous étions à l'ère du changement profond. La raison de cette agitation n'était pas tant l'originalité des idées émises que le fait que la formulation de ces idées soit si générale et catégorique.
Et qu'est-ce que Sutton soutenait dans ce Bitter Lesson ?
Il a déclaré que les progrès les plus significatifs de l'intelligence artificielle ne provenaient pas de l'imitation de l'esprit humain, mais de l'exploitation des méthodes générales par l'escalade de la puissance de calcul. C'est-à-dire qu'il était préférable d'utiliser des algorithmes de recherche et d'apprentissage généraux sur des machines à haute capacité de calcul plutôt que de faire appel à des connaissances humaines spécialisées. Sutton savait déjà, quand il l'a écrit, que cette affirmation provoquait une frustration chez ceux qui avaient longtemps travaillé sur des recherches minutieuses. C’est pourquoi il l’appela « leçon amère ».
Il avait déjà des exemples. La méthode informatique qu'il a gagnée à Kasparov en 1997 était basée sur la recherche massive et profonde, et non sur la connaissance spécifique des échecs travaillée jusqu'alors par les chercheurs en échecs informatiques.
Cette leçon a été renforcée par l'étude approfondie, où la dépendance à l'égard du savoir humain est encore plus faible. Avec de grands ensembles de données et la capacité de calcul pour les traiter, les processus d'apprentissage généraux servent à diverses tâches. Il s'agit d'un modèle général qui s'applique à de nombreux domaines.
Ce paradigme a également prévalu dans le traitement du langage, ce qui a provoqué une crise dans la linguistique informatique classique. Pourquoi enseigner aux systèmes la morphologie, la syntaxe, etc. ? Pourquoi, s'ils apprennent assez bien des grandes collections de textes sans connaissances linguistiques supplémentaires? Où sont passés ces grêlons qui décomposent la description computationnelle du langage ? Ce qu'est la nostalgie.
Il est vrai, cependant, que certains auteurs ne sont pas tout à fait d'accord avec la leçon de Sutton et, bien que beaucoup la reconnaissent comme un principe d'orientation, ils ne la considèrent pas comme un dogme universel. Trois d'entre elles sont critiquées. Premièrement : le principe de "l'informatique croissante" n'est pas viable, car l'informatique n'est pas une ressource infinie.
Deuxièmement, parce que l'efficacité est importante, il est nécessaire de rechercher le moyen optimal lors de la mise à l'échelle, en équilibrant les données et la capacité du modèle. Troisièmement, bien que les méthodes générales soient puissantes, l'accroissement des connaissances des experts reste bénéfique dans de nombreux contextes, en particulier lorsque les données sont limitées.
Précisément à la suite de cette troisième critique, qu’en est-il des modèles linguistiques qui traitent du basque ? Certains d'entre eux sont en ordre (même s'ils n'ont pas de bascophones dans les groupes de travail), mais on constate également des carences tant dans la qualité de l'euskera que dans l'isle de la culture basque.
Les Basques savent donc comment faire face à la frustration provoquée par la leçon de Sutton : trouvons les chemins de ces systèmes noirs qui dévorent les données pour enrichir notre connaissance.
Buletina
Bidali zure helbide elektronikoa eta jaso asteroko buletina zure sarrera-ontzian