Découvrir les secrets de nos yeux
2012/10/01 Garrote Contreras, Estibaliz - Computer Vision GroupTecnalia Iturria: Elhuyar aldizkaria
La vision artificielle analyse les éléments présents dans une image. Son but est de la connaître, mais de la connaître… pour l'aider. Aider un aveugle à lire la marque de lait qu'il achète, un médecin à avoir une radiographie de meilleure qualité, ou un fabricant de vis afin qu'ils aient une mesure exacte pour qu'un robot l'insère dans une voiture.
Une partie de ce domaine technologique est la connaissance de la couleur. Dans de nombreuses tâches, l'information qui transporte la couleur est indispensable : par exemple, pour connaître le degré de maturité du fruit, si les magazines ont été correctement imprimés ou si les boîtes de boisson ont été correctement lithographiées.
Couleur: Couleur: Couleur:
Lorsque nous travaillons avec des couleurs, nous pensons qu'elles peuvent être facilement évaluées. Nous le faisons à tout moment : nous approchons le cahier rouge ou regardons la voiture bleue. Mais pour un système artificiel ce travail est très difficile. La première difficulté est que les caméras fonctionnent uniquement avec trois couleurs: rouge, vert et bleu; il s'appelle RVB (en tenant compte des mots rouge, vert et bleu en anglais). Et la seconde est que la couleur n'est pas la caractéristique immuable d'un objet. Si nous voyons une feuille de papier au soleil nous semblera blanche, mais si nous regardons dans une pièce avec une lumière rouge nous semblera rouge. En voyant la couleur, la lumière influence beaucoup. Il est également important ce qu'ils ont autour de vous: dans l'image de la page suivante, nous avons deux images de la même couleur entourés de différentes couleurs, nos yeux nous disent que les couleurs du tableau sont différentes.
Afin de déterminer le comportement de la couleur, les chercheurs travaillent depuis longtemps. Newton a fait ses premiers pas, analysant comment la lumière se décomposait en traversant un prisme. Il est suivi par J.C. Maxwell et T. Par exemple, Young a suivi la même ligne, à laquelle nous devons ce que nous savons aujourd'hui sur la couleur, qui est fondamentalement une perception humaine. Autrement dit, la couleur existe parce que nous voyons le monde et associons des couleurs à ce que nous voyons. Il en va de même pour les langues: même si un mot a un son propre, il a du sens parce que nous lui donnons un sens.
Neuroscience
La couleur étant une caractéristique de la perception humaine, nous commençons à analyser comment nous le voyons. Pour cela, il fallait connaître la façon de travailler de notre système visuel. La neuroscience est une discipline qui étudie notre système nerveux et dans laquelle se trouve la vision. Les neurochercheurs partent de différentes approches: biologique, médical, pharmacologique... La neuroscience de calcul étudie la façon de travailler de notre système neurologique pour créer des systèmes artificiels basés sur des systèmes biologiques.
Vision humaine
Les yeux sont l'accès à la vision humaine. Ils sont un trésor, un trésor que nous avons tous, et dès que nous commençons à analyser, nous réalisons la complexité du système. Les humains ont deux yeux avec plus de 100 millions de photorécepteurs (cônes et cannes). Autrement dit, nous avons un appareil photo de 100 mégapixels dans chaque œil, avec des appareils photo numériques actuels entre 5 et 20 mégapixels. Mais nous avons aussi un petit ordinateur: la rétine. Cet ordinateur est composé de 6 couches ordonnées. Chaque couche de la rétine est réalisée par différentes cellules.
Modèle
Pour pouvoir analyser comment les êtres humains travaillent la couleur, nous avons développé un modèle mathématique représentant le fonctionnement de la rétine. Pour la construction de cette structure, nous avons compilé et analysé les données de la recherche anatomique et neurophysiologique. Il commence par la définition de chacune des couches qui composent le modèle. Nous définirons la localisation de chaque cellule de chaque couche pour définir le niveau de couverture et les zones de captage. De plus, les cellules sont connectées à un autre type de cellules, recevant des signaux d'entrée et émettant des signaux de sortie, simulant des connexions dendritiques et axoniques. Enfin, l'intégration des signaux reçus par les cellules et la génération de signaux de sortie par shunts ou connexions unificatrices ont été d'autres domaines que nous avons travaillé.
Pour pouvoir construire le modèle, il est donc nécessaire de déterminer où se trouve chaque cellule, avec quoi et comment elle communique et quel type de travail elle réalise.
Au total, 4 types de cellules et 24 sous-types ont été pris comme modèle. Les canaux de sortie du système sont des cellules ganglionnaires qui, une fois codées les impulsions nerveuses, transmettent l'information par le nerf optique.
Nous avons défini un système qui calcule la couleur d'une image en combinant les canaux d'information générés par chaque groupe de cellules ganglionnées. Pour cela, nous nous sommes basés sur le calcul des attributs de couleurs proposés par la ciecam02 (Commisssion Internationale de l'Eclairage 2002). En unissant le système inventé et le ciecam02a, nous avons obtenu un système bioinspiré capable de distinguer les couleurs de la manière que les gens distinguent. Le modèle de couleur d'une image calcule, pour chaque point, le ton, la blancheur, la luminosité, la saturation, le crome et la chromatique, ainsi que les paramètres de détection d'arêtes, tant en composants chromatiques que non chromatiques. Le modèle mathématique inventé dans le travail de recherche obtient de meilleurs résultats que le dernier modèle proposé par le CII en utilisant les bases de données colorées Munsell. En outre, le modèle CIE est utilisé uniquement avec des échantillons de laboratoire, tandis que le modèle présenté est capable de travailler avec des images réelles. L'image ci-dessus montre les images générées par les différents types de cellules du modèle, ainsi que les caractéristiques de couleur de chaque pixel. Ce système ouvre les portes aux progrès de la vision artificielle et améliore les résultats obtenus jusqu'à présent. Il peut être utilisé à la fois pour améliorer la qualité de vie des personnes et dans l'industrie.
Remerciements: Merci à FUNDACIÓN TECNALIA pour sa collaboration et grâce au GOUVERNEMENT BASQUE pour l'octroi de subventions à travers le programme ETORTEK pour recherches réalisées à l'Institut Technologique du Massachusetts et à l'Université de Cambridge.
Bibliographie Bibliographie
Gai honi buruzko eduki gehiago
Elhuyarrek garatutako teknologia