Nouveaux modèles mathématiques et algorithmes pour un traitement d’image intelligent inspiré du cortex visuel humain

Nouveaux modèles mathématiques et algorithmes pour un traitement d'image intelligent inspiré du cortex visuel humain

Comment l’algorithme change les images pour qu’elles soient «plus belles». Crédit: Pock – TU Graz / ICG

En utilisant le cortex visuel comme modèle dans le cerveau humain, le groupe de recherche dirigé par Thomas Pock, lauréat du prix ERC, a développé de nouveaux modèles et algorithmes mathématiques servant de base à des programmes de traitement d’image plus rapides et plus intelligents.

Notre cortex visuel peut capturer des images et reconnaître des objets en une fraction de seconde, même s’ils sont à peine visibles ou seulement fragmentaires. L’une des raisons de ces performances de pointe fantastiques est l’architecture de couche hiérarchique très efficace du cortex visuel. Il filtre les informations visuelles, reconnaît les connexions et complète l’image à l’aide de motifs familiers. Le processus derrière cela est encore à peine compris dans sa complexité. Il est vrai qu’il existe maintenant des algorithmes d’apprentissage profond qui peuvent égaler ou, dans certains cas, dépasser les performances humaines sur certaines tâches de reconnaissance de formes. Un inconvénient de ces algorithmes, cependant, est qu’il est difficile de comprendre ce qu’ils ont appris, comment ils fonctionnent ou quand ils font des erreurs.

Thomas Pock de l’Institut d’infographie et de vision de l’Université de technologie de Graz (TU Graz) était sur la piste de ces connaissances dans le cadre de son projet ERC Starting Grant HOMOVIS (High Level Prior Models for Computer Vision). Il a travaillé intensivement sur la question de savoir comment les modes connus de fonctionnement du cortex visuel peuvent être calculés à l’aide de modèles mathématiques et transférés vers des applications de traitement d’images. Cinq ans de recherche, 41 publications et un brevet plus tard, le chercheur et son groupe de recherche ont accumulé des connaissances approfondies qui permettent de nouveaux algorithmes de traitement d’image pour une grande variété d’applications.

Suggestions de Wertheimer et Euler

Pock a basé son travail sur les lois de perception de Max Wertheimer. Le principal fondateur de la psychologie de la Gestalt a utilisé ces lois pour essayer d’expliquer le processus de la vision humaine, dans lequel les stimuli et les impressions sensorielles sont assemblés pour former un grand tout. « Les humains peuvent déjà reconnaître correctement des objets partiels ou incomplets sur la base de points uniques ou de contours subjectifs (contours illusoires). Le cerveau humain remplit automatiquement les informations d’image manquantes. Par exemple, en reliant les points via des courbes aussi lisses que possible. », dit Pock. Pock et son équipe ont décrit ce phénomène de recherche de forme pour la première fois à l’aide de modèles mathématiques basés sur les courbes élastiques d’Euler – une équation célèbre du mathématicien Leonhard Euler qui peut être utilisée pour calculer des courbes de courbure minimale.

Nouveaux modèles mathématiques et algorithmes pour un traitement d'image intelligent inspiré du cortex visuel humain

Le portrait d’Albert Einstein a été reconstruit à partir de données incomplètes à l’aide du modèle Elastica. Crédit: Ferdinand Schmutzer, 1921. Domaine public Creative Commons

Représentation dans un espace dimensionnel supérieur

Sur la base des courbes élastiques d’Euler, le groupe de Pock a développé de nouveaux algorithmes pour résoudre certains problèmes de traitement d’image dépendant de la courbure. Par conséquent, la solution est d’autant plus simple que les images (2D) et leurs caractéristiques sont représentées sous forme de points de données dans un espace tridimensionnel. «Dans la troisième dimension, nous obtenons une variable supplémentaire avec l’orientation des bords de l’objet», explique Pock. Ceci aussi est calqué sur la vision humaine et remonte aux travaux pionniers de deux lauréats du prix Nobel, David Hubel et Torsten Wiesel, qui ont établi en 1959 que le cortex visuel est composé de couches sensibles à l’orientation.

D’un point de vue mathématique et informatique, le plus grand avantage de cette imbrication tridimensionnelle est que les problèmes de traitement d’image peuvent être résolus à l’aide d’algorithmes d’optimisation convexe. Dans l’optimisation mathématique, la frontière entre l’optimisation convexe et non convexe est considérée comme la grande barrière qui distingue les problèmes résolubles des problèmes insolubles. «Ainsi, nous sommes assurés de pouvoir calculer la meilleure image pour toutes les images d’entrée données – bien sûr, uniquement par rapport au modèle mathématique utilisé», déclare Pock.

Perspectives d’avenir

Maintenant, Pock et son équipe travaillent sur des modèles améliorés qui combinent les propriétés structurelles connues du cortex visuel avec des algorithmes d’apprentissage en profondeur. L’objectif est de développer des modèles qui fonctionnent aussi bien que les algorithmes actuels d’apprentissage en profondeur, mais qui permettent également une compréhension plus approfondie des structures apprises. Les premiers succès ont déjà été obtenus dans la reconstruction d’images de tomographie par ordinateur et de résonance magnétique. «Avec les algorithmes nouvellement développés, il est maintenant possible de reconstruire des images avec la plus haute qualité malgré moins de données enregistrées. Cela économise du temps et de la puissance de calcul, et donc aussi des coûts», explique Pock.


Maladies cardiovasculaires: un nouveau modèle informatique améliore la thérapie


Fourni par l’Université de technologie de Graz

Citation: Nouveaux modèles mathématiques et algorithmes pour un traitement d’image intelligent inspiré du cortex visuel humain (2021, 1er juin) récupéré le 1er juin 2021 sur https://techxplore.com/news/2021-06-mathematical-algorithms-intelligent-image-human .html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.