Doubler les performances de l’IA de reconnaissance visuelle

Développement d'un réseau de neurones pour l'adaptation environnementale, doublant les performances de l'IA de reconnaissance visuelle

Prof. Sunghoon Im, DGIST (à droite) &AMP ; un étudiant de cours lié à un diplôme, Seunghoon Lee (à gauche). Crédit : DGIST

Le professeur Sunghoon Im, du Département d’ingénierie de l’information et de la communication, DGIST, a développé un module de réseau neuronal d’intelligence artificielle (IA) qui peut séparer et convertir les informations environnementales sous la forme d’images complexes à l’aide d’un apprentissage en profondeur. Le réseau développé devrait contribuer de manière significative aux futurs progrès dans le domaine de l’IA, y compris la conversion d’images et l’adaptation de domaine.

Récemment, l’apprentissage en profondeur, la base de la technologie de l’IA, a été de plus en plus avancé et, par conséquent, des recherches en apprentissage en profondeur sur la création et la conversion d’images ont été activement menées. Les études conventionnelles se sont concentrées sur la recherche d’informations d’image communes dans un domaine, c’est-à-dire un ensemble d’images présentant de multiples caractéristiques similaires. Ainsi, les informations d’image n’ont pas pu être utilisées correctement, limitant les performances des données et des modèles applicables. Une autre limitation est que, du fait que les informations d’image utilisées ont une structure linéairement simple, une seule image convertie peut être obtenue.

L’équipe de recherche du professeur Im a émis l’hypothèse que la structure des informations d’image peut varier en fonction du domaine et que la structure peut ne pas toujours être simple, comme une structure linéaire. L’équipe de recherche a conçu un séparateur qui pourrait clairement diviser les informations d’image en informations de forme globales et informations de style. Sur cette base, ils ont utilisé un poids différent pour chaque domaine afin de refléter la différence entre les domaines. En outre, ils ont développé avec succès une structure de réseau neuronal pour déterminer les informations de style appropriées pour chaque composition d’image en utilisant la corrélation entre les informations d’image séparées.

Développement d'un réseau de neurones pour l'adaptation environnementale, doublant les performances de l'IA de reconnaissance visuelle

Structure de réseau de neurones conçue par l’équipe de recherche du professeur Sunghoon Im à la DGIST. Crédit : Conférence IEEE sur la vision par ordinateur et la reconnaissance de formes

Le réseau de neurones développé présente l’avantage que les conversions d’images peuvent être facilement effectuées pour de nombreux domaines, même avec un seul modèle. Lorsque l’algorithme d’adaptation de domaine développé a été appliqué à un problème de reconnaissance visuelle, la précision a plus que doublé.

Le professeur Im dit que « Dans cette étude, un réseau de neurones qui intègre une nouvelle analyse des informations d’image a été développé, et nous nous attendons à ce que si la technologie pertinente s’améliore un peu plus à l’avenir, elle puisse être appliquée à plusieurs domaines, positivement impactant le développement de l’IA. »

Seunghoon Lee, étudiant en ingénierie de l’information et de la communication, a participé à cette recherche en tant que premier auteur. De plus, l’article a été publié dans le Conférence IEEE sur la vision par ordinateur et la reconnaissance de formes, une revue internationale de premier plan dans le domaine de l’IA, et publiée en ligne le vendredi 25 juin.


L’apprentissage en profondeur améliore la reconstruction d’images en tomographie par cohérence optique en utilisant moins de données


Plus d’information:
Seunghun Lee et al, DRANet : démêler les réseaux de représentation et d’adaptation pour une adaptation inter-domaines non supervisée, Conférence IEEE sur la vision par ordinateur et la reconnaissance de formes (2021). arXiv : 2103.13447 [cs.CV], arxiv.org/abs/2103.13447

Fourni par DGIST (Daegu Gyeongbuk Institute of Science and Technology)

Citation: Doubler les performances de l’IA de reconnaissance visuelle (2021, 6 août) récupéré le 6 août 2021 sur https://techxplore.com/news/2021-08-visual-recognition-ai.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.