Un modèle d’IA amélioré pour reconnaître l’expression faciale

Écrit sur tout le visage : un modèle d'IA amélioré pour reconnaître l'expression du visage

Structure du réseau de neurones proposé avec des convolutions séparables en profondeur et des unités résiduelles pré-activées. Crédit : J. Tian et al. doi 10.1117/1.JEI.31.5.051416

En ce qui concerne notre état d’esprit et nos émotions, nos visages peuvent être assez révélateurs. L’expression faciale est un aspect essentiel de la communication non verbale chez l’homme. Même si nous ne pouvons pas expliquer comment nous le faisons, nous pouvons généralement voir sur le visage d’une autre personne ce qu’elle ressent. Dans de nombreuses situations, la lecture des expressions faciales est particulièrement importante. Par exemple, un enseignant peut le faire pour vérifier si ses élèves sont occupés ou s’ennuient, et une infirmière peut le faire pour vérifier si l’état d’un patient s’est amélioré ou s’est aggravé.

Grâce aux progrès de la technologie, les ordinateurs peuvent faire un très bon travail lorsqu’il s’agit de reconnaître les visages. Reconnaître les expressions faciales, cependant, est une toute autre histoire. De nombreux chercheurs travaillant dans le domaine de l’intelligence artificielle (IA) ont tenté de résoudre ce problème en utilisant diverses techniques de modélisation et de classification, y compris les populaires réseaux de neurones convolutifs (CNN). Cependant, la reconnaissance des expressions faciales est complexe et nécessite des réseaux de neurones complexes, qui nécessitent beaucoup de formation et sont coûteux en calcul.

Afin de résoudre ces problèmes, une équipe de recherche dirigée par le Dr Jia Tian de l’Université normale d’ingénierie de Jilin en Chine a récemment développé un nouveau modèle CNN pour la reconnaissance des expressions faciales. Comme décrit dans un article publié dans le Journal d’imagerie électroniquel’équipe s’est concentrée sur la recherche d’un bon équilibre entre la vitesse d’entraînement, l’utilisation de la mémoire et la précision de la reconnaissance du modèle.

L’une des principales différences entre les modèles CNN conventionnels et celui proposé par l’équipe était l’utilisation de convolutions séparables en profondeur. Ce type de convolution – l’opération de base effectuée à chaque couche d’un CNN – diffère de l’opération standard en ce qu’elle traite différents canaux (tels que RVB) de l’image d’entrée indépendamment et combine les résultats à la fin.

Écrit sur tout le visage : un modèle d'IA amélioré pour reconnaître l'expression du visage

Exemples d’images d’ensembles de données FER-2013. Crédit : J. Tian et al. doi 10.1117 / 1.JEI.31.5.051416

En combinant ce type de convolution avec une technique appelée “blocs résiduels pré-activés”, le modèle proposé a pu traiter les expressions faciales d’entrée de manière grossière à fine. De cette manière, l’équipe a considérablement réduit le coût de calcul et le nombre nécessaire de paramètres à apprendre par le système pour une classification précise. “Nous avons réussi à obtenir un modèle avec une bonne capacité de généralisation avec aussi peu que 58 000 paramètres”, a déclaré Tian.

Les chercheurs ont mis leur modèle à l’épreuve en comparant ses performances de reconnaissance des expressions faciales à celles d’autres modèles rapportés dans une salle de classe. Ils ont formé et testé tous les modèles à l’aide d’un ensemble de données populaire appelé “Extended Cohn-Kanade dataset”, qui contient plus de 35 000 images étiquetées de visages exprimant des émotions communes. Les résultats ont été encourageants, le modèle développé par l’équipe de Tian présentant la plus grande précision (72,4 %) avec le moins de paramètres.

“Le modèle que nous avons développé est particulièrement efficace pour la reconnaissance des expressions faciales lors de l’utilisation de petits ensembles de données d’échantillons. La prochaine étape de notre recherche consiste à optimiser davantage l’architecture du modèle et à obtenir une performance de classification encore meilleure”, a déclaré Tian.

Considérant que la reconnaissance des expressions faciales peut être largement utilisée dans des domaines tels que les interactions homme-ordinateur, la conduite sûre, la surveillance intelligente, la surveillance et la médecine, espérons que l’équipe réalisera bientôt sa vision.


Trois modèles de réseaux neuronaux convolutifs pour la reconnaissance des expressions faciales dans la nature


Plus d’information:
Jia Tian et al, Reconnaissance de l’expression faciale dans l’environnement de la classe basée sur le modèle Xception amélioré, Journal d’imagerie électronique (2022). DOI : 10.1117 / 1.JEI.31.5.051416

Citation: Écrit sur tout le visage : un modèle d’IA amélioré pour la reconnaissance de l’expression faciale (2022, 6 juillet) récupéré le 6 juillet 2022 sur https://techxplore.com/news/2022-07-written-ai-facial.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation loyale à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.