Chercher un moyen d’éviter que les modèles audio pour l’apprentissage automatique de l’IA ne soient trompés

Chercher un moyen d'éviter que les modèles audio pour l'apprentissage automatique de l'IA ne soient trompés

Jon Vadillo, dans son bureau à l’Université du Pays Basque. Crédit : Nagore Iraola, UPV/EHU

L’intelligence artificielle (IA) est de plus en plus basée sur des modèles d’apprentissage automatique, entraînés à l’aide de grands ensembles de données. De même, l’interaction homme-machine dépend de plus en plus de la communication vocale, principalement en raison des performances remarquables des modèles d’apprentissage automatique dans les tâches de reconnaissance vocale.

Cependant, ces modèles peuvent être trompés par des exemples « contradictoires » ; en d’autres termes, des entrées intentionnellement perturbées pour produire une prédiction erronée sans que les changements soient remarqués par les humains. « Supposons que nous ayons un modèle qui classe l’audio (par exemple, la reconnaissance de commande vocale) et que nous voulions le tromper ; en d’autres termes, générer une perturbation qui empêche malicieusement le modèle de fonctionner correctement. Si un signal est entendu correctement, une personne est capable pour remarquer si un signal dit « oui », par exemple. Lorsque nous ajoutons une perturbation contradictoire, nous entendrons toujours « oui », mais le modèle commencera à entendre « non » ou « tourner à droite » au lieu de gauche ou de toute autre commande nous ne voulons pas exécuter », a expliqué Jon Vadillo, chercheur au département d’informatique et d’intelligence artificielle de l’UPV/EHU.

Cela pourrait avoir « des implications très sérieuses au niveau de l’application de ces technologies à des problèmes réels ou très sensibles », a ajouté Vadillo. On ne sait pas pourquoi cela se produit. Pourquoi un modèle qui se comporte si intelligemment cesserait-il soudainement de fonctionner correctement alors qu’il reçoit des signaux même légèrement modifiés ?

Tromper le modèle en utilisant une perturbation indétectable

« Il est important de savoir si un modèle ou un programme présente des vulnérabilités », a ajouté le chercheur de la Faculté d’informatique. « Tout d’abord, nous enquêtons sur ces vulnérabilités, pour vérifier qu’elles existent, et parce que c’est la première étape pour éventuellement les corriger. » Alors que de nombreuses recherches se sont concentrées sur le développement de nouvelles techniques pour générer des perturbations antagonistes, moins d’attention a été accordée aux aspects qui déterminent si ces perturbations peuvent être perçues par les humains et à quoi ressemblent ces aspects. Cette question est importante, car les stratégies de perturbation antagonistes proposées ne constituent une menace que si les perturbations ne peuvent pas être détectées par les humains.

Cette étude a examiné dans quelle mesure les métriques de distorsion proposées dans la littérature pour les exemples audio contradictoires peuvent mesurer de manière fiable la perception humaine des perturbations. Dans une expérience dans laquelle 36 personnes ont évalué des exemples contradictoires ou des perturbations audio en fonction de divers facteurs, les chercheurs ont montré que « les métriques utilisées par convention dans la littérature ne sont pas complètement robustes ou fiables. En d’autres termes, elles ne représentent pas de manière adéquate la perception auditive des humains ; ils peuvent vous dire qu’une perturbation ne peut pas être détectée, mais lorsque nous l’évaluons avec des humains, elle s’avère détectable. Nous voulons donc émettre un avertissement qu’en raison du manque de fiabilité de ces métriques , l’étude de ces attaques audio n’est pas très bien menée », a déclaré le chercheur.

En outre, les chercheurs ont proposé une méthode d’évaluation plus robuste qui est le résultat de « l’analyse de certaines propriétés ou facteurs de l’audio qui sont pertinents pour évaluer la détectabilité, par exemple, les parties de l’audio dans lesquelles une perturbation est la plus détectable . » Même ainsi, « ce problème reste ouvert car il est très difficile de proposer une métrique mathématique capable de modéliser la perception auditive. Selon le type de signal audio, différentes métriques seront probablement nécessaires ou différents facteurs devront être pris en compte. Atteindre des mesures audio générales représentatives est une tâche complexe », a conclu Vadillo.


Découverte d’attaques contradictoires universelles pour les classificateurs quantiques


Plus d’information:
Jon Vadillo et al, Sur l’évaluation humaine des perturbations accusatoires audio universelles, Informatique et sécurité (2021). DOI: 10.1016/j.cose.2021.102495

Fourni par l’Université du Pays Basque

Citation: Chercher un moyen d’empêcher que les modèles audio pour l’apprentissage automatique de l’IA ne soient trompés (2022, 6 janvier) récupéré le 6 janvier 2022 sur https://techxplore.com/news/2022-01-audio-ai-machine.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.