Intelligence artificielle symbolique exacte pour une évaluation plus rapide et meilleure de l’équité de l’IA

échelle de poids

Crédit : Pixabay/CC0 domaine public

Le système judiciaire, les banques et les entreprises privées utilisent des algorithmes pour prendre des décisions qui ont un impact profond sur la vie des gens. Malheureusement, ces algorithmes sont parfois biaisés, affectant de manière disproportionnée les personnes de couleur ainsi que les personnes des classes à faible revenu lorsqu’elles demandent des prêts ou des emplois, ou même lorsque les tribunaux décident quelle caution doit être fixée pendant qu’une personne attend son procès.

Les chercheurs du MIT ont développé un nouveau langage de programmation d’intelligence artificielle qui peut évaluer l’équité des algorithmes plus précisément et plus rapidement que les alternatives disponibles.

Leur langage probabiliste Sum-Product (SPPL) est un système de programmation probabiliste. La programmation probabiliste est un domaine émergent à l’intersection des langages de programmation et de l’intelligence artificielle qui vise à rendre les systèmes d’IA beaucoup plus faciles à développer, avec des succès précoces dans la vision par ordinateur, le nettoyage des données de bon sens et la modélisation automatisée des données. Les langages de programmation probabilistes permettent aux programmeurs de définir plus facilement des modèles probabilistes et d’effectuer des inférences probabilistes, c’est-à-dire de travailler en arrière pour déduire des explications probables des données observées.

« Il existe des systèmes antérieurs qui peuvent résoudre diverses questions d’équité. Notre système n’est pas le premier ; mais parce que notre système est spécialisé et optimisé pour une certaine classe de modèles, il peut fournir des solutions des milliers de fois plus rapidement », déclare Feras Saad, Ph. .RÉ. étudiant en génie électrique et informatique (EECS) et premier auteur d’un article récent décrivant le travail. Saad ajoute que les accélérations ne sont pas négligeables : le système peut être jusqu’à 3 000 fois plus rapide que les approches précédentes.

SPPL donne des solutions rapides et exactes à des questions d’inférence probabilistes telles que « Quelle est la probabilité que le modèle recommande un prêt à une personne de plus de 40 ans ? » ou « Générer 1 000 demandeurs de prêts synthétiques, tous âgés de moins de 30 ans, dont les prêts seront approuvés ». Ces résultats d’inférence sont basés sur des programmes SPPL qui codent des modèles probabilistes des types de candidats probables, a priori, et également de la manière de les classer. Les questions d’équité auxquelles SPPL peut répondre incluent « Y a-t-il une différence entre la probabilité de recommander un prêt à un demandeur immigrant et non immigrant ayant le même statut socio-économique ? ou « Quelle est la probabilité d’embauche, étant donné que le candidat est qualifié pour le poste et appartient à un groupe sous-représenté ? »

SPPL est différent de la plupart des langages de programmation probabilistes, car SPPL permet uniquement aux utilisateurs d’écrire des programmes probabilistes pour lesquels il peut automatiquement fournir des résultats d’inférence probabilistes exacts. SPPL permet également aux utilisateurs de vérifier à quelle vitesse l’inférence sera, et donc d’éviter d’écrire des programmes lents. En revanche, d’autres langages de programmation probabilistes tels que Gen et Pyro permettent aux utilisateurs d’écrire des programmes probabilistes où les seuls moyens connus de faire l’inférence sont approximatifs, c’est-à-dire que les résultats incluent des erreurs dont la nature et l’ampleur peuvent être difficiles à caractériser.

L’erreur provenant de l’inférence probabiliste approximative est tolérable dans de nombreuses applications d’IA. Mais il n’est pas souhaitable que des erreurs d’inférence corrompent les résultats dans les applications de l’IA à impact social, telles que la prise de décision automatisée, et en particulier dans l’analyse de l’équité.

Jean-Baptiste Tristan, professeur agrégé au Boston College et ancien chercheur à Oracle Labs, qui n’a pas été impliqué dans la nouvelle recherche, a déclaré : « J’ai travaillé sur l’analyse de l’équité dans le milieu universitaire et dans des contextes industriels réels à grande échelle. . SPPL offre une flexibilité et une fiabilité améliorées par rapport aux autres PPL sur cette classe de problèmes difficile et importante en raison de l’expressivité du langage, de sa sémantique précise et simple, et de la vitesse et de la solidité du moteur d’inférence symbolique exact. « 

SPPL évite les erreurs en se limitant à une classe de modèles soigneusement conçus qui comprend toujours une large classe d’algorithmes d’IA, y compris les classificateurs d’arbre de décision qui sont largement utilisés pour la prise de décision algorithmique. SPPL fonctionne en compilant des programmes probabilistes dans une structure de données spécialisée appelée « expression somme-produit ». SPPL s’appuie en outre sur le thème émergent de l’utilisation de circuits probabilistes comme une représentation qui permet une inférence probabiliste efficace. Cette approche étend les travaux antérieurs sur les réseaux somme-produit aux modèles et requêtes exprimés via un langage de programmation probabiliste. Cependant, Saad note que cette approche a ses limites : « SPPL est considérablement plus rapide pour analyser l’équité d’un arbre de décision, par exemple, mais il ne peut pas analyser des modèles comme les réseaux de neurones. D’autres systèmes peuvent analyser à la fois les réseaux de neurones et les arbres de décision, mais ils ont tendance à être plus lents et à donner des réponses inexactes. »

« SPPL montre que l’inférence probabiliste exacte est pratique, pas seulement théoriquement possible, pour une large classe de programmes probabilistes », déclare Vikash Mansinghka, chercheur principal au MIT et auteur principal de l’article. « Dans mon laboratoire, nous avons constaté des améliorations de la vitesse et de la précision de l’inférence symbolique dans d’autres tâches d’inférence que nous avons précédemment abordées via des algorithmes approximatifs de Monte Carlo et d’apprentissage en profondeur. Nous avons également appliqué SPPL à des programmes probabilistes tirés de bases de données réelles, pour quantifier la probabilité d’événements rares, générer des données proxy synthétiques en fonction des contraintes et filtrer automatiquement les données à la recherche d’anomalies probables. »

Le nouveau langage de programmation probabiliste SPPL a été présenté en juin à la conférence internationale ACM SIGPLAN sur la conception et la mise en œuvre de langages de programmation (PLDI), dans un article co-écrit par Saad avec le professeur Martin Rinard et Mansinghka du MIT EECS. SPPL est implémenté en Python et est disponible en open source.


La programmation probabiliste fait en 50 lignes de code ce qui en prenait des milliers


Plus d’information:
Feras A. Saad et al, SPPL : programmation probabiliste avec inférence symbolique exacte rapide, Actes de la 42e conférence internationale ACM SIGPLAN sur la conception et la mise en œuvre des langages de programmation (2021). DOI : 10.1145/3453483.3454078

Fourni par le Massachusetts Institute of Technology

Citation: Intelligence artificielle symbolique exacte pour une évaluation plus rapide et meilleure de l’équité de l’IA (2021, 9 août) extraite le 9 août 2021 de https://techxplore.com/news/2021-08-exact-artificial-intelligence-faster-ai.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.