Un système d’IA formé pour trouver une politique équitable de distribution des fonds publics dans un jeu en ligne

Un système d'IA formé pour trouver une politique équitable de distribution des fonds publics dans un jeu en ligne

Illustration du jeu et expérience 1. a, Illustration de la configuration du jeu d’investissement. b, Le collecteur idéologique pour la répartition des dotations (10, 2, 2, 2). Le graphique montre une visualisation d’un espace de mécanismes de redistribution défini par les paramètres w et v en deux dimensions. Chaque point rouge est un mécanisme, et les distances entre les points conservent les dissemblances dans le paiement relatif (moyen) aux joueurs virtuels (à la fois tête et queue). Les nombres de points désignent les bacs du paramètre de mécanisme w (1, le plus bas ; 10, le plus élevé) et l’ombrage désigne les bacs de v (clair, plus relatif ; sombre, plus absolu). En médaillon, exemples de paiements aux joueurs de tête (cercles) et de queue (triangles) selon les mécanismes canoniques utilisés comme bases de référence pour tester l’IA. Sous stricte égalitarisme, les paiements diminuent pour les joueurs tête et queue. Sous libertaire, il y a une grande inégalité entre les joueurs de tête et de queue. Dans le cadre de l’égalitarisme libéral, le joueur en tête cesse de contribuer, de sorte que les paiements diminuent pour les joueurs en tête et en queue. c, Contributions relatives moyennes (en tant que fraction de la dotation) sur 10 tours (axe des x) dans Exp. 1 pour trois conditions de dotation initiale différentes. Dans le cadre d’une redistribution égalitaire stricte, les contributions des joueurs de queue (triangles) sont plus élevées lorsque les dotations initiales sont plus faibles, mais les contributions des joueurs de tête (cercles) ne diffèrent pas. Sous libertarien, les contributions des joueurs de tête augmentent avec l’égalité, mais les contributions des joueurs de queue restent constantes. Les apports du joueur de tête augmentent fortement avec la dotation sous libérale égalitaire. d, Illustration de notre pipeline de conception d’agents. Le crédit: Nature Comportement humain (2022). DOI : 10.1038/s41562-022-01383-x

Une équipe de chercheurs de DeepMind, à Londres, en collaboration avec des collègues de l’Université d’Exeter, de l’University College London et de l’Université d’Oxford, a formé un système d’IA pour trouver une politique de répartition équitable des fonds publics dans un jeu en ligne. Dans leur article publié dans la revue Nature Comportement humainle groupe décrit l’approche qu’il a adoptée pour former son système et discute des problèmes qui ont été soulevés dans son effort.

La façon dont une société distribue la richesse est un problème auquel les humains doivent faire face depuis des milliers d’années. Néanmoins, la plupart des économistes conviendraient qu’aucun système n’a encore été établi dans lequel tous ses membres sont satisfaits du statu quo. Il y a toujours eu des niveaux de revenus inéquitables, ceux du haut étant les plus satisfaits et ceux du bas les moins satisfaits. Dans ce dernier effort, les chercheurs en Angleterre ont adopté une nouvelle approche pour résoudre le problème en demandant à un ordinateur d’adopter une approche plus logique.

Les chercheurs sont partis de l’hypothèse que les sociétés démocratiques, malgré leurs défauts, sont jusqu’à présent les plus agréables de celles qui ont été essayées. Ils ont ensuite demandé l’aide de volontaires pour jouer à un simple jeu d’allocation de ressources – les joueurs du jeu ont décidé ensemble des meilleures façons de partager leurs ressources mutuelles. Pour le rendre plus réaliste, les joueurs ont reçu différentes quantités de ressources au départ et il y avait différents schémas de distribution parmi lesquels choisir. Les chercheurs ont exécuté le jeu plusieurs fois avec différents groupes de volontaires. Ils ont ensuite utilisé les données de tous les jeux joués pour former plusieurs systèmes d’IA sur la manière dont les humains travaillent ensemble pour trouver une solution à un tel problème. Ensuite, ils ont demandé aux systèmes d’IA de jouer un jeu similaire les uns contre les autres, permettant de peaufiner et d’apprendre sur plusieurs itérations.

Les chercheurs ont découvert que les systèmes d’IA s’étaient installés sur une forme d’égalitarisme libéral dans lequel les joueurs recevaient peu de ressources à moins qu’ils ne contribuent proportionnellement fortement au pool communautaire. Les chercheurs ont ensuite terminé leurs recherches en demandant à un groupe de volontaires humains de jouer au même jeu qu’auparavant, mais cette fois, ils ont eu le choix entre l’utilisation de l’une des nombreuses approches de partage conventionnelles ou celle développée par le système d’IA – celle conçue par le système d’IA était le choix constant parmi les joueurs humains.


Les volontaires d’une étude sur les jeux vidéo déclarent eux-mêmes un bien-être positif


Plus d’information:
Raphael Koster et al, Conception de mécanismes centrés sur l’homme avec l’IA démocratique, Nature Comportement humain (2022). DOI : 10.1038/s41562-022-01383-x

© 2022 Réseau Science X

Citation: Un système d’IA formé pour trouver une politique équitable de distribution des fonds publics dans un jeu en ligne (2022, 5 juillet) récupéré le 5 juillet 2022 sur https://techxplore.com/news/2022-07-ai-equitable-policy-funds -en ligne.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation loyale à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.