Une technique d’apprentissage automatique qui peut apprendre les équilibres locaux dans les jeux d’enchères symétriques

Une technique d'apprentissage automatique qui peut apprendre les équilibres locaux dans les jeux d'enchères symétriques

Une illustration de la fonction d’offre d’équilibre pour une enchère simple au premier prix pour un objet et une approximation illustrée par des points. Crédit : Bichler et al.

Au cours des dernières décennies, les informaticiens ont exploré le potentiel d’appliquer des outils de théorie des jeux et d’intelligence artificielle (IA) aux échecs, au jeu de stratégie abstrait de go ou à d’autres jeux. Une autre utilisation précieuse de la théorie des jeux est dans les sciences économiques, en particulier comme cadre pour expliquer les interactions stratégiques sur les marchés et les résultats qui en résultent.

L’une des constructions théoriques les plus courantes conçues pour permettre l’application de la théorie des jeux en économie est la théorie des enchères. La théorie des enchères est une application de la théorie des jeux qui décrit spécifiquement comment différents enchérisseurs peuvent agir sur les marchés d’enchères.

Cependant, lors de l’application de la théorie des enchères à des marchés réels ou réalistes avec plusieurs articles en vente et des interdépendances de valeur, le calcul de stratégies d’enchères d’équilibre pour les jeux d’enchères peut être difficile. En théorie des jeux, l’équilibre bayésien de Nash (BNE) se produit lorsqu’aucun joueur (ou enchérisseur) ne peut améliorer la stratégie choisie après avoir pris en compte les choix de son adversaire.

Le BNE est considéré comme un résultat stable d’un jeu ou d’une enchère et peut servir de prédiction pour le résultat, mais il est beaucoup plus difficile à calculer pour les enchères par rapport aux jeux à informations complètes finies tels que pierre-papier-ciseaux. C’est parce que les valeurs et les offres des adversaires sont continues.

Des études antérieures ont introduit plusieurs techniques numériques qui pourraient être utilisées pour apprendre les équilibres dans les jeux d’enchères. Ces méthodes sont soit basées sur des calculs de meilleures réponses ponctuelles dans l’espace stratégique, soit sur la résolution itérative de sous-jeux. Leur utilisation était largement limitée à de simples ventes aux enchères d’objets uniques.

Des chercheurs de l’Université technique de Munich ont récemment développé une nouvelle technique d’apprentissage automatique qui peut être utilisée pour apprendre les équilibres locaux dans les jeux d’enchères symétriques. Cette technique, présentée dans un article publié dans Nature Machine Intelligence, fonctionne en représentant les stratégies sous forme de réseaux de neurones, puis en appliquant une itération de politique basée sur une dynamique de gradient pendant qu’un enchérisseur joue contre lui-même.

« L’année dernière, le prix Nobel de sciences économiques a été décerné à Paul Milgrom et Bob Wilson pour leurs travaux sur la théorie et la conception des enchères », a déclaré à TechXplore Martin Bichler, l’un des chercheurs qui a mené l’étude. « Les premiers travaux du lauréat du prix Nobel William Vickrey ont conduit à des stratégies d’équilibre théoriques des jeux pour les enchères simples à objet unique, qui sont basées sur la solution d’équations différentielles. Malheureusement, les enchères multi-objets plus complexes se sont avérées très difficiles à résoudre et à équilibrer. les stratégies d’enchères ne sont connues que pour des cas très précis. »

Bichler et ses collègues mènent des recherches liées à la théorie des enchères et explorent ses applications depuis plusieurs années maintenant. Dans leur étude récente, ils ont spécifiquement cherché à développer une technique basée sur des réseaux de neurones artificiels et sur le self-play qui peut automatiquement apprendre des stratégies d’enchères d’équilibre dans les enchères.

« Nous avons prouvé que notre méthode converge avec la stratégie d’équilibre dans une grande variété de modèles d’enchères avec des hypothèses standard », a déclaré Bichler. « Cela nous permet de développer des solveurs d’équilibre qui calculent numériquement des stratégies d’enchères d’équilibre pour divers types de modèles d’enchères, ce qui n’était pas possible jusqu’à présent. »

Lorsque les chercheurs ont testé leur technique, ils ont découvert que les BNE qu’elle approchait coïncidaient avec l’équilibre dérivé analytiquement, chaque fois qu’il était disponible. L’erreur estimée était également très faible dans les cas où l’équilibre analytique est inconnu. À l’avenir, l’outil qu’ils ont développé pourrait ainsi être utilisé pour étudier l’efficacité des enchères et déterminer quelles stratégies d’enchères on peut s’attendre à voir émerger à l’équilibre.

En plus de sa contribution significative à l’étude de la théorie des enchères, la technique créée par Bichler et ses collègues pourrait être un outil très précieux pour les commissaires-priseurs, car elle pourrait les aider à sélectionner des formats d’enchères et des enchérisseurs pour développer leurs stratégies d’enchères. Par exemple, cela pourrait s’avérer utile lors des enchères de spectre, qui sont utilisées par les régulateurs du monde entier pour distribuer les droits de transmettre des signaux sur des bandes spécifiques du spectre électromagnétique à différents fournisseurs de réseaux mobiles.

« Nous avons d’abord adapté le processus d’apprentissage standard dans les réseaux de neurones (descente de gradient) pour gérer les discontinuités des fonctions d’utilité dans nos modèles d’enchères », a déclaré Bichler. « Deuxièmement, nous pourrions prouver que la méthode converge vers l’équilibre dans les enchères avec seulement un ensemble modéré d’hypothèses. Ceci est intéressant car l’apprentissage de l’équilibre de ce type ne converge pas en général dans les jeux. »

Dans leurs futures études, Bichler et ses collègues aimeraient tester leur technique sur différents scénarios et s’assurer qu’elle se généralise bien. En outre, ils prévoient de développer des outils capables de calculer automatiquement les équilibres dans une plus grande variété de problèmes liés à la théorie des jeux, allant au-delà des jeux d’enchères symétriques.


Une rare copie du jeu vidéo « Super Mario 64 » vendue aux enchères pour 1,56 million de dollars


Plus d’information:
Martin Bichler et al, Équilibres d’apprentissage dans les jeux d’enchères symétriques utilisant des réseaux de neurones artificiels, Nature Machine Intelligence (2021). DOI : 10.1038 / s42256-021-00365-4

© 2021 Réseau Science X

Citation: Une technique d’apprentissage automatique qui peut apprendre les équilibres locaux dans les jeux d’enchères symétriques (2021, 14 septembre) récupéré le 14 septembre 2021 sur https://techxplore.com/news/2021-09-machine-technique-local-equilibria-symmetric.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.