Une technique d’apprentissage auto-supervisée appliquée au moulage de robots planaires

Real2sim2real : Une technique d'apprentissage auto-supervisée appliquée au moulage de robots planaires

Dans Planar Robot Casting (PRC), un seul mouvement planaire d’un poignet de robot tenant une extrémité d’un câble fait glisser l’autre extrémité du câble à travers le plan et s’arrête à un point cible souhaité, qui peut se trouver en dehors de l’espace de travail du robot. (A) montre une vue latérale d’un robot UR5 avec câble et espace de travail planaire, (B) illustre les performances de test sur le câble 1 pour 16 cibles. Le secteur intérieur doré représente l’espace de travail du robot, tandis que le secteur extérieur gris représente l’espace de travail accessible du câble. (C, D) montrent plusieurs vues aériennes superposées du robot et du câble avec les points cibles associés après les actions PRC avec la politique apprise, en (C) un exemple avec une faible erreur et en (D) un exemple avec une erreur élevée, dans la position du point final . Crédit : Lim et al.

Au cours des prochaines décennies, des robots pourraient être introduits dans les environnements humains, notamment les maisons, les bureaux et les espaces de vente au détail. Entre autres choses, les systèmes robotiques pourraient être utilisés pour ranger les espaces et les rendre plus sûrs pour les humains.

Bien que les robots aient obtenu jusqu’à présent des résultats très prometteurs, ils ne peuvent pas encore manipuler de manière fiable les structures déformables, telles que les câbles d’alimentation, les cordes et les tuyaux. De plus, la plupart des systèmes robotiques ne peuvent pas non plus manipuler efficacement des objets déformables bidimensionnels, tels que des vêtements, des serviettes et de la literie, ou des objets déformables tridimensionnels, tels que des oreillers, des produits, des aliments et des sacs.

Des chercheurs de l’AUTOLAB de l’Université de Californie à Berkeley travaillent avec des chercheurs du Toyota Research Institute (TRI) pour améliorer la capacité des robots à manipuler des objets déformables ; notamment pour démêler les câbles et manipuler les tissus. Dans un article récent prépublié sur arXiv, ils ont introduit une nouvelle technique d’apprentissage en profondeur auto-supervisée pour le moulage de robots planaires, une tâche qui implique la manipulation de câbles sur des surfaces planes.

« Alors que nos travaux antérieurs se concentrent davantage sur la manipulation (quasi-)statique, ce projet explore l’efficience et l’efficacité des mouvements dynamiques pour la manipulation d’objets déformables », a déclaré à TechXplore Ken Goldberg, l’un des chercheurs qui a mené l’étude. « Dans un article précédent, nous nous sommes concentrés sur les actions de câble dynamiques, telles que le « saut » pour manipuler un câble avec une extrémité fixée à un mur. Notre nouvel article se concentre sur la manipulation d’un câble à extrémité libre sur une surface plane.

L’un des principaux objectifs de l’étude récente est d’identifier une nouvelle tâche de manipulation de câble dynamique, qu’ils appellent « la coulée de robot planaire ». intervention.






Dans leur article, ils ont présenté un pipeline spécifique pour résoudre cette tâche, surnommé « real2sim2real ».

« Notre technique d’apprentissage auto-supervisée, real2sim2real, peut accélérer l’entraînement et améliorer les performances », ont expliqué Raven Huang et Vincent Lim. « Pour accélérer l’apprentissage, nous voulons utiliser une simulation physique réaliste. Cependant, la simulation physique dans ce contexte n’est pas représentative de la réalité. Pour résoudre ce problème, le robot collecte d’abord des données réelles de manière auto-supervisée, en utilisant un pré- mouvement de réinitialisation enregistré afin de ne pas acquérir d’intervention humaine. »

Le pipeline real2sim2real utilise les données réelles collectées par Huang et Lim et leurs collègues pour ajuster la simulation d’une tâche de coulée de robot planaire, afin qu’elle corresponde le plus possible à la réalité. Par la suite, il calcule une quantité beaucoup plus importante de données simulées, de manière plus sûre et à un rythme beaucoup plus rapide qu’il ne serait capable de collecter dans le monde réel.

Pour apprendre les politiques de contrôle des systèmes robotiques, le modèle utilise une combinaison de données réelles et simulées. Cet ensemble de données contenant à la fois des données réelles et simulées est ensuite également utilisé pour résoudre les écarts entre les performances dans les environnements réels et simulés, améliorant encore sa capacité à s’attaquer aux tâches de coulée de robots planaires.

« Par rapport à d’autres approches, qui apprennent à l’aide de données purement simulées ou de données purement réelles, notre méthode équilibre le besoin de rendre la simulation aussi précise que possible (ce que nous appelons réduire l’écart sim2real) et d’apprendre aussi efficacement que possible », Lawrence Chen mentionné. « Notre cadre permet également au robot de collecter des données de manière autonome pendant de longues périodes. »

Real2sim2real : Une technique d'apprentissage auto-supervisée appliquée au moulage de robots planaires

Le pipeline Real2Sim2Real pour la RPC. Nous collectons un ensemble de données physiques de manière auto-supervisée. Nous sous-échantillonnons l’ensemble de données physiques pour générer un ensemble de données de réglage et l’utilisons pour régler les paramètres de simulation afin que ses trajectoires correspondent à des trajectoires réelles à l’aide de l’évolution différentielle (B), puis utilisons le simulateur réglé pour générer un grand ensemble de données de simulation (C). Nous utilisons une combinaison pondérée d’ensembles de données de simulation et d’ensembles de données physiques pour former la politique (D) et évaluer la politique en réel (E). Crédit : Lim et al.

Goldberg et son équipe ont évalué l’outil auto-supervisé qu’ils ont développé dans une série de tests. Remarquablement, real2sim2real a surpassé toutes les méthodes de référence auxquelles ils l’ont comparé, ainsi que les techniques entraînées uniquement sur des données simulées ou uniquement sur des données réelles.

« Nous avons été surpris par l’efficacité du pipeline real2sim2real », a déclaré Mike Laskey de TRI. « Nous avons démontré sa capacité à apprendre efficacement une politique de manipulation dynamique pour les objets déformables et à atteindre une précision relativement élevée. L’approche hybride consistant à combiner des données simulées et réelles améliore considérablement les performances et l’efficacité des données. »

La nouvelle méthode nécessite 96 % de données réelles en moins que les autres approches. Le reste des données est créé par le modèle des chercheurs dans un environnement de simulation réglé de manière fiable. Cela pourrait à terme faciliter l’utilisation de systèmes robotiques pour la gestion des câbles dans les maisons, les bateaux, les usines et d’autres environnements. À l’avenir, l’équipe espère appliquer le framework real2sim2real à d’autres tâches de manipulation de robots.

« L’une de nos futures directions de recherche sera d’étendre notre méthode à des objets déformables plus complexes, tels que des tissus ou des sacs », a déclaré Goldberg. « Pour de tels objets, nous avons une dimension encore plus élevée avec des propriétés dynamiques plus complexes nous motivant à combiner le mouvement dynamique avec des mouvements (quasi-)statiques. »


Un système pour transférer les compétences de manipulation adroite robotique des simulations aux vrais robots


Plus d’information:
Vincent Lim et al, Lancement de robots planaires avec apprentissage auto-supervisé real2sim2real. arXiv:2111.04814v1 [cs.RO], arxiv.org/abs/2111.04814

© 2021 Réseau Science X

Citation: Real2sim2real : Une technique d’apprentissage auto-supervisée appliquée au moulage de robots planaires (2021, 2 décembre) récupérée le 2 décembre 2021 sur https://techxplore.com/news/2021-11-real2sim2real-self-supervised-technique-planar-robot .html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.