Un ensemble de données d’intention pour former des modèles pour la prédiction de trajectoire de piétons et de véhicules

LOKI : un ensemble de données d'intention pour former des modèles pour la prédiction de trajectoire de piétons et de véhicules

Les chercheurs ont montré que le raisonnement sur les objectifs à long terme et les intentions à court terme joue un rôle important dans la prédiction de trajectoire. Faute de repères complets à cette fin, ils ont introduit un nouvel ensemble de données pour la prédiction d’intention et de trajectoire. Un exemple de cas d’utilisation est illustré en (a) où l’équipe prédit la trajectoire du véhicule cible. En (b), les objectifs à long terme sont estimés à partir de la propre initiative de l’agent. Les interactions en (c) et les contraintes environnementales telles que la topologie des routes et les restrictions de voies en (d) influencent l’intention à court terme de l’agent et donc les trajectoires futures. Crédit : Girase et al.

Les processus décisionnels humains sont intrinsèquement hiérarchiques. Cela signifie qu’ils impliquent plusieurs niveaux de raisonnement et différentes stratégies de planification qui fonctionnent simultanément pour atteindre les objectifs à court et à long terme.

Au cours de la dernière décennie, un nombre croissant d’informaticiens ont essayé de développer des outils et des techniques de calcul qui pourraient reproduire les processus décisionnels humains, permettant aux robots, aux véhicules autonomes ou à d’autres appareils de prendre des décisions plus rapidement et plus efficacement. Ceci est particulièrement important pour les systèmes robotiques effectuant des actions qui ont un impact direct sur la sécurité des humains, comme les voitures autonomes.

Des chercheurs du Honda Research Institute US, de Honda R&D et de l’UC Berkeley ont récemment compilé LOKI, un ensemble de données qui pourrait être utilisé pour former des modèles qui prédisent les trajectoires des piétons et des véhicules sur la route. Cet ensemble de données, présenté dans un article prépublié sur arXiv et qui sera présenté à la conférence ICCV 2021, contient des images soigneusement étiquetées de différents agents (par exemple, des piétons, des vélos, des voitures, etc.) dans la rue, capturées du point de vue d’un chauffeur.

« Dans notre article récent, nous proposons de raisonner explicitement sur les objectifs à long terme des agents ainsi que leurs intentions à court terme pour prédire les trajectoires futures des agents de la circulation dans les scènes de conduite », Chiho Choi, l’un des chercheurs qui a réalisé l’étude , a déclaré TechXplore. « Nous définissons les objectifs à long terme comme la position finale qu’un agent souhaite atteindre pour un horizon de prédiction donné, tandis que l’intention fait référence à la manière dont un agent atteint son objectif. »

LOKI : un ensemble de données d'intention pour former des modèles pour la prédiction de trajectoire de piétons et de véhicules

Visualisation de trois types d’étiquettes : (1a-1b) Étiquettes d’intention pour piéton ; (2a-2b) Étiquettes d’intention pour véhicule ; et (3a-3b) Labels environnementaux. La partie gauche de chaque image provient du balayage laser et la partie droite de la caméra. En (1a), le statut actuel du piéton est « En attente de traverser », et la destination potentielle indique l’intention du piéton. En (3a), la flèche bleue indique l’action possible de la voie actuelle où se trouve le véhicule, et les mots rouges présentent la position de la voie liée à l’ego-véhicule. Crédit : Girase et al.

Choi et ses collègues ont émis l’hypothèse que pour prédire les trajectoires des agents de la circulation le plus efficacement possible, il est important que les techniques d’apprentissage automatique prennent en compte une hiérarchie complexe d’objectifs à court et à long terme. Sur la base des mouvements de l’agent prédits, le modèle peut alors planifier les mouvements d’un robot ou d’un véhicule plus efficacement.

Les chercheurs ont donc entrepris de développer une architecture qui considère les objectifs à court et à long terme comme des éléments clés de l’estimation de l’intention par trame. Les résultats de ces considérations influencent alors son module de prédiction de trajectoire.

« Considérez un véhicule à une intersection où le véhicule veut atteindre son objectif ultime de tourner à gauche vers son point final », a expliqué Choi. « Lorsque l’on raisonne sur l’intention de mouvement de l’agent de tourner à gauche, il est important de considérer non seulement la dynamique de l’agent, mais aussi la façon dont l’intention est sujette à changement en fonction de nombreux facteurs, notamment i) la propre volonté de l’agent, ii) les interactions sociales, iii) les contraintes environnementales , iv) des indices contextuels. »

LOKI : un ensemble de données d'intention pour former des modèles pour la prédiction de trajectoire de piétons et de véhicules

Notre modèle code d’abord l’historique des observations passées de chaque agent pour proposer une distribution des objectifs à long terme sur les destinations finales potentielles pour chaque agent indépendamment. Un objectif, G, est ensuite échantillonné et transmis au module Interaction et prédiction conjointes. Un graphe de scène est construit pour permettre aux agents de partager des informations de trajectoire, des intentions et des objectifs à long terme. Les nœuds noirs indiquent les informations d’entrée/sortie de la route qui fournissent aux agents des informations de topologie cartographique. A chaque pas de temps, les informations de la scène actuelle sont propagées à travers le graphe. Nous prédisons ensuite une intention (l’action que l’agent entreprendra dans un proche avenir) pour chaque agent. Enfin, le décodeur de trajectoire est conditionné sur les intentions, les objectifs, les mouvements passés et la scène prédits avant de prévoir la position suivante. Ce processus est répété de façon récurrente pour la longueur de l’horizon. Crédit : Girase et al.

L’ensemble de données LOKI contient des centaines d’images RVB représentant différents agents dans le trafic. Chacune de ces images a des nuages ​​de points LiDAR correspondants avec des étiquettes détaillées par image pour tous les agents de trafic.

L’ensemble de données a trois classes uniques d’étiquettes. Les premiers sont les labels d’intention, qui précisent « comment » un acteur décide d’atteindre un objectif donné via une série d’actions. Les seconds sont des labels environnementaux, fournissant des informations sur l’environnement qui ont un impact sur les intentions des agents (par exemple, les positions « sortie de route » ou « entrée de route », « feux de circulation », « panneau de signalisation », « informations sur les voies », etc.). La troisième classe comprend des étiquettes contextuelles qui pourraient également affecter le comportement futur des agents, telles que les informations météorologiques, les conditions routières, le sexe et l’âge des piétons, etc.

« Nous fournissons une compréhension globale de la façon dont l’intention change sur un horizon à long terme », a déclaré Choi. « Ce faisant, l’ensemble de données LOKI est le premier qui peut être utilisé comme référence pour la compréhension des intentions pour les agents de circulation hétérogènes (c’est-à-dire les voitures, les camions, les vélos, les piétons, etc.). »

LOKI : un ensemble de données d'intention pour former des modèles pour la prédiction de trajectoire de piétons et de véhicules

Détails de l’ensemble de données LOKI. Nous rapportons les différents types d’étiquettes, le nombre d’instances de chaque étiquette et les descriptions de tous les types d’étiquettes. Crédit : Girase et al.

En plus de compiler l’ensemble de données LOKI, Choi et ses collègues ont développé un modèle qui explore comment les facteurs pris en compte par LOKI peuvent affecter le comportement futur des agents. Ce modèle peut prédire les intentions et les trajectoires de différents agents sur la route avec des niveaux de précision élevés, en considérant spécifiquement l’impact de i) la propre volonté d’un agent, ii) les interactions sociales, iii) les contraintes environnementales, et iv) les informations contextuelles sur son court – les actions à long terme et le processus de prise de décision.

Les chercheurs ont évalué leur modèle dans une série de tests et ont constaté qu’il surpassait jusqu’à 27 % les autres méthodes de prédiction de trajectoire de pointe. À l’avenir, le modèle pourrait être utilisé pour améliorer la sécurité et les performances des véhicules autonomes. De plus, d’autres équipes de recherche pourraient utiliser l’ensemble de données LOKI pour former leurs propres modèles de prédiction des trajectoires des piétons et des véhicules sur la route.

LOKI : un ensemble de données d'intention pour former des modèles pour la prédiction de trajectoire de piétons et de véhicules

Visualisation du résultat de prédiction de trajectoire top-1 (vert : observation passée, bleu : vérité terrain, rouge : prédiction) et intention par trame d’un agent particulier dans un cercle vert foncé au début du pas de temps d’observation (GI : vérité terrain Intention , PI : Intention prévue) est indiqué au bas de chaque scénario. Crédit : Girase et al.

« Nous avons déjà commencé à explorer d’autres directions de recherche visant à raisonner conjointement sur les intentions et les trajectoires tout en tenant compte de différents facteurs internes/externes tels que la volonté des agents, les interactions sociales et les facteurs environnementaux », a déclaré Choi. « Notre plan immédiat est d’explorer davantage l’espace de prédiction basé sur l’intention non seulement pour les trajectoires, mais aussi pour les mouvements et les comportements humains en général. Nous travaillons actuellement à étendre l’ensemble de données LOKI dans cette direction et pensons que notre ensemble de données très flexible encouragera la communauté de prédiction pour faire progresser davantage ces domaines. »


LUCIDGames : Une technique pour planifier des trajectoires adaptatives pour les véhicules autonomes


Plus d’information:
Harshayu Girase et al, LOKI : intentions à long terme et clés pour la prédiction de trajectoire, arXiv : 2108.08236 [cs.CV] arxiv.org/abs/218.08236

Fourni par Science X

© 2021 Réseau Science X

Citation: LOKI: Un ensemble de données d’intention pour former des modèles pour la prédiction de trajectoire de piétons et de véhicules (2021, 9 septembre) récupéré le 9 septembre 2021 à partir de https://techxplore.com/news/2021-09-loki-intention-dataset-pedestrian-vehicle. html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.