Aller au contenu principal
Planification de mouvement en environnements dynamiques : panorama des méthodes classiques aux approches modernes
RecherchearXiv cs.RO2sem

Planification de mouvement en environnements dynamiques : panorama des méthodes classiques aux approches modernes

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Une revue systématique publiée sur arXiv (arXiv:2606.02677) recense et analyse 138 travaux sur la planification de mouvement en environnements dynamiques, publiés principalement entre 2015 et 2025. Les auteurs classifient les approches en cinq familles : méthodes par échantillonnage (type RRT), recherche sur graphe (A, D*), contrôle prédictif par modèle (MPC), apprentissage automatique (supervisé et par renforcement), et méthodes locales classiques regroupant obstacles de vitesse (velocity obstacles), champs de potentiel et fenêtres dynamiques. La revue intègre également la perception dynamique, couvrant la détection et la modélisation d'obstacles mobiles à partir de caméras, LiDAR et capteurs à événements (event-based sensors).

Pour les chercheurs et praticiens, ce survey comble un angle mort réel : la littérature disposait de nombreuses synthèses sur la planification en environnements statiques, mais les revues ciblant spécifiquement les environnements dynamiques restaient rares et non systématiques. Les auteurs soulèvent trois défis que les benchmarks classiques sous-capturent : l'incertitude de prédiction des trajectoires d'obstacles tiers, la dynamique de l'interaction humain-robot, et le "freezing robot problem", phénomène où un robot se paralyse face à des flux humains denses, verrou concret pour tout déploiement en entrepôt peuplé, en hôpital ou en espace public. La grille de lecture proposée aide les intégrateurs à choisir une famille de méthodes selon leurs contraintes de latence, de prévisibilité et de disponibilité des données d'entraînement.

La planification de mouvement dynamique concentre aujourd'hui les efforts des équipes mobilité dans des contextes aussi variés que les AMR d'entrepôt, les plateformes humanoïdes en déploiement industriel et les véhicules autonomes en milieu urbain. Le domaine est traversé par une tension structurante entre méthodes classiques, interprétables et certifiables mais rigides face aux scénarios non anticipés, et approches par apprentissage, plus adaptables mais encore fragiles face au sim-to-real gap et en dehors de la distribution d'entraînement. Ce survey paraît à un moment où les VLA (visual-language-action models) et les politiques RL commencent à être évalués à l'échelle réelle, rendant une taxonomie claire d'autant plus utile pour situer les nouvelles contributions. Les auteurs identifient la robustesse à l'incertitude prédictive et la généralisation hors distribution comme principaux axes de recherche ouverts.

Dans nos dossiers

À lire aussi

Allocation de tâches et planification du mouvement en environnements dynamiques encombrés via CBBA et graphes d'ensembles convexes
1arXiv cs.RO 

Allocation de tâches et planification du mouvement en environnements dynamiques encombrés via CBBA et graphes d'ensembles convexes

Une équipe de chercheurs a publié sur arXiv (référence 2506.18516) un système de planification combinant deux algorithmes complémentaires pour coordonner des agents mobiles dans des environnements encombrés et dynamiques : le CBBA (Consensus-Based Bundle Algorithm) pour l'allocation distribuée des tâches, et les GCS (Graphs of Convex Sets) pour l'optimisation des trajectoires. L'approche repose sur un espace de configuration en 4D (3D spatial plus axe temporel), ce qui permet de modéliser simultanément la géométrie de l'environnement et le timing des rendez-vous mobiles. Les agents doivent non seulement se répartir les tâches, mais également estimer précisément quand et où ils pourront les atteindre, compte tenu des obstacles et des autres agents. Les résultats sont démontrés exclusivement en simulation, avec des scénarios incluant des tâches statiques et des objectifs de rendez-vous dynamiques. L'apport technique principal réside dans le couplage explicite entre allocation et planification, deux sous-problèmes généralement traités séparément dans la littérature sur les systèmes multi-robots. En pratique, la plupart des architectures industrielles de type AMR (Autonomous Mobile Robot) utilisent un planificateur de chemin découplé du système de dispatch, ce qui introduit des erreurs d'estimation temporelle et des conflits de ressources. En intégrant les GCS dans la boucle CBBA, le système produit des enchères basées sur des trajectoires réellement faisables plutôt que sur des heuristiques de distance euclidienne. Pour un intégrateur ou un décideur B2B, cela signifie potentiellement moins de recalculs coûteux en exécution et une meilleure fiabilité des estimations de temps de cycle dans des entrepôts ou ateliers denses. Il faut néanmoins noter que les GCS, bien que performants en optimisation convexe, restent computationnellement lourds à grande échelle, et que l'article ne fournit pas de données de timing comparatives. Les GCS ont été popularisés principalement par les travaux de Tobia Marcucci et Russ Tedrake au MIT via la librairie Drake, avec des applications initiales en manipulation et locomotion. Le CBBA est issu des travaux du MIT Lincoln Laboratory (Choi et al., 2009) et reste une référence en coordination décentralisée pour drones et robots terrestres. Cette combinaison s'inscrit dans un effort plus large pour combler le fossé entre planification géométrique et coordination multi-agent, un problème actif dans des labos comme Stanford ASL, CMU Robotics Institute, ou côté français l'INRIA et le LAAS-CNRS. Les prochaines étapes naturelles seraient une validation sur matériel réel, une évaluation de la scalabilité au-delà d'une dizaine d'agents, et une comparaison quantitative avec des approches basées sur MILP ou MAPF (Multi-Agent Path Finding).

UEL'INRIA et le LAAS-CNRS sont explicitement cités comme acteurs actifs sur cette problématique, positionnant la recherche française en bonne place pour contribuer ou collaborer autour de cette méthodologie de planification multi-agents.

RecherchePaper
1 source
DynoJEPP : estimation conjointe, prédiction et planification en environnements dynamiques
2arXiv cs.RO 

DynoJEPP : estimation conjointe, prédiction et planification en environnements dynamiques

DynoJEPP (Joint Estimation, Prediction and Planning) est un cadre de planification robotique basé sur les graphes de facteurs, publié le 14 mai 2026 sur arXiv (2605.12897), qui optimise simultanément trois modules traditionnellement traités en séquence : l'estimation d'état, la prédiction du comportement des objets environnants, et la planification de trajectoire. Le coeur de la contribution est l'introduction des "facteurs dirigés" (directed factors), un nouveau type de noeud dans le graphe de facteurs imposant un flux d'information strictement unidirectionnel entre les modules. Sans ce mécanisme, les informations issues de la prédiction et de la planification remontent dans l'estimateur d'état, corrompant les estimées et produisant des comportements non désirés. Le framework inclut également une extension baptisée Cooperative DynoJEPP, permettant au robot de modéliser un comportement coopératif des objets mobiles dans sa planification de trajectoire. L'impact le plus saillant ressort des expériences de validation : sans les facteurs dirigés, le robot entre en collision dans la majorité des tests, en environnement statique comme dynamique. Ce résultat pointe un problème fondamental des architectures JEPP existantes : la co-optimisation conjointe crée des boucles de rétroaction non désirées qui dégradent la sécurité opérationnelle. Le module d'estimation d'état, typiquement le composant de référence dans les systèmes de navigation, se retrouve contaminé par des hypothèses issues de la planification, inversant la causalité naturelle du pipeline. Pour les intégrateurs travaillant sur la navigation autonome en entrepôt ou en espace partagé humain-robot, l'approche suggère que la structure des dépendances entre modules est au moins aussi critique que leur optimisation conjointe. Les graphes de facteurs sont une technique établie en robotique depuis le milieu des années 2000, popularisée notamment par Frank Dellaert (Georgia Tech) via la librairie GTSAM pour le SLAM. Les approches JEPP suscitent un intérêt croissant face à la montée des robots en espaces dynamiques (entrepôts, routes mixtes, cobotique). Les concurrents directs incluent les planificateurs MPC à modules séparés, les architectures différentiables de type Wayve ou DreamerV3, et les VLA (Vision-Language-Action) qui intègrent progressivement la modélisation des agents environnants. La contribution de DynoJEPP reste au stade de la recherche académique (preprint sans revue par les pairs), sans déploiement ni pilote industriel annoncé.

RecherchePaper
1 source
COVER : planification de mouvement en temps fixe avec cartes à couverture vérifiée en environnements semi-statiques
3arXiv cs.RO 

COVER : planification de mouvement en temps fixe avec cartes à couverture vérifiée en environnements semi-statiques

Des chercheurs ont publié sur arXiv (référence 2510.03875v2) un framework baptisé COVER (Coverage-VErified Roadmaps), conçu pour résoudre des requêtes de planification de mouvement dans un budget temps fixe, sur un manipulateur 7-DOF effectuant des tâches de pick-and-place dans des environnements de type table rase et étagères. Le principe repose sur des environnements dits semi-statiques : la majorité de l'espace de travail reste identique entre les tâches, tandis qu'un sous-ensemble d'obstacles change de position. COVER décompose l'espace des configurations possibles de chaque obstacle mobile de façon indépendante, construit des roadmaps (graphes de chemins) de façon incrémentale, et vérifie formellement la faisabilité de ces graphes dans chaque partition. Pour les régions vérifiées, la résolution d'une requête est garantie dans un temps borné. Les benchmarks montrent une couverture de l'espace-problème plus large et un taux de succès par requête supérieur aux approches antérieures, notamment face à des obstacles de tailles hétérogènes. L'enjeu industriel est direct : les planificateurs généralistes comme RRT ou ses variantes ne garantissent pas de temps de réponse borné, ce qui bloque leur usage dans les applications temps-réel (lignes d'assemblage, cellules de palettisation, cobots en cadence synchronisée). COVER apporte une garantie formelle de couverture, absente des travaux précédents, sans discrétiser les configurations d'obstacles en un ensemble fini prédéfini. C'est ce dernier point qui étend l'applicabilité aux scénarios industriels réels, où les positions d'obstacles varient continûment et ne tombent pas dans des cases prédéterminées. Pour un intégrateur, la différence est concrète : un planificateur qui "essaie" n'a pas la même valeur contractuelle qu'un planificateur qui "garantit" dans X millisecondes. La planification de mouvement certifiée dans des environnements changeants est un problème ouvert depuis des années, à la frontière entre la robotique manipulation et la vérification formelle. Les approches par probabilistic roadmaps (PRM) offrent performance mais pas de garanties ; les méthodes exactes sont trop coûteuses en temps de calcul pour être embarquées. COVER se positionne entre ces deux extrêmes en exploitant la structure semi-statique propre à la majorité des environnements industriels. Les concurrents implicites sont les planificateurs adaptatifs comme STOMP, TrajOpt, ou les approches d'apprentissage par imitation (pi-zero de Physical Intelligence, GR00T N2 de NVIDIA), qui résolvent la planification par inférence neuronale mais sans garantie formelle de complétude. La prochaine étape naturelle serait d'étendre COVER à des environnements avec obstacles dynamiques ou à des manipulateurs montés sur bases mobiles, ce que l'article ne couvre pas encore.

RecherchePaper
1 source
Planification de trajets robotiques adaptée à la congestion en environnements encombrés
4arXiv cs.RO 

Planification de trajets robotiques adaptée à la congestion en environnements encombrés

Des chercheurs ont publié sur arXiv (réf. 2606.19031, juin 2026) un planificateur de tournées probabiliste pour robots mobiles autonomes (AMR) en espaces publics encombrés. Le système vise à guider un robot de service, qu'il soit guide en centre commercial, livreur en entrepôt de préparation de commandes ou médiateur muséal, à travers une séquence de points de passage en tenant compte du comportement stochastique des foules. L'approche repose sur des cartes CLiFF (Circular Linear Flow Field), des modèles statistiques appris qui prédisent les trajectoires piétonnes à partir d'une observation initiale. Ces prédictions alimentent un processus de décision markovien (MDP) résolu en ligne, autorisant un recalcul d'itinéraire à chaque nouvelle observation de passants. La validation s'appuie sur un jeu de données réel collecté dans un centre commercial. Le problème est concret et régulièrement sous-estimé dans les déploiements AMR : les manoeuvres d'évitement de collision déclenchées par la présence humaine dégradent les temps de cycle de manière non linéaire, particulièrement dans les espaces à densité variable selon l'heure de la journée. Traiter la foule comme un processus stochastique temporel plutôt que comme un simple bruit à filtrer représente un changement d'approche pertinent pour les intégrateurs opérant en logistique retail ou en accueil public. La contribution d'ingénierie centrale est la replanification en ligne sans recalcul global du MDP, ce qui conditionne l'utilisabilité réelle en environnement dynamique. A noter : les métriques de performance (gains de temps de cycle, taux de succès de tournée) ne sont pas quantifiées dans le résumé publié, et l'évaluation reste limitée à un seul site, ce qui limite la généralisation des conclusions. Les cartes CLiFF constituent un cadre existant de modélisation des flux piétons, ici couplé pour la première fois à un MDP online dans un contexte de planification multi-points de passage. La navigation sociale est un champ de recherche actif depuis une décennie, avec des approches concurrentes basées sur les modèles de force sociale, le protocole ORCA, ou des méthodes d'apprentissage profond sur trajectoires piétonnes (GNN, Transformer). Ce travail reste au stade de preprint académique, sans partenaire industriel ni déploiement commercial annoncé. La prochaine étape logique serait une validation multi-sites et une comparaison quantitative directe avec ces méthodes concurrentes, en particulier sur des géométries d'espaces plus complexes et des horizons temporels plus longs.

RecherchePaper
1 source