RecherchearXiv cs.RO3sem

Planification de mouvements sûre sous perturbations inconnues, avec garanties formelles

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (arXiv:2605.26625) un algorithme de planification de mouvement par échantillonnage qui garantit formellement la sûreté de systèmes robotiques soumis à des perturbations aléatoires dont la distribution est inconnue. L'approche s'applique aux robots à dynamique linéaire ou linéarisable évoluant dans des environnements encombrés avec des obstacles de forme arbitraire, sous contraintes d'état et de commande. La sûreté est formulée comme des chance-constraints (contraintes probabilistes), et l'algorithme apprend depuis des trajectoires observées un "tube d'ambiguïté de Wasserstein", une séquence d'ensembles d'ambiguïté qui contient, avec haute confiance, la distribution d'état réelle du système. Ce tube est ensuite intégré dans un arbre de planification probabilistiquement complet. Les auteurs introduisent également un vérificateur de validité basé sur les bandits multi-bras qui accélère significativement les performances empiriques sans compromettre la complétude. Les cas d'étude montrent que l'algorithme trouve des trajectoires valides dans des environnements denses sous des seuils de sécurité stricts, surpassant les méthodes de référence actuelles.

L'enjeu pratique est considérable pour les intégrateurs de robots industriels et les équipes d'autonomie : la plupart des planificateurs de mouvement existants supposent soit une distribution de bruit connue (hypothèse souvent irréaliste), soit ignorent les perturbations stochastiques au profit de marges de sécurité conservatives et figées. Cette méthode data-driven contourne les deux écueils en apprenant directement l'incertitude depuis des données de trajectoires, sans hypothèse paramétrique forte. La réduction du conservatisme via des tubes d'ambiguïté de faible dimension, plusieurs tubes en basse dimension plutôt qu'un seul en haute dimension, améliore la scalabilité, un obstacle classique des approches distributionally robust appliquées à la robotique. C'est un pas concret vers des robots opérant en production dans des environnements non contrôlés, sans recalibration systématique du modèle de bruit.

La planification de mouvement sûre sous incertitude est un champ actif depuis deux décennies, structuré autour de méthodes comme RRT/RRT*, les MPC robustes et les approches de tube invariant. L'utilisation de la distance de Wasserstein pour construire des ensembles d'ambiguïté s'inscrit dans le courant des méthodes distributionally robust optimization (DRO), popularisées en contrôle ces cinq dernières années notamment par les groupes de ETH Zurich, Caltech et MIT. Ce preprint n'est pas encore évalué par les pairs. Les prochaines étapes attendues incluent une validation sur hardware réel (les cas d'étude présentés restent en simulation) et une extension aux dynamiques non linéaires, deux conditions nécessaires avant toute intégration dans des pipelines d'autonomie industrielle.

Dans nos dossiers

arXiv cs.RO

À lire aussi

1arXiv cs.RO

Planification et commande de mouvement sûres par polytopes imbriqués et fonctions de barrière de contrôle

Des chercheurs présentent dans un preprint arXiv (2606.09719) une méthode de planification de mouvement locale pour robots mobiles autonomes évoluant dans des espaces confinés. L'approche repose sur la représentation polytopique du footprint du robot : modéliser sa géométrie réelle par un polygone convexe plutôt que de la simplifier à un point ou un cercle. La condition de sécurité, le robot doit rester à l'intérieur d'une région libre convexe continuellement mise à jour, est formulée comme un ensemble de contraintes de type Control Barrier Function (CBF) intégrées dans un contrôleur prédictif à modèle (MPC). Les expériences sur matériel embarqué, avec un robot non-holonome équipé de LiDAR et de grilles d'occupation, valident le système à 10 Hz en temps réel, avec évitement réactif d'obstacles dynamiques. L'analyse comparative affiche une réduction du temps de calcul pouvant atteindre 91x face à une formulation classique basée sur la détection d'obstacles, lorsque la densité de l'environnement augmente. L'intérêt pour les intégrateurs de systèmes AMR tient à deux propriétés distinctes. Le nombre de contraintes de sécurité dépend uniquement de la complexité géométrique locale et de la forme du robot, pas du nombre d'obstacles, ce qui garantit une tenue en temps réel dans des environnements denses. Par ailleurs, l'absence de nécessité de détecter ou segmenter les obstacles individuellement simplifie le pipeline de perception. La validation sur hardware, et pas seulement en simulation, place ce travail au-delà d'un résultat purement théorique, même si la montée en charge vers des environnements industriels à grande échelle reste à démontrer. La fréquence de 10 Hz sur ordinateur embarqué est un indicateur crédible de déployabilité réelle. Les approches classiques de navigation sûre pour robots à empreinte non-triviale recourent soit à des simplifications conservatives, soit à des formulations obstacle-par-obstacle dont le coût de calcul croît avec la densité de la scène, un problème bien documenté dans les entrepôts opérés par des acteurs comme Exotec ou dans la navigation maritime autonome. Les CBF appliqués à la planification en espace libre s'inscrivent dans une tendance croissante aux côtés de méthodes comme MPPI ou les planificateurs basés sur des tubes de sécurité. Ce preprint n'a pas encore été soumis à révision par les pairs, mais la démonstration embarquée sur robot réel constitue un signal d'applicabilité sérieux pour les équipes R&D robotique cherchant à naviguer dans des couloirs étroits sans surestimer les marges de sécurité.

UELes équipes R&D d'intégrateurs AMR européens (dont Exotec en France) pourraient bénéficier de cette méthode pour améliorer la navigation en environnements confinés sans surcoût computationnel, mais le travail reste un preprint non encore validé par les pairs.

RecherchePaper

1 source

2arXiv cs.RO

COVER : planification de mouvement en temps fixe avec cartes à couverture vérifiée en environnements semi-statiques

Des chercheurs ont publié sur arXiv (référence 2510.03875v2) un framework baptisé COVER (Coverage-VErified Roadmaps), conçu pour résoudre des requêtes de planification de mouvement dans un budget temps fixe, sur un manipulateur 7-DOF effectuant des tâches de pick-and-place dans des environnements de type table rase et étagères. Le principe repose sur des environnements dits semi-statiques : la majorité de l'espace de travail reste identique entre les tâches, tandis qu'un sous-ensemble d'obstacles change de position. COVER décompose l'espace des configurations possibles de chaque obstacle mobile de façon indépendante, construit des roadmaps (graphes de chemins) de façon incrémentale, et vérifie formellement la faisabilité de ces graphes dans chaque partition. Pour les régions vérifiées, la résolution d'une requête est garantie dans un temps borné. Les benchmarks montrent une couverture de l'espace-problème plus large et un taux de succès par requête supérieur aux approches antérieures, notamment face à des obstacles de tailles hétérogènes. L'enjeu industriel est direct : les planificateurs généralistes comme RRT ou ses variantes ne garantissent pas de temps de réponse borné, ce qui bloque leur usage dans les applications temps-réel (lignes d'assemblage, cellules de palettisation, cobots en cadence synchronisée). COVER apporte une garantie formelle de couverture, absente des travaux précédents, sans discrétiser les configurations d'obstacles en un ensemble fini prédéfini. C'est ce dernier point qui étend l'applicabilité aux scénarios industriels réels, où les positions d'obstacles varient continûment et ne tombent pas dans des cases prédéterminées. Pour un intégrateur, la différence est concrète : un planificateur qui "essaie" n'a pas la même valeur contractuelle qu'un planificateur qui "garantit" dans X millisecondes. La planification de mouvement certifiée dans des environnements changeants est un problème ouvert depuis des années, à la frontière entre la robotique manipulation et la vérification formelle. Les approches par probabilistic roadmaps (PRM) offrent performance mais pas de garanties ; les méthodes exactes sont trop coûteuses en temps de calcul pour être embarquées. COVER se positionne entre ces deux extrêmes en exploitant la structure semi-statique propre à la majorité des environnements industriels. Les concurrents implicites sont les planificateurs adaptatifs comme STOMP, TrajOpt, ou les approches d'apprentissage par imitation (pi-zero de Physical Intelligence, GR00T N2 de NVIDIA), qui résolvent la planification par inférence neuronale mais sans garantie formelle de complétude. La prochaine étape naturelle serait d'étendre COVER à des environnements avec obstacles dynamiques ou à des manipulateurs montés sur bases mobiles, ce que l'article ne couvre pas encore.

RecherchePaper

1 source

3arXiv cs.RO

Diffusion à somme de coûts avec guidage dynamique pour la planification de mouvement

Une équipe de recherche publie en mai 2026 (arXiv:2605.24690) une nouvelle méthode de planification de trajectoires pour la manipulation robotique, basée sur les modèles de diffusion. L'approche, baptisée "Sum of Costs Diffusion with Dynamic Guidance", guide le processus de débruitage du modèle de diffusion par le gradient du coût total de collision, c'est-à-dire la somme des coûts de collision sur l'ensemble de la trajectoire candidate. Autre contribution clé : une heuristique dynamique pour sélectionner l'étape de départ à partir de laquelle ce guidage par gradient est activé. Sur le benchmark Mπnets, un jeu de données de référence pour la planification en environnements encombrés, la méthode obtient les meilleures performances parmi l'ensemble des approches comparées. La généralisation reste le verrou principal de la planification de mouvement en manipulation robotique. Les planificateurs classiques (familles RRT, OMPL) peinent à s'adapter à de nouveaux environnements sans replanification coûteuse, tandis que les approches deep learning souffrent d'une généralisation limitée hors distribution. Le guidage par gradient de coût de collision, appliqué dynamiquement au cours du débruitage, offre une alternative : le modèle ajuste la trajectoire en continu selon la géométrie réelle de la scène, sans retraining. La sélection dynamique du step de départ du guidage adresse un problème connu des modèles de diffusion guidés, le compromis entre force du guidage et diversité des échantillons. Les résultats sur la diversité des configurations de test de Mπnets soutiennent l'hypothèse que cette formulation est plus robuste que les stratégies de guidage par coût ponctuel utilisées dans les travaux antérieurs. Cela dit, l'article est une prépublication non encore révisée par les pairs, et les métriques gagneraient à être validées sur des benchmarks physiques réels. L'intérêt pour les modèles de diffusion en planification robotique s'est accéléré depuis 2023 avec des travaux comme Diffusion Policy (Chi et al.) ou SE(3)-DiffusionFields. Les approches concurrentes directement comparées incluent MPinets et CuRobo (NVIDIA), deux méthodes learning-based de référence sur Mπnets. La méthode proposée s'inscrit dans un courant qui cherche à marier la flexibilité générative des modèles de diffusion avec des contraintes de sécurité physique (évitement de collision) sans passer par un planificateur externe. La prochaine étape logique sera une validation sur hardware réel et des environnements dynamiques, conditions nécessaires pour que ce type d'approche intéresse les intégrateurs industriels.

RecherchePaper

1 source

4arXiv cs.RO

Contrôle hybride intégrant la faisabilité pour la planification de mouvement sous logiques temporelles à signaux

Une équipe de chercheurs publie sur arXiv (2605.03662v1) une méthode de planification hybride pour robots planaires opérant sous contraintes de Signal Temporal Logic (STL). L'approche introduit une variable discrète qui modélise la satisfaction locale des contraintes et permet une analyse de faisabilité à l'échelle locale, unifiant planification de tâches et synthèse de commande en une architecture unique. Des fonctions de barrière de contrôle (Control Barrier Functions, CBF) sont définies sur une version transformée en disque de l'espace de travail robotique, initialement non-convexe et géométriquement complexe, pour lever le problème des blocages (deadlocks) classiques dans ces formulations. Des simulations démontrent la gestion simultanée de plusieurs tâches spatio-temporelles superposées, y compris en présence de saturation des actionneurs. L'intérêt de cette contribution réside dans le couplage direct entre faisabilité locale et boucle de contrôle, plutôt qu'en post-traitement. Dans les architectures de Task and Motion Planning (TAMP) conventionnelles, le planificateur propose fréquemment des trajectoires irréalisables par le contrôleur bas niveau : intégrer l'analyse de faisabilité en amont réduit structurellement cet écart. La gestion de la saturation des actionneurs, contrainte réaliste rarement traitée dans les formulations STL existantes, renforce la crédibilité industrielle de l'approche pour des robots à ressources limitées. Les STL constituent depuis une dizaine d'années un cadre de spécification formelle prisé pour exprimer des contraintes temporisées du type "atteindre la zone A entre t=2s et t=5s", mais leur intégration avec des garanties de sûreté temps-réel reste un problème ouvert. Les CBF, popularisées notamment par les travaux d'Aaron Ames (Caltech), offrent de telles garanties mais peinent sur les espaces non-convexes ; la transformation géométrique en disque proposée ici adresse directement ce couplage. Les résultats restent pour l'instant limités à des simulations planaires 2D ; une validation sur plateforme physique constitue la prochaine étape naturelle.

RecherchePaper

1 source