Aller au contenu principal
Planification de mouvement vérifiée dans l'espace des tâches sous contraintes articulaires
RecherchearXiv cs.RO3sem

Planification de mouvement vérifiée dans l'espace des tâches sous contraintes articulaires

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Une équipe de chercheurs présente dans un preprint arXiv (2605.22991, mai 2026) une méthode pour certifier formellement la planification de mouvement des bras manipulateurs face aux limites articulaires. Les planificateurs réactifs dans l'espace cartésien comme Bug2 opèrent avec des pas fixes sans tenir compte des butées angulaires ; lorsque la jacobienne est mal conditionnée, même un petit déplacement cartésien peut forcer un mouvement articulaire hors limites, provoquant une dérive de suivi et l'échec d'atteinte de l'objectif. La solution calcule, à chaque pas, le plus grand hyperrectangle cartésien certifiablement atteignable via une approximation polynomiale du second ordre de la cinématique inverse et la procédure S, qui forment un programme semi-défini positif (SDP) résolu par bisection en moins d'une milliseconde ; ce certificat est intégré à Bug2 pour adapter dynamiquement le pas au conditionnement cinématique local. Sur 94 scénarios adversariaux couvrant six configurations de limites articulaires, le planificateur SOS-vérifié atteint zéro violation articulaire et 100 % de taux de succès, contre 6 à 11 % de violations et jusqu'à 18 % d'échecs pour le Bug2 standard.

Ce résultat comble une lacune bien connue : la planification dans l'espace de travail et la gestion des contraintes articulaires sont traitées séparément dans la plupart des architectures, ce qui génère des comportements indésirables près des singularités cinématiques. La résolution sous-milliseconde rend le module intégrable dans des boucles de contrôle temps réel, le positionnant comme couche de sécurité potentielle au-dessus des planificateurs existants sur des bras industriels comme le KUKA iiwa, l'Universal Robots UR10 ou le Franka Emika Panda.

Bug2 est un algorithme réactif classique des années 1980-90, robuste mais agnostique aux propriétés cinématiques du robot, dont l'adaptation aux manipulateurs modernes multi-DDL a toujours souffert de ce manque de cohérence entre espaces cartésien et articulaire. L'usage de la procédure S et des programmes semi-définis pour certifier des atteignabilités locales s'inscrit dans une tendance plus large d'intégration de la vérification formelle (barrières de contrôle, Lyapunov, SOS) dans la planification de mouvement. Ce travail reste un preprint de recherche sans implémentation open-source ni déploiement industriel annoncé ; la validation sur robots physiques multi-DDL en conditions dynamiques réelles demeure l'étape manquante avant toute adoption industrielle.

Impact France/UE

KUKA (Allemagne) et Universal Robots (Danemark) sont cités comme cibles d'intégration directe, ce qui positionne les constructeurs de bras industriels européens comme premiers bénéficiaires potentiels si une implémentation open-source est publiée.

Dans nos dossiers

À lire aussi

Optimisation des arbres de trajectoires dans l'espace des croyances : de la commande prédictive à la planification de tâches et de mouvements
1arXiv cs.RO 

Optimisation des arbres de trajectoires dans l'espace des croyances : de la commande prédictive à la planification de tâches et de mouvements

Des chercheurs proposent, dans un preprint arXiv soumis début mai 2026 (arXiv:2605.01860), de planifier des trajectoires arborescentes (trajectory-trees) dans l'espace des croyances (belief space) plutôt que les trajectoires séquentielles classiques. Quand un robot évolue en environnement partiellement observable, la trajectoire optimale dépend d'observations futures encore inconnues: les trajectory-trees branchent à chaque point où l'état de croyance est susceptible de diverger en scénarios distincts. Le papier présente deux contributions: un contrôleur prédictif partiellement observable (PO-MPC) à branchement unique, optimisé par un algorithme parallélisé baptisé D-AuLa (Distributed Augmented Lagrangian) conçu pour satisfaire les contraintes temps-réel du MPC; et un planificateur tâche-et-mouvement (PO-LGP) combinant arbres de décision symboliques et trajectory-trees cinématiques, en étendant le cadre Logic-Geometric-Programming (LGP) aux problèmes partiellement observables. Les validations expérimentales portent sur la conduite autonome pour le MPC et des scénarios de manipulation robotique pour le TAMP. L'enjeu industriel est direct: les environnements réels sont rarement entièrement observables. Un bras triant des pièces dont l'orientation n'est connue qu'après préhension, ou un AGV naviguant en zone d'incertitude sensorielle, nécessitent précisément ce type de planification contingente. Les trajectoires séquentielles obligent le robot à choisir un plan unique à l'avance, ce qui se traduit par des comportements sous-optimaux ou des replanifications coûteuses. L'approche PO-MPC réduit les coûts de contrôle en anticipant les branches d'observation possibles; PO-LGP génère des politiques d'exploration utilisables comme macro-actions dans un plan global. D-AuLa répond à l'objection classique contre la planification en espace de croyance: sa complexité computationnelle prohibitive pour le temps-réel, en exploitant la décomposabilité du problème pour paralléliser l'optimisation. Le cadre LGP étendu par ces travaux a été développé par le groupe de Marc Toussaint (TU Berlin), et constitue l'une des approches TAMP les plus rigoureuses pour la manipulation multi-étapes. La planification en POMDP (Partially Observable Markov Decision Processes) est un domaine actif depuis les années 1990, mais son couplage avec le contrôle continu et la planification symbolique reste un défi ouvert. Des approches concurrentes basées sur l'apprentissage par renforcement (notamment les méthodes VLA et politiques diffusion) ou sur des planificateurs sampling-based adressent des problèmes voisins avec des compromis différents en matière de généralisation et de garanties formelles. Les auteurs reconnaissent eux-mêmes que la méthode est validée sur des belief states de taille restreinte et exclusivement en simulation; la prochaine étape naturelle est une validation hardware sur robots réels avec perception embarquée et latences de capteurs.

UELes travaux étendent le cadre LGP développé par le groupe de Marc Toussaint à TU Berlin, consolidant le leadership académique européen en planification tâche-et-mouvement rigoureuse pour la manipulation robotique multi-étapes.

RecherchePaper
1 source
VRA : ancrage de l'accélération articulaire en temps discret dans l'actionnement sous contrainte de tension
2arXiv cs.RO 

VRA : ancrage de l'accélération articulaire en temps discret dans l'actionnement sous contrainte de tension

Des chercheurs présentent dans un preprint arXiv (2605.10696, mai 2026) une abstraction de contrôle baptisée Voltage-Realizable Acceleration (VRA), destinée à combler un écart entre planification cinématique et exécution matérielle dans les robots à actionneurs électriques. Le problème identifié : les contraintes d'accélération articulaire en temps discret, couramment utilisées pour imposer des limites de position et de vitesse, peuvent générer des commandes cinématiquement valides mais physiquement irréalisables lorsque les actionneurs opèrent sous contrainte de tension. VRA introduit une interface d'accélération au niveau de l'articulation qui restreint les commandes commandées aux seules valeurs réalisables compte tenu des limites de tension effectives. Des expériences sur actionneurs électriques réels et sur un quadrupède roue-patte ont validé l'approche : suppression des accélérations irréalisables, exécution plus cohérente en régime de contrainte proche des limites, et réduction des oscillations induites. L'impact potentiel concerne tout intégrateur travaillant avec des robots à moteurs électriques, humanoïdes, quadrupèdes, bras industriels. Les oscillations liées aux contraintes sont un problème fréquent en déploiement réel, souvent invisible en simulation, ce qui contribue au sim-to-real gap. En formalisant une couche d'abstraction entre le planificateur cinématique et l'actionneur, VRA pourrait améliorer la robustesse des piles de contrôle existantes sans nécessiter de refonte architecturale. La contribution est conceptuelle : elle nomme et corrige un angle mort longtemps ignoré dans les pipelines de contrôle standard. Les contraintes d'accélération en temps discret sont un outil classique depuis les années 2000, mais leur interaction avec les limites physiques des actionneurs électriques modernes, opérés dans des régimes de plus en plus extrêmes, n'avait pas été formalisée à ce niveau d'abstraction. Ce preprint n'est pas encore évalué par les pairs, et les expériences restent limitées à une seule plateforme roue-patte, type ANYbotics ou Unitree. Les suites logiques incluent une intégration dans des piles open source telles que ros2_control et des validations sur des plateformes humanoïdes à haute dynamique.

UEImpact indirect : tout intégrateur européen s'appuyant sur ros2_control ou des piles de contrôle standard pour robots électriques (bras industriels, quadrupèdes, humanoïdes) pourrait bénéficier d'une future intégration de VRA pour réduire les oscillations en régime limite et améliorer la robustesse sim-to-real.

RecherchePaper
1 source
TCBiRRT : planification rapide de mouvement pour manipulateur spatial à deux bras couplés par expansion aléatoire dans l'espace des tâches
3arXiv cs.RO 

TCBiRRT : planification rapide de mouvement pour manipulateur spatial à deux bras couplés par expansion aléatoire dans l'espace des tâches

Des chercheurs ont publié le 27 mai 2026 sur arXiv (identifiant 2605.27167) un algorithme de planification de mouvement baptisé TCBiRRT (Task-space Constrained Bidirectional Rapidly-exploring Random Tree), conçu pour les manipulateurs spatiaux bi-bras à chaîne cinématique fermée. Le problème visé est concret : lors de l'assemblage orbital de grandes structures spatiales, un bras double qui tient rigidement un objet forme une boucle fermée entre ses deux effecteurs, ce qui réduit drastiquement l'espace de configurations valides. TCBiRRT contourne cette difficulté en effectuant l'échantillonnage aléatoire directement dans l'espace tâche, défini par la pose de l'objet manipulé, plutôt que dans l'espace articulaire de haute dimension. Un algorithme de cinématique inverse sur chemin mappe ensuite chaque noeud tâche vers une trajectoire articulaire continue, intégré dans un cadre RRT bidirectionnel avec mécanisme de re-saisie. Les simulations portent sur plusieurs scénarios d'assemblage orbital à complexité environnementale variable. Les résultats annoncés sont significatifs sur le plan algorithmique : taux de succès nettement supérieurs et temps de planification améliorés de plusieurs ordres de grandeur par rapport aux planificateurs de référence. Pour un intégrateur travaillant sur des systèmes robotiques orbitaux, cela se traduit par des fenêtres d'action plus courtes et une meilleure fiabilité dans des environnements encombrés, pièces de structure, équipements déjà déployés. Il faut cependant souligner que tous les résultats reposent exclusivement sur simulation ; aucun test en microgravité réelle ni sur prototype physique n'est rapporté à ce stade. Le gap sim-to-real reste donc entier, question centrale pour toute qualification de vol. La planification de mouvement sous contraintes de chaîne fermée est un problème ancien en robotique, mais son application aux manipulateurs orbitaux bi-bras, type Canadarm2 ou les projets plus récents de bras d'assemblage pour les stations lunaires Gateway et les futures plateformes LEO commerciales, redevient stratégique. Côté concurrence algorithmique, les approches existantes (CBiRRT, planificateurs config-space classiques) peinent à passer à l'échelle dans des environnements complexes : c'est précisément ce verrou que TCBiRRT prétend lever. Aucun lien industriel ni partenariat agence spatiale n'est mentionné dans le préprint ; les prochaines étapes naturelles seraient une validation matérielle et une intégration dans des simulateurs de référence comme NASA's RSVP ou ESA's VREP.

UEAucun partenariat institutionnel européen confirmé, mais l'ESA VREP est cité comme cible d'intégration naturelle pour une validation future, ce qui représente un intérêt indirect pour les projets orbitaux européens (Gateway, stations LEO commerciales).

RecherchePaper
1 source
COVER : planification de mouvement en temps fixe avec cartes à couverture vérifiée en environnements semi-statiques
4arXiv cs.RO 

COVER : planification de mouvement en temps fixe avec cartes à couverture vérifiée en environnements semi-statiques

Des chercheurs ont publié sur arXiv (référence 2510.03875v2) un framework baptisé COVER (Coverage-VErified Roadmaps), conçu pour résoudre des requêtes de planification de mouvement dans un budget temps fixe, sur un manipulateur 7-DOF effectuant des tâches de pick-and-place dans des environnements de type table rase et étagères. Le principe repose sur des environnements dits semi-statiques : la majorité de l'espace de travail reste identique entre les tâches, tandis qu'un sous-ensemble d'obstacles change de position. COVER décompose l'espace des configurations possibles de chaque obstacle mobile de façon indépendante, construit des roadmaps (graphes de chemins) de façon incrémentale, et vérifie formellement la faisabilité de ces graphes dans chaque partition. Pour les régions vérifiées, la résolution d'une requête est garantie dans un temps borné. Les benchmarks montrent une couverture de l'espace-problème plus large et un taux de succès par requête supérieur aux approches antérieures, notamment face à des obstacles de tailles hétérogènes. L'enjeu industriel est direct : les planificateurs généralistes comme RRT ou ses variantes ne garantissent pas de temps de réponse borné, ce qui bloque leur usage dans les applications temps-réel (lignes d'assemblage, cellules de palettisation, cobots en cadence synchronisée). COVER apporte une garantie formelle de couverture, absente des travaux précédents, sans discrétiser les configurations d'obstacles en un ensemble fini prédéfini. C'est ce dernier point qui étend l'applicabilité aux scénarios industriels réels, où les positions d'obstacles varient continûment et ne tombent pas dans des cases prédéterminées. Pour un intégrateur, la différence est concrète : un planificateur qui "essaie" n'a pas la même valeur contractuelle qu'un planificateur qui "garantit" dans X millisecondes. La planification de mouvement certifiée dans des environnements changeants est un problème ouvert depuis des années, à la frontière entre la robotique manipulation et la vérification formelle. Les approches par probabilistic roadmaps (PRM) offrent performance mais pas de garanties ; les méthodes exactes sont trop coûteuses en temps de calcul pour être embarquées. COVER se positionne entre ces deux extrêmes en exploitant la structure semi-statique propre à la majorité des environnements industriels. Les concurrents implicites sont les planificateurs adaptatifs comme STOMP, TrajOpt, ou les approches d'apprentissage par imitation (pi-zero de Physical Intelligence, GR00T N2 de NVIDIA), qui résolvent la planification par inférence neuronale mais sans garantie formelle de complétude. La prochaine étape naturelle serait d'étendre COVER à des environnements avec obstacles dynamiques ou à des manipulateurs montés sur bases mobiles, ce que l'article ne couvre pas encore.

RecherchePaper
1 source