G-MAPP : planification et perception multi-agents accél…

ScheduleStream : planification temporelle avec échantillonneurs pour l'ordonnancement et la planification de tâches et mouvements multi-bras accélérée par GPU

43

1arXiv cs.RO

ScheduleStream : planification temporelle avec échantillonneurs pour l'ordonnancement et la planification de tâches et mouvements multi-bras accélérée par GPU

Une équipe de chercheurs présente ScheduleStream (arXiv:2511.04758v2), un cadre généraliste de planification et d'ordonnancement pour robots bi-manuels et humanoïdes, conçu pour coordonner plusieurs bras en parallèle. Contrairement aux algorithmes TAMP (Task and Motion Planning) classiques, qui produisent des plans séquentiels où un seul bras se déplace à la fois, ScheduleStream modélise la dynamique temporelle via des hybrid durative actions, des actions pouvant démarrer de façon asynchrone et persister pendant une durée fonction de leurs paramètres. Cette architecture permet d'orchestrer des mouvements simultanés sur plusieurs membres, réduisant le temps de cycle global. Le système intègre une accélération GPU au sein même des échantillonneurs de trajectoires (samplers), et repose sur des algorithmes indépendants du domaine d'application. Les auteurs le valident en simulation ainsi que sur plusieurs tâches bi-manuelles réelles, dont les démonstrations sont accessibles sur schedulestream.github.io. Aucun chiffre précis de gain de temps ni de configuration matérielle (DOF, payload) n'est fourni dans l'abstract : des éléments à vérifier dans le papier complet. Le verrou adressé est structurel : l'espace d'action hybride discret-continu d'un robot multi-bras croît de façon combinatoire, rendant la planification computationnellement prohibitive dès qu'on autorise le parallélisme. En produisant des schedules plutôt que de simples séquences, ScheduleStream ouvre la voie à des cellules robotiques capables d'exécuter des sous-tâches simultanément, saisie d'un côté et assemblage de l'autre, ce qui est précisément le cas d'usage clé pour les intégrateurs cherchant à justifier un humanoïde bi-manuel (Figure 03, Optimus Gen 3, Atlas) en environnement industriel. L'accélération GPU dans le sampler est notable dans un domaine historiquement dominé par des planificateurs CPU-bound, et suggère une voie vers des temps de planification compatibles avec des cadences réelles. Le champ TAMP multi-bras s'est structuré autour de travaux comme PDDLStream (Garrett et al., MIT CSAIL), qui a introduit l'échantillonnage continu dans TAMP, mais sans gestion native du parallélisme temporel. ScheduleStream prolonge cette lignée en ajoutant la dimension asynchrone, un problème traité par ailleurs dans la communauté PDDL+ via des planificateurs temporels comme OPTIC ou POPF. Sur le terrain applicatif, les approches concurrentes incluent les politiques d'imitation comme ACT ou Diffusion Policy, qui contournent la planification symbolique au prix d'une moindre généralisabilité, et des frameworks comme MoveIt Task Constructor sous ROS2. La prochaine étape naturelle serait une validation sur des cellules de production réelles avec des métriques de cycle time documentées, ainsi qu'une publication du code source, non encore disponible à la date d'annonce.

RecherchePaper

1 source

Arbres de fibration : une approche unifiée pour la planification de mouvement multi-robots

41

2arXiv cs.RO

Arbres de fibration : une approche unifiée pour la planification de mouvement multi-robots

Une équipe de chercheurs a publié le 11 juin 2026 sur arXiv (2606.12070) un framework mathématique baptisé "fibration trees" visant à unifier les méthodes de planification de mouvement pour des équipes de robots multiples. Le système repose sur une structure en arbre où chaque noeud représente un espace d'états et chaque arête une fibration, c'est-à-dire une projection d'un espace de haute dimension vers un espace simplifié de dimension inférieure. Sur cette base formelle, les chercheurs ont développé un planificateur d'échantillonnage appelé Fibration-RRT (Rapidly-Exploring Random Fibration Trees), validé sur 32 scénarios impliquant des équipes de robots atteignant jusqu'à 96 degrés de liberté (DOF). L'implémentation est publiée en open source, et le planificateur est prouvé probabilistiquement complet. L'enjeu est la fameuse "malédiction de la dimensionnalité" : dès que l'on coordonne plusieurs robots, l'espace de configuration combiné explose exponentiellement, rendant la planification classique intractable. Les approches existantes répondaient à ce problème soit par la priorisation séquentielle (planifier les robots un par un), soit par la décomposition parallèle (sous-espaces indépendants), soit par des projections dans l'espace des tâches, mais sans framework commun capable de combiner ces stratégies. Fibration-RRT généralise à la fois le quotient-space RRT et le discrete RRT sous un formalisme unique, ce qui permet en théorie à un intégrateur de définir sa propre structure d'arbre selon la topologie du problème plutôt que de choisir entre des outils incompatibles. La robustesse sur 96 DOF est un signal technique solide, même si l'article ne fournit pas de comparaison de temps de cycle sur des benchmarks standardisés industrie. La planification de mouvement multi-robot est un domaine mature sur le plan académique, porté depuis la fin des années 1990 par les algorithmes RRT de Steven LaValle et leurs variantes (RRT*, BiRRT, quotient-space RRT de Orthey et al.). Le besoin d'unification se fait sentir à mesure que les déploiements AMR (autonomous mobile robots) et les cellules robotisées industrielles complexifient les interdépendances entre agents. Aucun acteur industriel n'est mentionné dans ce préprint, qui reste pour l'instant une contribution théorique. Les prochaines étapes naturelles seraient une validation sur des plateformes physiques et une intégration dans des middlewares standards comme ROS 2 MoveIt, qui constitue aujourd'hui la référence dans les projets d'intégration multi-bras.

RecherchePaper

1 source

Planification du mouvement multi-robots par modèle de diffusion guidé par apprentissage par renforcement multi-agents

36

3arXiv cs.RO

Planification du mouvement multi-robots par modèle de diffusion guidé par apprentissage par renforcement multi-agents

Une équipe de chercheurs propose, dans un préprint arXiv (2606.00933) publié début juin 2026, un cadre de planification de trajectoires pour flottes de robots mobiles combinant modèles de diffusion génératifs et apprentissage par renforcement multi-agents (MARL). Concrètement, chaque robot génère indépendamment des trajectoires candidates via un modèle de diffusion entraîné sur des données mono-agent, puis une fonction de valeur centralisée, apprise par MARL, oriente le processus de débruitage par gradient pour réduire les conflits entre agents. Ce mécanisme dit d'"exponential tilting" pousse la distribution de débruitage vers les trajectoires associées au meilleur retour collectif attendu. Évalué en simulation sur un labyrinthe avec quatre robots mobiles, le système réduit le taux d'interférence inter-agents de 55,4 % à 41,8 %, sans nécessiter de ré-entraînement du modèle génératif ni de planification jointe centralisée. Ce résultat attaque directement le compromis historique entre planification centralisée (précise mais peu scalable à mesure que la flotte grossit) et planification décentralisée (scalable mais aveugle aux autres agents). Le fait que la coordination soit injectée via un signal de guidage externe sans modifier le planificateur diffusion de base ouvre la voie à des architectures modulaires : on entraîne une fois le modèle de trajectoire mono-agent, puis on greffe la coordination selon l'environnement de déploiement. Pour les intégrateurs de systèmes multi-robots en entrepôt ou en manufacture, cela suggère qu'un découplage entre planification locale et coordination globale est techniquement praticable, ce qui simplifierait la mise à l'échelle des flottes hétérogènes sans refonte complète du pipeline. Le domaine est depuis longtemps dominé par des méthodes à base de graphes comme CBS (Conflict-Based Search) ou des approches réactives décentralisées comme ORCA, avec des tentatives d'apprentissage profond restées limitées en conditions réelles. L'application des modèles de diffusion à la génération de trajectoires robotiques constitue un courant émergent, illustré notamment par Diffusion Policy (Chi et al., 2023) en manipulation, mais rarement couplé au MARL pour la coordination de flotte. Ce travail reste pour l'instant une preuve de concept en simulation sur quatre robots dans un environnement simple, et la généralisation à des scènes dynamiques, à des flottes plus larges ou à des robots hétérogènes demeure un défi non adressé. Les prochaines étapes naturelles incluent la validation sur hardware réel et la confrontation aux benchmarks de référence du MAPF (Multi-Agent Path Finding).

RecherchePaper

1 source

Planification du mouvement multi-robots à partir de la vision et du langage par diffusion inspirée de la chaleur

47

4arXiv cs.RO

Planification du mouvement multi-robots à partir de la vision et du langage par diffusion inspirée de la chaleur

Des chercheurs ont présenté LHD (Language-conditioned Heat-inspired Diffusion), un framework de planification de mouvement multi-robots publié sur arXiv (réf. 2512.13090v2). Le système génère, en réponse à des commandes en langage naturel, des trajectoires sans collision pour plusieurs robots opérant simultanément dans un espace partagé, sans nécessiter de représentation explicite de l'environnement à l'inférence. LHD combine les priors sémantiques de CLIP, le modèle vision-langage d'OpenAI, avec un noyau de diffusion inspiré de l'équation de la chaleur. Ce noyau agit comme un biais inductif physique : en simulant la propagation thermique depuis les positions cibles, il délimite naturellement l'espace atteignable par chaque robot, guidant la planification à l'intérieur de la zone effectivement accessible. Les évaluations menées sur des environnements simulés inspirés du monde réel et des expériences en conditions physiques réelles montrent des gains en taux de succès et une réduction de la latence de planification par rapport aux planificateurs par diffusion antérieurs. L'enjeu industriel est direct : des systèmes multi-robots capables d'interpréter des instructions verbales sans reconfiguration manuelle représentent un levier clé pour les entrepôts et les lignes de production flexible. Les approches par diffusion existantes souffraient de deux limites bloquantes pour le déploiement réel : un coût computationnel élevé à l'inférence et une dépendance à une cartographie explicite des obstacles. LHD adresse les deux simultanément. Le système gère également les scénarios hors distribution en termes d'accessibilité physique : si une cible est hors de portée, il redirige le robot vers l'alternative accessible la plus proche sémantiquement, exactement le type de robustesse attendu en conditions industrielles. Ces résultats renforcent l'hypothèse que des VLA (Vision-Language-Action) peuvent opérer sans représentation géométrique explicite, sans constituer pour autant une preuve de déploiement à l'échelle commerciale. Ce travail s'inscrit dans une vague de planificateurs neuronaux multi-robots apparue depuis 2023, en concurrence directe avec les approches MAPF (Multi-Agent Path Finding) classiques et les méthodes d'apprentissage par renforcement multi-agent comme QMIX ou MAPPO. L'intégration de CLIP distingue LHD par son conditionnement sémantique flexible, là où la plupart des approches concurrentes raisonnent en coordonnées ou en graphes discrets. Aucun acteur industriel ou institutionnel européen n'est associé à cette publication, dont les affiliations d'équipe ne sont pas précisées dans l'abstract arXiv. Une page projet accompagnée de démos vidéo et de code est accessible à jebeom.github.io/lhdprojectpage/, mais des intégrations avec des flottes AMR commerciales restent à démontrer.

RechercheOpinion

1 source

G-MAPP : planification et perception multi-agents accélérées par GPU pour la génération de mouvement réactif

À lire aussi

ScheduleStream : planification temporelle avec échantillonneurs pour l'ordonnancement et la planification de tâches et mouvements multi-bras accélérée par GPU

Arbres de fibration : une approche unifiée pour la planification de mouvement multi-robots

Planification du mouvement multi-robots par modèle de diffusion guidé par apprentissage par renforcement multi-agents

Planification du mouvement multi-robots à partir de la vision et du langage par diffusion inspirée de la chaleur