Liaisons de jambes robotiques extensibles et rétractabl…

Raisonnement par graphe de zones sémantiques pour la recherche multi-robots guidée par le langage

42

1arXiv cs.RO

Raisonnement par graphe de zones sémantiques pour la recherche multi-robots guidée par le langage

Une équipe de chercheurs a publié SAGR (Semantic Area Graph Reasoning), un framework hiérarchique permettant à des grands modèles de langage (LLM) de coordonner des essaims multi-robots pour la recherche sémantique en environnement inconnu. Évalué sur 100 scénarios du dataset Habitat-Matterport3D, SAGR affiche jusqu'à 18,8 % de gain d'efficacité sur la recherche de cibles sémantiques dans les grands environnements, tout en restant compétitif avec les méthodes d'exploration state-of-the-art basées sur la couverture de frontières. Le système construit incrémentalement un graphe sémantique de zones à partir d'une carte d'occupation sémantique, encodant instances de pièces, connectivité, frontières disponibles et états des robots dans une représentation compacte transmise au LLM pour le raisonnement de haut niveau. La navigation locale et la planification géométrique restent déterministes. L'apport central est architectural : SAGR résout le problème d'interface entre raisonnement symbolique et coordination géométrique, un point de friction récurrent dans les systèmes multi-robots. Les approches classiques (frontier coverage, information gain) sont aveugles à l'intention de tâche, elles ne savent pas qu'une « cafetière » se trouve probablement dans une cuisine, pas un couloir. SAGR délègue cette inférence contextuelle au LLM via une abstraction topologique structurée, sans exposer le modèle au bruit d'une carte brute. C'est une séparation claire des responsabilités : le LLM raisonne sur la sémantique des pièces, les robots exécutent localement. Pour un intégrateur ou un opérateur d'entrepôt multi-AGV, cela ouvre la voie à des instructions en langage naturel comme « trouve le chariot de nettoyage » sans reconfiguration de la logique de navigation. Ce travail s'inscrit dans une tendance forte de 2024-2025 : l'injection de LLM dans la boucle de planification robotique, aux côtés de travaux comme SayPlan (Rana et al.), NavGPT ou des approches VLA type RT-2 et π₀. SAGR se distingue en ciblant explicitement la coordination multi-agent plutôt que le robot unique, et en validant sur un benchmark standardisé (HM3D) plutôt qu'en démo lab. La prochaine étape logique sera le passage du simulateur au réel, le sim-to-real gap sur la segmentation sémantique restant le principal obstacle non adressé par les auteurs.

RechercheActu

1 source

Politiques de diffusion multi-agents extensibles pour le contrôle de couverture

37

2arXiv cs.RO

Politiques de diffusion multi-agents extensibles pour le contrôle de couverture

Des chercheurs ont publié sur arXiv (identifiant 2509.17244) MADP (Multi-Agent Diffusion Policy), une approche basée sur les modèles de diffusion pour la coordination décentralisée de nuées de robots. Le principe : chaque robot génère ses actions en échantillonnant depuis une distribution jointe haute dimension, en conditionnant sa politique sur une représentation fusionnée de ses propres observations et des embeddings perceptuels reçus de ses pairs via communication locale. L'équipe évalue MADP sur le problème de couverture de terrain (coverage control), un benchmark canonique en robotique multi-agent où un groupe de robots holonomes doit couvrir efficacement un espace selon des fonctions de densité d'importance variables. La politique est entraînée par imitation learning à partir d'un expert omniscient (dit "clairvoyant"), et le processus de diffusion est paramétré par une architecture de transformer spatial permettant l'inférence décentralisée, sans coordinateur central. Les résultats présentés sont exclusivement issus de simulations. L'intérêt technique principal tient à la nature des modèles de diffusion : contrairement aux politiques classiques qui produisent une action déterministe ou une distribution gaussienne unimodale, MADP peut capturer les interdépendances entre les actions de plusieurs agents dans une distribution multi-modale complexe. Les expériences montrent que le modèle généralise à travers des densités d'agents variables et des environnements non vus à l'entraînement, surpassant les baselines état de l'art. Pour un intégrateur ou un décideur industriel, cela signifie en théorie des essaims plus robustes aux variations de flotte, aux défaillances partielles et aux reconfiguration dynamiques, sans retraining complet. La robustesse au nombre d'agents est particulièrement notable : c'est un verrou historique des approches d'apprentissage multi-agent. Le problème de couverture de terrain occupe les équipes de robotique multi-agent depuis les années 2000, avec des solutions allant de l'optimisation par diagrammes de Voronoï aux algorithmes de reinforcement learning décentralisé. L'application des modèles de diffusion aux politiques robotiques est un domaine en essor depuis les travaux sur les diffusion policies (Pearce et al., 2023) et leur extension dans des systèmes comme Pi-0 de Physical Intelligence ou les architectures ACT. MADP en étend la logique au cas multi-agent, encore peu exploré dans la littérature. Aucun partenaire industriel ni calendrier de déploiement n'est mentionné dans ce preprint ; les prochaines étapes naturelles seraient une validation sur hardware réel et l'extension à des tâches au-delà de la couverture pure.

RecherchePaper

1 source

Mémoire à long terme pour agents VLA dans l'exécution de tâches en environnement ouvert

42

3arXiv cs.RO

Mémoire à long terme pour agents VLA dans l'exécution de tâches en environnement ouvert

Une équipe de chercheurs a publié le 22 avril 2026 sur arXiv (ref. 2504.15671) les résultats de ChemBot, un système robotique conçu pour automatiser des protocoles d'expérimentation chimique complexes en laboratoire. ChemBot repose sur une architecture à deux couches couplant un agent IA planificateur à un modèle Vision-Language-Action (VLA) baptisé Skill-VLA, capable de décomposer hiérarchiquement des tâches longues, typiquement des protocoles multi-étapes, puis de les exécuter sur des robots collaboratifs. Le système intègre une mémoire persistante à double niveau qui archive les trajectoires réussies sous forme d'assets réutilisables, et s'appuie sur un serveur Model Context Protocol (MCP) pour orchestrer les sous-agents et les outils. Un mécanisme d'inférence asynchrone basé sur la prédiction d'états futurs est également implémenté pour réduire les discontinuités de trajectoire, un défaut récurrent des VLA standards. Les expériences rapportées montrent des taux de succès et une précision opérationnelle supérieurs aux baselines VLA existantes sur des scénarios longs et multi-étapes. Ce travail adresse une limite structurelle bien documentée des modèles VLA : leur incapacité à capitaliser sur les expériences passées, ce qui force le système à recommencer par tâtonnements à chaque nouvelle session. En intégrant une mémoire persistante récupérable, ChemBot réduit concrètement le "trial-and-error gap" dans des environnements à longue horizon de planification, un problème critique pour l'automatisation de laboratoire où une erreur en milieu de protocole peut invalider toute une expérience. C'est également une démonstration applicative du sim-to-real dans un domaine non industriel, le laboratoire chimique, traditionnellement peu couvert par les benchmarks robotiques. Pour les intégrateurs B2B dans le pharma ou la recherche chimique, cela constitue un signal concret vers des robots de laboratoire autonomes capables de gérer des workflows non déterministes. Les modèles VLA ont connu une montée en puissance rapide depuis 2023 avec des travaux comme RT-2 (Google DeepMind), OpenVLA et Pi-0 (Physical Intelligence), mais la majorité des déploiements restent limités à des tâches courtes et répétitives. ChemBot se positionne dans le segment émergent des "long-horizon VLA", aux côtés de travaux comme SayCan ou des architectures hiérarchiques de Carnegie Mellon. Aucun déploiement industriel n'est annoncé à ce stade, il s'agit d'une publication académique avec validation sur robots collaboratifs en environnement contrôlé. Les prochaines étapes logiques incluent des tests sur des plateformes comme les robots Universal Robots ou Franka, et une intégration potentielle avec des systèmes LIMS existants dans les laboratoires pharmaceutiques.

RechercheOpinion

1 source

Tests de robustesse par recherche pour un logiciel de robotique de reconditionnement d'ordinateurs portables

49

4arXiv cs.RO

Tests de robustesse par recherche pour un logiciel de robotique de reconditionnement d'ordinateurs portables

Le Danish Technological Institute (DTI), centre de recherche appliquée danois spécialisé dans le transfert technologique vers l'industrie et le secteur public, publie PROBE, une méthode de test de robustesse pour les logiciels robotiques utilisés dans le reconditionnement de laptops. L'approche cible les modèles de détection d'objets embarqués dans ces robots, chargés d'identifier des vis pour le démontage ou des autocollants à retirer, dont les défaillances peuvent entraîner des dommages physiques aux appareils. PROBE s'appuie sur NSGA-II, un algorithme d'optimisation multi-objectifs évolutionnaire, pour explorer de manière systématique l'espace des perturbations d'images : l'objectif est de trouver les modifications minimales et localisées qui font échouer le modèle de détection, en équilibrant l'intensité de la perturbation, sa localisation spatiale et son effet sur le score de confiance du modèle. Les résultats quantitatifs sont significatifs : PROBE est 3 à 7 fois plus efficace qu'une recherche aléatoire pour générer des perturbations induisant des échecs, tout en utilisant des perturbations de magnitude plus faible, ce qui signifie qu'il expose des vulnérabilités réelles plutôt que des cas limites artificiels. Fait notable, les perturbations générées se transfèrent entre modèles différents, suggérant qu'elles révèlent des fragilités structurelles communes et non des artefacts liés à une architecture particulière. L'article introduit également l'usage de relations métamorphiques pour évaluer la stabilité des modèles même dans des cas non-défaillants, enrichissant le diagnostic de robustesse au-delà de la simple détection de pannes. Pour un intégrateur déployant des robots dans une chaîne de reconditionnement, cette approche offre un cadre de qualification objective des modèles de vision avant mise en production industrielle. Ce travail s'inscrit dans la trajectoire du DTI sur la robotique appliquée à l'économie circulaire, en lien direct avec le Plan d'action européen pour l'économie circulaire. Le reconditionnement automatisé de matériel informatique reste un segment de niche mais en croissance, où la précision de la détection d'objets est critique : une vis mal localisée peut endommager irrémédiablement une carte mère. Côté recherche, PROBE rejoint un corpus croissant de travaux sur les tests adversariaux pour systèmes embarqués, un domaine où les approches search-based testing (SBST) gagnent du terrain face aux méthodes purement statistiques. Aucun déploiement commercial n'est annoncé à ce stade : il s'agit d'un résultat académique (arXiv:2605.07530), sans timeline de productisation précisée.

UELe DTI, centre de recherche danois (EU), propose un cadre de qualification objectif pour les modèles de vision embarqués dans les robots de reconditionnement, en alignement avec le Plan d'action européen pour l'économie circulaire.

RecherchePaper

1 source

Liaisons de jambes robotiques extensibles et rétractables dynamiquement pour l'exécution de tâches multiples en recherche et sauvetage

À lire aussi

Raisonnement par graphe de zones sémantiques pour la recherche multi-robots guidée par le langage

Politiques de diffusion multi-agents extensibles pour le contrôle de couverture

Mémoire à long terme pour agents VLA dans l'exécution de tâches en environnement ouvert

Tests de robustesse par recherche pour un logiciel de robotique de reconditionnement d'ordinateurs portables