Dossier arXiv cs.RO — page 5

568 articles · page 5 sur 12

Les preprints robotique sur arXiv cs.RO : les avancées techniques avant publication, dont planification, learning from demos, sim2real, manipulation.

201arXiv cs.RO RecherchePaper

Planification efficace du mouvement multi-robots avec des faisceaux d'arêtes invariants par translation précalculés

Une équipe de chercheurs présente KiTE-Extend (Kinodynamic Translation-Invariant Edge Bundles), un mécanisme de sélection d'actions conçu pour améliorer la planification de mouvement multi-robot (MRMP). Publié sur arXiv (2605.09801) en mai 2026, le système repose sur une bibliothèque de segments de trajectoire calculés hors ligne, qui guident ensuite la sélection d'actions lors de la planification en ligne. L'approche est dite "planner-agnostic" : elle s'intègre aux planificateurs existants sans modifier leur propagation d'état, leur vérification de collision, ni leur évaluation de coût, et sans altérer leurs garanties théoriques. Les expériences couvrent plusieurs systèmes kinodynamiques et environnements variés, et montrent des réductions significatives du temps de planification ainsi qu'une meilleure scalabilité sur les trois paradigmes MRMP les plus utilisés : centralisé, priorisé, et basé sur la résolution de conflits (conflict-based search). L'enjeu est concret pour les intégrateurs de cellules robotisées et les opérateurs de flottes autonomes : coordonner plusieurs robots dans des espaces contraints reste l'un des principaux goulets d'étranglement des déploiements en entrepôt, en usine ou en logistique hospitalière. Les approches d'échantillonnage cinodynamique souffrent classiquement d'une exploration inefficace dans des espaces de configuration denses, où les interactions robot-robot multiplient les contraintes spatio-temporelles. KiTE-Extend attaque ce problème en amont en précalculant des segments réutilisables invariants par translation, ce qui permet à l'algorithme de trouver plus rapidement des segments de mouvement faisables sans surcharge computationnelle en ligne. Le gain est modeste pour un agent seul, mais significatif en configuration multi-agents, là précisément où les planificateurs standards peinent le plus. La planification cinodynamique multi-robot est un problème réputé PSPACE-difficile, et les méthodes par échantillonnage comme RRT ou SST ont longtemps dominé l'état de l'art sans résoudre complètement le passage à l'échelle au-delà de quelques agents. Des travaux comme CBS (Conflict-Based Search) ou ECBS avaient amélioré la gestion des conflits, mais laissaient entière la question de la qualité des primitives d'action sous-jacentes. KiTE-Extend s'insère en amont du planificateur plutôt qu'en remplacement, ce qui le rend compatible avec l'ensemble de l'écosystème existant. Aucun partenaire industriel ni calendrier de déploiement terrain n'est mentionné : il s'agit à ce stade d'une contribution de recherche, sans validation industrielle annoncée.

Dossier arXiv cs.RO — page 5

Planification efficace du mouvement multi-robots avec des faisceaux d'arêtes invariants par translation précalculés

Apprentissage par renforcement sur graphe adapté à la morphologie pour la locomotion de robots tenségrité

Apprentissage par imitation 3D pour la robotique par imagination latente asymétrique et reclassement

ObjView-Bench : repenser la difficulté et le déploiement pour la planification de vues centrées sur les objets

EFGCL : apprentissage du mouvement dynamique par curriculum guidé par forces externes, inspiré du spotting

CSR : politiques en temps réel à horizon infini avec représentations d'état massivement en cache

Propriétés dynamiques et reproductibilité d'un torse humanoïde pneumatique compact pour le contrôle piloté par données

SeedPolicy : passage à l'échelle par politique de diffusion auto-évolutive pour la manipulation robotique

PhySPRING : réduction préservant la structure des jumeaux numériques physiques via GNN

AT-VLA : injection tactile adaptative pour une meilleure réactivité dans les modèles vision-langage-action

Découpage Q adaptatif pour l'apprentissage par renforcement hors ligne vers en ligne

Sur l'émergence d'une structure pendulaire dans la locomotion multi-contacts

DexSim2Real : transfert simulation-réel guidé par un modèle fondation pour la manipulation dextérique généralisable

VLA-GSE : améliorer l'ajustement fin efficace en paramètres des VLA avec des experts généralisés et spécialisés

AsyncVLA : correspondance de flux asynchrone pour les modèles vision-langage-action (VLA)

CKT-WAM : transfert de connaissances contextuelles efficient entre modèles d'action du monde

ReActor : apprentissage par renforcement pour le reciblage de mouvement avec physique

Filtrage de l'information par régularisation variationnelle pour la manipulation robotique

Apprentissage par renforcement basé sur un modèle pour le contrôle robotique via optimisation en ligne

Apprendre à sentir le futur : DreamTacVLA pour la manipulation riche en contacts

Des pixels aux tokens : étude systématique de la supervision par actions latentes pour les modèles vision-langage-action (VLA)

Impression 3D de robots auto-pliants à actionnement passif avec modules fonctionnels intégrés

VILAS : une architecture bas coût intégrant un modèle VLA avec préhension souple pour la manipulation robotique

Apprendre à agir par le contact : une vision unifiée de l'apprentissage multi-tâches pour les robots

Rhythm : apprentissage du contrôle interactif corps entier pour deux robots humanoïdes

Générer du réalisme à partir de simulation : transfert vidéo efficace pour l'augmentation de données VLA

Une approche rigoureuse pour générer des démonstrations synthétiques haute fidélité en apprentissage par imitation

Revue des grands modèles de langage pour les systèmes multi-robots

HandelBot : jouer du piano en conditions réelles grâce à l'adaptation rapide de politiques de manipulation dextérique

VLA-ATTC : calcul adaptatif au moment du test pour les modèles VLA avec un critique d'action relative

ARIS : un système d'intelligence relationnelle à base d'agents pour les robots sociaux

ShapeGrasp : complétion de forme et préhension visuo-haptiques simultanées pour une manipulation robotique améliorée

Un cadre d'autonomie sémantique pour robots mobiles d'intérieur intégrant un VLM : raisonnement déterministe hybride et mémoire adaptative inter-robots

Cadre multi-dynamique unifié pour la modélisation orientée perception des robots continus à tendons

Apprentissage de dynamiques d'objets équivariantes augmentées par réseau de neurones à partir de peu d'interactions

STEP : politiques visuomotrices pré-initialisées avec prédiction de cohérence spatiotemporelle

Stabilité de l'apprentissage par renforcement guidé par fonction de Lyapunov de contrôle

VoxAfford : fusion multi-échelle voxel-token pour la détection d'affordances 3D à vocabulaire ouvert

Hydra-DP3 : dimensionnement adapté aux fréquences des politiques de diffusion 3D pour le contrôle visuomoteur

Système de localisation de contact et de mesure de force par vision pour pinces robotiques compliantes

Apprentissage de politiques de loco-manipulation quadrupède avec perception tactile

Les modèles d'action du monde généralisent-ils mieux que les VLA ? Une étude sur la robustesse

ViTaPEs : encodages de position visuo-tactiles pour l'alignement cross-modal dans les transformeurs multimodaux

Vulnérabilité des politiques de clonage comportemental aux attaques adversariales universelles

Apprentissage du parkour pour quadrupèdes : mélange d'experts parcimonieux avec entrée visuelle

RoboWM-Bench : un benchmark pour évaluer les modèles du monde en manipulation robotique

Modèle World-Value-Action : planification implicite pour les systèmes vision-langage-action (VLA)

Panorama des représentations de mémoire spatiale pour la navigation robotique efficace

Flow-Opt : optimisation centralisée et scalable de trajectoires multi-robots par flow matching et optimisation différentiable

CLAW : génération de mouvements corps entier composables et annotés en langage naturel