Dossier arXiv cs.RO — page 3

568 articles · page 3 sur 12

Les preprints robotique sur arXiv cs.RO : les avancées techniques avant publication, dont planification, learning from demos, sim2real, manipulation.

101arXiv cs.RO RecherchePaper

SAGAS : assemblage par graphe sémantique pour la planification hors ligne en logique temporelle

Des chercheurs ont déposé sur arXiv (référence 2512.00775, version 2, 2025) un cadre baptisé SAGAS (Semantic-Aware Graph-Assisted Stitching) pour la planification robotique à long horizon à partir de données hors-ligne uniquement. Le problème ciblé : piloter un agent pour exécuter des tâches complexes décrites en logique temporelle linéaire (LTL), un formalisme mathématique exprimant des séquences de conditions du type "atteindre A, puis B, tout en évitant C", sans modèle de dynamique, sans démonstrations spécifiques à la tâche, et sans interaction en ligne avec l'environnement. SAGAS apprend deux composants offline à partir de fragments de trajectoires hétérogènes : un graphe latent d'atteignabilité réutilisable, et un exécuteur conditionné sur des objectifs figé après l'entraînement. Pour chaque nouvelle formule LTL au moment du test, le système augmente ce graphe avec des propositions sémantiques, puis applique une recherche en produit de Büchi pour synthétiser un plan de waypoints "prefix-suffix" à coût minimisé, exécuté par l'exécuteur figé. Les expériences portent sur les domaines de locomotion d'OGBench, une suite de benchmarks offline standard dans la communauté. La contribution centrale revendiquée est la généralisation zero-shot à des spécifications LTL non vues à l'entraînement, sans récompense tâche-spécifique ni réentraînement de politique. C'est une distinction structurelle face aux deux familles dominantes : la synthèse symbolique model-based exige un système de transitions étiqueté précis, difficile à construire sur du matériel réel, tandis que les méthodes d'apprentissage par renforcement supposent généralement une interaction en ligne ou des démonstrations dédiées. SAGAS déplace le raisonnement propre à chaque formule vers une augmentation de graphe et une recherche symbolique au temps d'inférence, découplant ainsi la capacité de généralisation du processus d'entraînement. À noter : les validations sont entièrement simulées sur OGBench ; le gap sim-to-real n'est pas adressé, ce qui limite la portée industrielle immédiate. La planification LTL en robotique mobilise un nombre croissant d'équipes, portée par le besoin de comportements vérifiables formellement sur des robots industriels et de service. Les approches concurrentes couvrent un spectre large : planification par diffusion (Diffuser, Decision Diffuser), politiques conditionnées par langage naturel via des VLA (vision-language-action models), et combinaisons de model checking avec du renforcement offline sur D4RL (IQL, CQL). SAGAS occupe la niche "offline + symbolique + zero-shot LTL", encore peu exploitée. Aucun déploiement matériel ni partenariat industriel n'est annoncé ; les suites logiques seraient une validation sur plateforme physique et une extension à des environnements à espace d'état plus riche.

Dossier arXiv cs.RO — page 3

SAGAS : assemblage par graphe sémantique pour la planification hors ligne en logique temporelle

Contacts corps rigides lisses formulés comme un ReLCP : un problème de complémentarité linéaire généré récursivement

X-Imitator : apprentissage par imitation spatial via interaction bidirectionnelle action-pose

Retrieve-then-Steer : mémoire de succès en ligne pour l'adaptation à l'inférence des VLA génératifs

IA incarnée : planifier en bac à sable, naviguer en monde ouvert grâce à l'expérience physique abstraite

PriorVLA : adaptation préservant les acquis pour les modèles vision-langage-action (VLA)

Pilotage unifié du bruit pour l'adaptation guidée par l'humain des modèles VLA

Entraînement au moment de l'inférence pour les modèles vision-langage-action à prévision visuelle (VLA)

Au-dessus et en dessous : SLAM multi-robots hétérogène pour domaines de surface et sous-marins

Politique CoLA-Flow : apprentissage par imitation temporellement cohérent via le flux d'actions latentes continues pour la manipulation robotique

HarmoWAM : harmoniser manipulation généraliste et précise grâce aux modèles d'action du monde adaptatifs

ORICF : un framework ouvert pour l'inférence et le contrôle en robotique

Planification kinodynamique avec coût terminal et incertitude apprise dans l'espace état-croyance

HiVLA : un système de manipulation incarnée hiérarchique centré sur l'ancrage visuel

MapNav : une nouvelle représentation mémoire par cartes sémantiques annotées pour la navigation vision-langage

ALAM : des transitions latentes algébriquement cohérentes pour les modèles VLA

Apprentissage sim-vers-réel zéro-shot pour robots : étude de préhension réactive par main dextérique

Tests de robustesse par recherche pour un logiciel de robotique de reconditionnement d'ordinateurs portables

AGILE : reconstruction des interactions main-objet à partir de vidéo par génération à base d'agents

Estimation de pose 6D par régression de cartes de chaleur de points-clés avec réseaux de neurones résiduels RGB-D

Évaluation d'une colonne vertébrale actionnée pour la locomotion agile de quadrupèdes

Bi3 : un jeu de données biplateforme, biculturel et bipersonnel pour la navigation des robots sociaux

Le futur est-il compatible ? Diagnostic de la cohérence dynamique dans les modèles d'action du monde

Dépasser le piège de la diversité en manipulation robotique via l'adaptation centrée sur les ancres

TAG-K : Kaczmarz glouton à moyenne de queue pour l'estimation en ligne efficace des paramètres inertiels

Latent Reasoning VLA : pensée latente et prédiction pour les modèles vision-langage-action

CommandSwarm : génération d'arbres de comportement en langage naturel pour essaims robotiques avec contraintes de sécurité

RobotEQ : de l'intelligence passive à l'intelligence active dans l'IA incarnée

Parkour humanoïde perceptif : enchaînement de compétences dynamiques par correspondance de mouvement

Évolution supervisée des capacités des agents incarnés : mise à niveau sûre, vérification de compatibilité et retour arrière en temps réel

Quand la vie vous donne du BC, créez des fonctions Q pour l'apprentissage par renforcement sur robot

De la saisie à l'insertion : assemblage de précision assisté par retour tactile sous tolérances inférieures au millimètre

ConsisVLA-4D : vers une meilleure cohérence spatiotemporelle pour la manipulation robotique avec un modèle VLA

Apprendre à oublier : mémoire épisodique hiérarchique pour le déploiement à long terme des robots

Contrôle à sûreté critique sous observabilité partielle : POMDP d'atteinte-évitement et contrôle dans l'espace des croyances

Un algorithme certifié exact pour la calibration généralisée robot-monde et main-œil

Sécurité de l'IA incarnée : panorama des risques, attaques et défenses

Préhension dextérique réactive par planification RL hiérarchique en espace de tâche et contrôle QP en espace articulaire

Lecture rapide et extensible des capteurs de mains dextériques par multiplexage à registre à décalage

Un jumeau numérique haute-fidélité pour la manipulation robotique basé sur le splattage gaussien 3D

Génération de démarche adaptative pour exosquelettes multi-terrains via des primitives de mouvement à noyau contraint

Navigation omnidirectionnelle par vision : apprentissage par distillation enseignant-élève avec estimation de profondeur monoculaire

RedVLA : l'attaque physique des modèles vision-langage-action (VLA)

Coordination par relais pour la collecte et livraison multi-robots économe en énergie

Fausse faisabilité dans le MPC à impédance variable pour la locomotion sur pattes

CorridorVLA : contraintes spatiales explicites pour les têtes d'action génératives via des ancres éparses

Démystifier la conception de l'espace d'action pour les politiques de manipulation robotique

Chaleur et compétence dans l'essaim : concevoir des équipes humain-robot efficaces

Planification hybride tâche-mouvement et gestion réactive des collisions pour le démontage multi-robots de batteries VE

L'utilisation des LLM pour la planification en IA incarnée introduit des risques de sécurité systématiques