Dossier Boston Dynamics — page 2

221 articles · page 2 sur 5

Boston Dynamics, pionnier de la locomotion : Atlas électrique, Spot patrouille industrielle et inspection, partenariats Hyundai et Toyota Research Institute.

51arXiv cs.RO RecherchePaper

RoboMemArena : un benchmark complet et exigeant pour la mémoire des robots

Une équipe de chercheurs a publié sur arXiv (2605.10921) RoboMemArena, un benchmark de grande envergure conçu pour évaluer les capacités mémorielles des robots dans des tâches longues et partiellement observables. Le benchmark couvre 26 tâches distinctes, avec des trajectoires d'exécution dépassant en moyenne 1 000 étapes par tâche, dont 68,9 % des sous-tâches nécessitent explicitement la mobilisation de la mémoire passée. Sa pipeline de génération repose sur un modèle vision-langage (VLM) pour composer les sous-tâches, produire les trajectoires via des fonctions atomiques, et annoter les séquences clés (keyframes, instructions de sous-tâches). Une évaluation en environnement physique réel complète les expériences en simulation, ce qui distingue RoboMemArena des benchmarks existants. Les chercheurs proposent également PrediMem, une architecture VLA à double système : un planificateur VLM haut niveau gère une banque mémoire combinant un buffer récent et un buffer de keyframes, tandis qu'une tête de codage prédictif améliore la sensibilité aux dynamiques de tâche. PrediMem surpasse tous les modèles de référence testés sur RoboMemArena. Ce travail s'attaque à un angle mort persistant dans la recherche robotique : les systèmes actuels, y compris les VLA récents comme Pi-0, GR00T N2 ou Helix, sont majoritairement évalués sur des tâches courtes et observables, où la mémoire à long terme n'est pas critique. RoboMemArena expose la fragilité de ces architectures dès que l'horizon de décision s'allonge et que l'environnement devient partiellement observable. Pour un intégrateur ou un décideur B2B, le chiffre-clé est celui des 1 000 étapes : la plupart des benchmarks industriels actuels restent en dessous de 100 étapes, ce qui masque des lacunes importantes en conditions réelles. L'inclusion d'une évaluation physique réelle renforce la crédibilité des résultats, même si les détails de configuration matérielle ne sont pas précisés dans l'abstract. La question de la mémoire robotique n'est pas nouvelle : des travaux comme MemoryReplay, EpisodeVQA ou les architectures à attention récurrente (R-VLA) ont posé les bases, mais sans benchmark unifié à cette échelle. RoboMemArena s'inscrit dans une tendance plus large d'outillage de l'évaluation des VLA, aux côtés de BenchBot, RLBench2 ou Open X-Embodiment. PrediMem reste pour l'instant un modèle académique sans déploiement annoncé, et ses résultats devront être confirmés sur des plateformes matérielles tierces (Unitree G1, Figure 03, Boston Dynamics Atlas) pour convaincre au-delà du laboratoire. Les auteurs évoquent des lois de mise à l'échelle (scaling laws) pour les systèmes mémoriels complexes, ce qui suggère une piste de recherche active dans les mois à venir.

UELes laboratoires européens (CEA-List, INRIA) pourraient adopter RoboMemArena comme référence commune pour évaluer leurs architectures VLA sur des horizons longs, comblant l'absence actuelle de benchmark unifié à cette échelle.

Dossier Boston Dynamics — page 2

RoboMemArena : un benchmark complet et exigeant pour la mémoire des robots

Piloter un robot humanoïde par instructions en langage libre : un modèle d'action à grand vocabulaire de mouvement unifié

EFGCL : apprentissage du mouvement dynamique par curriculum guidé par forces externes, inspiré du spotting

Des priors de diffusion avec contraintes pour une locomotion quadrupède haute fidélité et polyvalente

Propriétés dynamiques et reproductibilité d'un torse humanoïde pneumatique compact pour le contrôle piloté par données

Xiaoyubot lève un nouveau tour de table, soutenu par Xiaomi, Didi et BAIC

Vidéo : deux robots de Figure AI coopèrent seuls pour nettoyer une chambre

Unitree lance UniStore, le premier App Store mondial pour robots humanoïdes, avec 24 applications de mouvement disponibles au lancement

Parkour humanoïde perceptif : enchaînement de compétences dynamiques par correspondance de mouvement

Sur l'émergence d'une structure pendulaire dans la locomotion multi-contacts

ConsisVLA-4D : vers une meilleure cohérence spatiotemporelle pour la manipulation robotique avec un modèle VLA

Apprentissage par renforcement contraint via découplage dynamique sphérique-radial

Apprentissage par renforcement basé sur un modèle pour le contrôle robotique via optimisation en ligne

IA incarnée : un compromis nécessaire entre confidentialité et utilité

Le robot humanoïde Unitree G1 provoque un premier retard de vol à cause de ses batteries

Vidéo : le robot Atlas bouge déjà mieux que certains gymnastes

Sécurité de l'IA incarnée : panorama des risques, attaques et défenses

OGPO : un affinage complet et efficace des politiques de contrôle génératives

Le robot humanoïde AEON s'attaque aux opérations en usine dans une offensive d'autonomie réelle

Sentinel-VLA : modèle VLA métacognitif à surveillance active pour le raisonnement dynamique et la récupération d'erreurs

Rhythm : apprentissage du contrôle interactif corps entier pour deux robots humanoïdes

Une approche rigoureuse pour générer des démonstrations synthétiques haute fidélité en apprentissage par imitation

Stabilité de l'apprentissage par renforcement guidé par fonction de Lyapunov de contrôle

VoxAfford : fusion multi-échelle voxel-token pour la détection d'affordances 3D à vocabulaire ouvert

Physical AI : l’intelligence artificielle incarne enfin le monde réel

Cartes de coût conditionnées à la tâche pour la locomotion sur pattes

Locus Robotics déploie Locus Array pour l'automatisation complète des entrepôts

À Silicon Valley, des entreprises d'IA incarnée chinoises et américaines échangent sur 4 problèmes clés

Unitree redéfinit le marché des robots humanoïdes d'entrée de gamme avec un modèle à 4 290 $

Apprentissage de politiques de loco-manipulation quadrupède avec perception tactile

De la requête à l'actuation physique : modélisation holistique des menaces dans les systèmes robotiques pilotés par LLM

Figure affirme produire un robot humanoïde par heure, soit une multiplication par 24 en quatre mois

M2R2 : représentation robotique multimodale pour la segmentation temporelle des actions

Fausse faisabilité dans le MPC à impédance variable pour la locomotion sur pattes

Accenture, Vodafone et SAP testent des robots humanoïdes en entrepôt

ExpressMM : des comportements de manipulation mobile expressifs dans les interactions humain-robot

Transformer de navigation multimodal sensible à l'incarnation physique

Alfie : nouveau robot humanoïde autonome pour les tâches industrielles complexes

L'utilisation des LLM pour la planification en IA incarnée introduit des risques de sécurité systématiques

Un pipeline de déploiement rapide pour la préhension autonome de robots humanoïdes basé sur des modèles fondation

Vidéo : ce robot chinois a battu le record du semi-marathon détenu par un humain

Suivi simplifié : retargeting neural des mouvements pour le contrôle global du robot humanoïde

Améliorer la stabilité des robots mobiles sur terrain accidenté grâce à la surveillance des vibrations

MODEX 2026 : retour sur le salon

Tesla pris de vitesse ? Chery vend déjà son robot humanoïde en ligne

Des robots quadrupèdes lisent des jauges et thermomètres grâce à Google Gemini

Google DeepMind publie Gemini Robotics-ER 1.6 : raisonnement incarné amélioré et lecture d'instruments pour l'IA physique

Agibot livre son 10 000e robot humanoïde produit en série

Amazon rachète une start-up de robots humanoïdes

Quel est le robot humanoïde avec Brigitte Macron et Melania Trump à la Maison Blanche ?