Aller au contenu principal
Gestes robotiques naturels et expressifs via un apprentissage par renforcement itératif avec retours humains et LLMs
FR/EU ecosystemearXiv cs.RO18h

Gestes robotiques naturels et expressifs via un apprentissage par renforcement itératif avec retours humains et LLMs

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié en juin 2026 (arXiv:2606.18747) un système permettant au robot humanoïde Pepper de générer des gestes co-verbaux naturels à l'exécution, sans recours à des animations préprogrammées. L'architecture combine ChatGPT pour la génération de code gestuel en langage naturel, couplée à un pipeline d'apprentissage par renforcement à partir de retours humains (RLHF) appliqué de manière itérative. Des utilisateurs évaluent les gestes produits par Pepper lors d'une étude comparative, ces préférences servant de signal de récompense pour affiner le modèle de langage. Résultat annoncé : des mouvements jugés plus expressifs, pertinents et fluides qu'avec le seul pipeline LLM de base.

L'enjeu est significatif pour les intégrateurs de robots sociaux. Aujourd'hui, la quasi-totalité des comportements gestuels déployés en production repose sur des bibliothèques d'animations conçues à la main par des experts, ce qui rend les robots rigides face à des contextes conversationnels imprévus. Les approches par apprentissage automatique peinent à capturer la naturalité perçue, un critère subjectif qui se dégrade à mesure que le nombre de degrés de liberté augmente. Ce travail propose une alternative concrète : utiliser un LLM comme générateur de comportements moteurs au runtime, puis le corriger via RLHF pour coller aux préférences réelles des utilisateurs. C'est une transposition directe de la méthode qui a rendu ChatGPT lui-même plus utile, appliquée ici au domaine de la communication non verbale humain-robot. Les résultats restent néanmoins issus d'une étude utilisateur contrôlée, pas d'un déploiement à grande échelle.

Pepper est le robot social d'Aldebaran Robotics, société française rachetée par SoftBank en 2012, aujourd'hui commercialisé dans les secteurs retail, accueil et éducation. Après une phase de déception commerciale liée précisément à la rigidité comportementale du robot, plusieurs équipes académiques cherchent à relancer son potentiel via des couches IA génératives. Sur ce terrain, Pepper fait face à une concurrence croissante des agents conversationnels incarnés (avatars AR/VR) et de nouvelles plateformes comme Enchanted Tools (France) avec son robot Miroki, conçu dès l'origine pour une expressivité naturelle. La prochaine étape logique serait un déploiement en contexte réel pour mesurer le gap entre l'évaluation en laboratoire et l'acceptation en environnement ouvert, une question que les auteurs n'adressent pas encore.

Impact France/UE

Des travaux académiques sur Pepper (Aldebaran, origine française rachetée par SoftBank) appliquant l'RLHF à la gestualité co-verbale ouvrent une voie concrète pour réhabiliter cette plateforme en production, dans un contexte où Enchanted Tools (France) cherche à s'imposer sur le segment des robots sociaux expressifs avec Miroki.

À lire aussi

TAVIS : un benchmark pour la vision active égocentrique et le regard anticipateur en apprentissage par imitation
1arXiv cs.RO 

TAVIS : un benchmark pour la vision active égocentrique et le regard anticipateur en apprentissage par imitation

Une équipe de chercheurs a publié TAVIS, un environnement d'évaluation standardisé pour comparer les approches de vision active en apprentissage par imitation, soit la capacité d'une politique robotique à contrôler son propre regard pendant une tâche de manipulation. Le benchmark comprend deux suites : TAVIS-Head (5 tâches avec caméra sur cardan pan/tilt pour la recherche globale de scène) et TAVIS-Hands (3 tâches avec caméras de poignet pour gérer les occlusions locales). Il est construit sur IsaacLab et s'appuie sur deux embodiments de torse humanoïde : le GR1T2 de Fourier Intelligence et le Reachy2 de Pollen Robotics (Bordeaux). Environ 2 200 épisodes de démonstrations téléopérées sont publiés en format LeRobot v3.0 sur HuggingFace, avec Diffusion Policy et π₀ (Physical Intelligence) comme baselines. Trois résultats principaux ressortent : la vision active améliore les performances, mais de façon conditionnelle à la tâche ; les politiques multi-tâches se dégradent nettement sous distribution shift contrôlé ; et l'imitation seule produit un regard anticipatoire dont les temps de préemption médians, mesurés par la métrique GALT (Gaze-Action Lead Time), sont comparables à ceux du téléopérateur humain de référence. Jusqu'ici, plusieurs groupes avaient démontré indépendamment les bénéfices de la vision active en 2024-2025, sans base commune de comparaison. TAVIS comble ce vide avec trois primitives reproductibles : un protocole comparatif caméra mobile/caméra fixe sur des démonstrations identiques, la métrique GALT issue des sciences cognitives et de l'HRI (Human-Robot Interaction), et des splits procéduraux in-distribution/out-of-distribution. Le constat que les gains sont task-conditional invalide l'hypothèse naïve qu'ajouter des degrés de liberté à la caméra améliore systématiquement les performances, nuance décisive pour les intégrateurs industriels. La fragilité sous distribution shift constitue un signal d'alarme concret pour tout déploiement hors simulation. La vision active en manipulation connaît un regain d'intérêt depuis 2024, porté par les progrès des VLA (Vision-Language-Action models) et la disponibilisation de robots humanoïdes à têtes articulées. Le choix de Reachy2 comme plateforme de référence est notable : Pollen Robotics, startup bordelaise fondée en 2016, est l'un des rares acteurs européens dont le robot open-source figure dans des benchmarks académiques internationaux, face aux concurrents américains (Figure, Agility) et asiatiques (Fourier, Unitree). Les prochaines étapes naturelles incluent l'évaluation de politiques VLA récentes comme GR00T N2 ou OpenVLA sur TAVIS, ainsi que le transfert sim-to-real, que le papier ne couvre pas encore.

UEPollen Robotics (Bordeaux) est l'une des deux seules plateformes de référence du benchmark TAVIS, ce qui ancre un acteur français open-source au cœur d'une infrastructure d'évaluation académique internationale pour les politiques VLA.

FR/EU ecosystemePaper
1 source
Un bras robotique façon pieuvre pense avec ses ventouses pour explorer les fonds marins
2New Atlas Robotics 

Un bras robotique façon pieuvre pense avec ses ventouses pour explorer les fonds marins

Des chercheurs de l'Institut italien de technologie (IIT) ont présenté un bras robotique biomimétique inspiré de la pieuvre, conçu pour l'exploration des fonds marins. Contrairement aux systèmes actuels, qui reposent sur des mouvements préprogrammés, une architecture rigide et un processeur central unique, ce dispositif délègue le traitement de l'information directement aux ventouses : chaque ventouse embarque ses propres capteurs et une capacité de calcul locale, lui permettant d'interagir avec son environnement sans attendre les instructions d'un cerveau central. L'enjeu est significatif pour la robotique sous-marine. Les environnements océaniques combinent courants variables, faible visibilité et topographies imprévisibles, trois facteurs qui mettent en échec les architectures de contrôle centralisées classiques. En distribuant l'intelligence au niveau des effecteurs, l'approche de l'IIT réduit la latence de réaction et rend le système intrinsèquement plus résilient aux perturbations locales. C'est une validation concrète de l'intelligence incarnée (embodied intelligence) à l'échelle d'un organe préhensile, un paradigme que la communauté robotique théorise depuis des années sans déploiement probant en milieu réel non contrôlé. L'IIT est l'un des laboratoires européens les plus actifs en soft robotics, avec une longue tradition de recherche sur les robots inspirés des invertébrés marins. La pieuvre sert de modèle depuis près de 500 millions d'années d'évolution : neuf cerveaux (un central, huit dans les bras), une structure entièrement déformable, et une capacité d'adaptation sensorimotrice sans équivalent. Sur le plan concurrentiel, ce travail se positionne face aux approches rigides de Woods Hole Oceanographic Institution ou aux ROV conventionnels, et ouvre une voie distincte de celle des bras industriels sous-marins d'acteurs comme Schilling Robotics.

UEL'IIT (Italie) confirme son leadership européen en soft robotics biomimétique et positionne l'UE à la frontière de l'intelligence incarnée distribuée, un paradigme directement transférable aux bras manipulateurs de robots humanoïdes et aux systèmes physiques adaptatifs.

FR/EU ecosystemePaper
1 source
Vers une intelligence incarnée partagée pour les robots humanoïdes : développement et tests du robot ergoCub
3arXiv cs.RO 

Vers une intelligence incarnée partagée pour les robots humanoïdes : développement et tests du robot ergoCub

Des chercheurs de l'Istituto Italiano di Tecnologia (IIT) de Gênes ont publié en mai 2026 sur arXiv une architecture formelle pour humanoïdes collaboratifs, dont ils présentent une implémentation concrète dans le robot ergoCub. L'approche repose sur deux piliers conceptuels empruntés aux neurosciences cognitives : la "shared intelligence" (la capacité à modéliser les intentions et actions d'un partenaire humain) et l'"embodied cognition" (l'idée que corps et cognition co-évoluent en réponse à l'environnement). Concrètement, la morphologie d'ergoCub et ses paramètres de contrôle moteur ont été co-optimisés en prenant comme fonction objectif des métriques ergonomiques humaines, notamment en intégrant des modèles biomécaniques du corps humain directement dans la couche de planification du mouvement. L'abstract ne fournit pas de chiffres de charge utile, de DOF ni de temps de cycle, et aucune ligne de production ni site de déploiement industriel n'est mentionné : il s'agit d'un article de recherche, pas d'une annonce de produit. Le principal apport de ce travail est méthodologique : c'est l'un des rares frameworks à co-optimiser simultanément le hardware et l'intelligence physique d'un humanoïde autour de l'ergonomie humaine, plutôt que de traiter ces deux couches séparément. Pour les intégrateurs industriels et les équipes d'ingénierie, cela ouvre une voie de conception où le robot n'est pas simplement "sécurisé" par des capteurs de force ou des limites de vitesse, mais structurellement conçu pour minimiser la charge musculo-squelettique de l'opérateur lors de tâches de co-manipulation. C'est une réponse directe à l'un des angles morts des humanoïdes commerciaux actuels, qui optimisent surtout la dextérité autonome sans modéliser l'impact biomécanique sur le coéquipier humain. ergoCub est une évolution directe du robot iCub, plateforme de recherche humanoïde phare du programme européen RobotCub lancé par l'IIT dans les années 2000, qui compte aujourd'hui plus de 40 laboratoires utilisateurs dans le monde. Cette filiation place ergoCub dans un écosystème académique robuste, mais loin encore d'une commercialisation. Sur le terrain concurrent, les acteurs en avance sur la collaboration humain-robot incluent Physical Intelligence (pi0), Agility Robotics (Digit, déployé chez Amazon), et Figure (02), mais aucun ne publie de métriques ergonomiques formalisées de ce type. En Europe, Enchanted Tools (Mirokaï) et Wandercraft (Atalante X) restent les acteurs les plus avancés sur les humanoïdes à vocation assistive et médicale. Les prochaines étapes pour ergoCub passeront vraisemblablement par des validations expérimentales de l'architecture en conditions de co-manipulation réelle, avant tout envisagement de transfert industriel.

UEL'IIT de Gênes (EU) positionne l'Europe comme précurseur sur la co-optimisation hardware/intelligence autour de l'ergonomie humaine pour les humanoïdes collaboratifs, un angle différenciateur absent des architectures des constructeurs américains.

FR/EU ecosystemePaper
1 source
Nagel renforce sa stratégie d'automatisation industrielle grâce à un partenariat avec Stäubli Robotics
4Robotics & Automation News 

Nagel renforce sa stratégie d'automatisation industrielle grâce à un partenariat avec Stäubli Robotics

Nagel Technologies, société d'ingénierie spécialisée dans les solutions industrielles, a officiellement rejoint le réseau des partenaires autorisés de Stäubli Robotics. Ce statut d'"Authorized Partner" confère à Nagel un accès privilégié aux technologies robotiques du fabricant suisse, ainsi qu'un support technique renforcé et une intégration plus étroite dans l'écosystème commercial de Stäubli. Les deux entreprises présentent ce rapprochement comme un levier pour proposer aux industriels des solutions "plus performantes, plus flexibles et pleinement intégrées", sans que des chiffres de déploiement ou des références clients spécifiques ne soient communiqués à ce stade. Pour les intégrateurs et décideurs industriels, ce type de partenariat structuré signifie concrètement un accès prioritaire aux gammes de robots Stäubli (bras à 6 axes, robots SCARA, cobots TX2), à la formation certifiée et aux outils d'ingénierie dédiés. Cela réduit les délais de mise en service et renforce la crédibilité commerciale de Nagel face à des donneurs d'ordres exigeant des garanties sur la chaîne d'intégration. Il s'agit néanmoins d'une annonce de partenariat commercial, pas d'un déploiement de ligne de production documenté. Stäubli Robotics, filiale du groupe suisse Stäubli International fondé en 1892, est présent dans l'automatisation industrielle avec une gamme couvrant l'automobile, l'électronique et l'agroalimentaire. Nagel s'inscrit dans un mouvement plus large de consolidation des réseaux de distribution et d'intégration que les grands fabricants de robots accélèrent face à la demande croissante d'automatisation en Europe. Les prochaines étapes probables incluent des projets pilotes communs et une montée en compétence des équipes Nagel sur les plateformes Stäubli.

UEStäubli (Suisse) élargit son réseau d'intégrateurs certifiés en Europe, facilitant l'accès des industriels européens à ses robots via des partenaires locaux comme Nagel, sans déploiement documenté à ce stade.

FR/EU ecosystemeActu
1 source