Aller au contenu principal
Commande corpo-entière sûreté-critique pour robots humanoïdes via les barrières de contrôle entrée-état
RecherchearXiv cs.RO3sem

Commande corpo-entière sûreté-critique pour robots humanoïdes via les barrières de contrôle entrée-état

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (référence 2605.25546) un framework hiérarchique de contrôle sécurisé corps entier pour robots humanoïdes, fondé sur les fonctions barrières robustes aux perturbations (ISSf-CBF, Input-to-State Safe Control Barrier Functions). L'architecture s'articule en trois couches : un contrôleur whole-body cinématique (KinWBC) qui génère des références articulaires à partir de tâches priorisées, un filtre ISSf-CBF qui les ajuste au minimum pour satisfaire les contraintes de sécurité sous perturbations bornées, et un contrôleur whole-body dynamique (DynWBC) qui garantit la faisabilité corps entier et la stabilité des contacts. Les contraintes couvertes incluent les limites articulaires, l'évitement d'auto-collision, l'évitement d'obstacles et les frontières du workspace. Validé en simulation et sur robot réel, le système a été testé dans trois scénarios : locomotion, téleopération et équilibre monopode avec contrôle simultané des mains.

L'intérêt de l'approche tient à un problème fondamental en robotique humanoïde : les garanties de sécurité formelles s'effondrent dès qu'apparaît un écart entre le modèle de simulation et le comportement physique réel. Les CBFs classiques supposent un système parfaitement connu et deviennent fragiles face aux incertitudes de modèle, aux erreurs de suivi de trajectoire ou aux perturbations externes, précisément les conditions d'un environnement industriel. Les ISSf-CBFs étendent ce formalisme en admettant des perturbations bornées tout en maintenant des garanties formelles transférables du niveau cinématique vers la dynamique complète. Le filtre intervient de façon minimalement invasive, ne corrigeant les références nominales que lorsque nécessaire, ce qui préserve la performance globale. C'est une réponse directe au "demo-to-reality gap" structurellement reproché aux humanoïdes actuels, et un prérequis pour toute certification de robot collaboratif en environnement humain.

Les Control Barrier Functions sont un outil bien établi en automatique, popularisé dans les années 2010 pour les véhicules autonomes et les bras robotiques. Leur extension aux ISSf-CBFs pour la robustesse aux perturbations est plus récente, et leur application à un humanoïde corps entier avec des dizaines de degrés de liberté, des contacts multiples et des dynamiques non linéaires représente un saut de complexité notable. Dans la course actuelle aux humanoïdes, les acteurs comme Figure, Boston Dynamics, Tesla (Optimus), Agility Robotics, Apptronik ou Unitree publient peu sur les garanties de sécurité formelles corps entier, un domaine resté majoritairement académique. Ce travail n'annonce pas de déploiement industriel, mais fournit une brique méthodologique directement applicable aux pipelines de validation et de certification des futurs robots collaboratifs.

Impact France/UE

Les garanties de sécurité formelles apportées par ce framework sont directement pertinentes pour la certification des robots collaboratifs humanoïdes dans le cadre du Machinery Regulation et de l'AI Act européens.

À lire aussi

Commande à impédance adaptative à sécurité critique via fonctions barrière non lisses sous contraintes d'état et d'entrée
1arXiv cs.RO 

Commande à impédance adaptative à sécurité critique via fonctions barrière non lisses sous contraintes d'état et d'entrée

Des chercheurs ont publié sur arXiv (référence 2605.28367v1) un framework de contrôle d'impédance adaptatif en ligne conçu pour garantir la sécurité des manipulateurs robotiques lors d'interactions physiques avec des humains ou des environnements contraints. Le système, validé en simulation sur un manipulateur à 7 degrés de liberté (DOF), combine un filtre de sécurité basé sur un programme quadratique (QP) avec une nouvelle fonction de barrière de contrôle non lisse composée (NCBF), permettant d'imposer simultanément les contraintes de position et de vitesse articulaires via une barrière unifiée de degré relatif un. Les dynamiques inconnues sont compensées en ligne par un système de logique floue de type 2 par intervalles (IT2-FLS), les limites de couple actuateur sont gérées par des contraintes souples avec récupération exacte de solutions réalisables, et un observateur de perturbations renforce la robustesse face aux erreurs de modèle et aux forces d'interaction externes. Les simulations incluent une incertitude paramétrique sévère et des torseurs d'interaction externes appliqués simultanément. Le principal apport technique réside dans la formulation NCBF composée, qui unifie en une seule barrière de degré relatif un deux contraintes habituellement traitées séparément : position et vitesse articulaires. En pratique, les approches CBF standard nécessitent des traitements de degré relatif élevé pour les contraintes de position, ce qui complique la synthèse et réduit la robustesse. Ici, l'unification simplifie le problème QP et maintient la faisabilité même sous perturbations fortes. L'analyse Lyapunov composite prouve formellement l'invariance de l'ensemble sûr et la bornitude ultimement uniforme (UUB) de l'erreur de suivi d'impédance, deux garanties essentielles pour envisager une certification dans des contextes industriels ou médicaux. Ces résultats restent toutefois à l'étape simulation uniquement : aucune validation sur matériel réel n'est rapportée. Le contrôle d'impédance est la référence pour la manipulation compliante depuis les travaux de Hogan dans les années 1980, et les fonctions de barrière de contrôle (CBF) ont connu un essor considérable depuis les contributions d'Ames et al. dans la décennie 2010. Les approches concurrentes incluent les méthodes à tanks d'énergie, le contrôle passif basé sur la passivité, et les CBF à degré relatif élevé. Le recours à l'IT2-FLS distingue ce travail des CBF adaptatifs classiques en offrant une meilleure tolérance à l'incertitude que les systèmes flous de type 1. L'étape logique suivante sera la validation expérimentale sur plateforme réelle, notamment dans des scénarios d'assemblage ou de soins à la personne où l'interaction physique imprévue est la norme.

RecherchePaper
1 source
Rhythm : apprentissage du contrôle interactif corps entier pour deux robots humanoïdes
2arXiv cs.RO 

Rhythm : apprentissage du contrôle interactif corps entier pour deux robots humanoïdes

Des chercheurs ont publié en mars 2026 sur arXiv un framework baptisé Rhythm, conçu pour piloter simultanément deux robots humanoïdes Unitree G1 en interaction physique directe. Le système repose sur trois composants : un module IAMR (Interaction-Aware Motion Retargeting) qui génère des références de mouvement réalistes à partir de captures de données humaines, une politique d'apprentissage par renforcement IGRL (Interaction-Guided Reinforcement Learning) qui modélise les dynamiques de contact couplées via des récompenses basées sur des graphes, et un pipeline de transfert sim-to-real permettant de déployer ces comportements sur robots physiques. Les comportements validés incluent l'accolade et la danse synchronisée entre deux G1, transférés de simulation vers le monde réel. Il s'agit d'un travail académique, pas d'un produit commercialisé. L'intérêt technique est dans la résolution du problème de contact couplé multi-corps : quand deux humanoïdes se touchent, les efforts mécaniques se propagent en boucle entre les deux chaînes cinématiques, rendant le contrôle instable. Rhythm aborde ce problème par des récompenses graph-based qui capturent explicitement l'interaction entre les deux agents, plutôt que de traiter chaque robot indépendamment. Pour un intégrateur ou un ingénieur robotique, c'est une validation que le sim-to-real fonctionne même pour des dynamiques de contact bilatérales, un verrou qui bloquait la plupart des approches multi-robots à manipulation physique. Cela ouvre la voie à des tâches collaboratives exigeant une coordination fine, comme le port de charges lourdes à deux, le transfert d'objets ou l'assemblage bimanuel étendu. Le robot Unitree G1 est une plateforme commerciale accessible (environ 16 000 dollars), ce qui donne à ces résultats une reproductibilité supérieure aux travaux sur robots propriétaires. Dans la course aux humanoïdes, les acteurs comme Figure (Figure 03), Tesla (Optimus Gen 3), Physical Intelligence (Pi-0) et Boston Dynamics se concentrent sur des déploiements unitaires en environnement industriel ; la coordination physique entre deux humanoïdes reste un espace peu exploré commercialement. Rhythm ne s'inscrit pas encore dans une roadmap produit annoncée, mais la disponibilité du code sur arXiv et le choix du G1 suggèrent une communauté de recherche qui converge vers la standardisation des plateformes, préfigurant des pilotes industriels à horizon 18-36 mois.

RecherchePaper
1 source
HUSKY : système de skateboard humanoïde via contrôle corps entier conscient de la physique
3arXiv cs.RO 

HUSKY : système de skateboard humanoïde via contrôle corps entier conscient de la physique

Des chercheurs ont présenté sur arXiv (2602.03205) HUSKY, un framework permettant à l'humanoïde Unitree G1 de faire du skateboard de manière stable en conditions réelles. Un skateboard est une plateforme sous-actionnée soumise à des contraintes non-holonomes (le véhicule ne se déplace pas librement dans toutes les directions) dont l'inclinaison est mécaniquement couplée à l'orientation des trucks. HUSKY modélise ce couplage et décompose la tâche en deux phases : poussée du pied au sol et direction par inclinaison du corps (lean-to-steer), reliées par un mécanisme de transition guidé par trajectoire. Les mouvements de poussée sont appris via les Adversarial Motion Priors (AMP), une technique d'imitation générant des gestes naturels à partir de données de référence. Les tests sur le G1 démontrent une navigation agile en environnement réel. Ce travail pointe une limite structurelle des frameworks de contrôle whole-body actuels : ils supposent quasi-unanimement un sol statique et des contacts prévisibles. En modélisant la dynamique du couplage humain-objet, HUSKY montre qu'un humanoïde peut opérer sur un équipement mobile non conventionnel sans recalibration manuelle, ce qui ouvre la voie à des robots capables de manouvrer chariots ou palettes en environnement industriel. L'association d'un modèle physique du sous-système mécanique avec l'apprentissage par imitation constitue une approche plus robuste que les politiques entraînées en simulation pure, et le transfert sim-to-real semble validé sur un scénario concret. Les conditions précises des tests (vitesse, distance, taux d'échec) ne sont pas détaillées dans l'article, ce qui limite l'évaluation objective des performances annoncées. Le Unitree G1, humanoïde à 43 degrés de liberté vendu autour de 16 000 dollars, s'impose comme plateforme de référence pour la recherche en locomotion avancée aux côtés du Boston Dynamics Atlas et de l'Agility Digit. En 2025-2026, la recherche en contrôle whole-body dynamique s'accélère avec Pi-0 (Physical Intelligence), GR00T N2 (NVIDIA) et les politiques loco-manipulation développées à Carnegie Mellon. HUSKY se distingue en explorant le couplage avec des véhicules sous-actionnés plutôt que la manipulation d'objets statiques. Il s'agit pour l'instant d'une démonstration de recherche sans déploiement industriel annoncé, et les étapes suivantes naturelles incluent l'extension à d'autres véhicules (trottinette, vélo) ou des scénarios combinant locomotion et manipulation.

RecherchePaper
1 source
MuGen : un contrôleur de locomotion multi-compétences pour robots humanoïdes
4arXiv cs.RO 

MuGen : un contrôleur de locomotion multi-compétences pour robots humanoïdes

Des chercheurs ont publié le 26 mai 2026 sur arXiv un article présentant MuGen (Multi-Skill Generative Locomotion Controller), un framework d'apprentissage automatique visant à doter les robots humanoïdes d'une locomotion polyvalente et expressive. Le système repose sur des auto-encodeurs à quantification vectorielle (VQ-VAEs) entraînés par apprentissage par renforcement basé sur des modèles, combinés à un pipeline dit "enseignant-élève" avec distillation de politique. Le principe consiste à condenser des heures de données hétérogènes de mouvements humains en une représentation latente compacte, depuis laquelle un robot peut imiter des séquences de mouvement jamais vues à l'entraînement. À noter : l'article ne précise ni plateforme matérielle spécifique, ni métriques quantitatives concrètes (vitesse, payload, temps de cycle), ce qui est habituel pour un preprint de recherche fondamentale à ce stade. Ce qui distingue MuGen des approches classiques de locomotion humanoïde est le choix d'une représentation générative via VQ-VAE, plutôt qu'une politique spécialisée par comportement. Cette architecture permet la réutilisation de l'espace latent appris pour des tâches en aval, ouvrant la voie à un transfert de compétences sans réentraînement complet. La distillation enseignant-élève est un point structurant : la politique enseignante, puissante mais coûteuse en calcul, sert à former une politique élève légère et déployable sur matériel embarqué. Pour les intégrateurs et décideurs industriels, ce paradigme réduit le fossé sim-to-real et laisse entrevoir des robots capables d'adopter de nouveaux comportements locomoteurs à partir d'une simple séquence de référence humaine, sans fine-tuning massif. MuGen s'inscrit dans un courant de recherche actif sur l'imitation motrice pour humanoïdes, dans la lignée de travaux comme AMP (Adversarial Motion Priors, UC Berkeley), ASE ou PhysDiff. Dans l'industrie, Figure AI, Agility Robotics (Digit), Unitree et Tesla (Optimus) investissent massivement dans des pipelines similaires de whole-body control combinant motion capture et RL. L'usage de VQ-VAEs reste relativement peu exploré pour la locomotion, contrairement à son application établie en génération audio et image. Le papier étant un preprint arXiv sans révision par les pairs à ce stade, la prochaine étape déterminante sera une validation sur plateforme physique réelle avec métriques comparatives, condition sine qua non pour évaluer la portée opérationnelle de l'approche.

RecherchePaper
1 source