Aller au contenu principal
Brain Corp et UC San Diego s'associent pour faire progresser la couche d'intelligence fondatrice pour l'IA physique
IA physiqueRobotics & Automation News3sem

Brain Corp et UC San Diego s'associent pour faire progresser la couche d'intelligence fondatrice pour l'IA physique

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UETake éditorial

Brain Corp, spécialiste californien de l'IA pour robots de service, a annoncé l'extension de sa collaboration de recherche avec l'Université de Californie à San Diego (UCSD). Le partenariat cible deux axes techniques : le mapping sémantique, qui permet à un robot de comprendre la signification fonctionnelle des espaces traversés (zone de caisse, allée frigorifique, quai de chargement), et l'intelligence contextuelle, qui lui permet d'adapter son comportement selon l'état dynamique de l'environnement. Aucune date de livraison, métrique de performance ni chiffre de déploiement n'a été communiqué dans l'annonce publiée.

Ce type de recherche vise à combler le fossé entre navigation autonome basique (évitement d'obstacles, planification de trajectoire) et compréhension sémantique de l'environnement, un prérequis pour les robots opérant dans des espaces commerciaux encombrés et changeants. Pour les intégrateurs et les COO industriels, l'enjeu est concret : un robot capable d'interpréter le contexte peut prendre des décisions plus robustes, réduire les interventions humaines et s'adapter à des configurations modifiées sans reprogrammation manuelle. C'est précisément ce que les constructeurs d'AMR cherchent à résoudre pour passer du pilote au déploiement à l'échelle.

Brain Corp est connue pour BrainOS, son système d'exploitation robotique embarqué sur des autolaveuses autonomes commercialisées par Tennant, Nilfisk et SoftBank Robotics, avec plusieurs milliers d'unités actives dans la grande distribution américaine. Face à des acteurs comme Locus Robotics, Aethon ou Savioke, Brain Corp mise sur une couche logicielle commune à plusieurs fabricants plutôt que sur du hardware propriétaire. Ce partenariat académique s'inscrit dans une stratégie de R&D long terme visant à positionner BrainOS comme infrastructure d'IA physique généraliste, au-delà du seul nettoyage de sols.

💬 Le point de vue du dev

Le mapping sémantique, c'est le chaînon manquant entre un robot qui évite les obstacles et un robot qui comprend où il est. Brain Corp a les meilleures raisons du monde de s'y attaquer, avec leurs milliers d'autolaveuses dans la grande distribution américaine qui butent chaque jour sur ce problème. L'annonce est vide de chiffres et de dates, mais la direction prise avec BrainOS comme couche commune à plusieurs fabricants, ça ressemble à la bonne stratégie.

Dans nos dossiers

À lire aussi

Built Robotics et Penn xLAB s'associent pour développer une IA physique dédiée à la construction
1Robotics Business Review 

Built Robotics et Penn xLAB s'associent pour développer une IA physique dédiée à la construction

Built Robotics, spécialiste américain de l'automatisation des engins de chantier fondé en 2016, s'associe au Safe Autonomous Systems Lab (xLAB) de l'Université de Pennsylvanie pour développer des modèles d'IA physiques adaptés aux environnements de construction. Le partenariat repose sur le déploiement de petits robots mobiles équipés de suites de capteurs, chargés de collecter des données sur des chantiers actifs : postures corporelles atypiques, occultations, conditions d'éclairage dégradées, comportements humains imprévus. Ces cas limites viennent enrichir un jeu de données déjà conséquent : Built revendique plus de 50 000 heures d'opérations terrain, l'installation de plus de 3 gigawatts de panneaux solaires et une présence sur plus de 40 sites. Depuis son entrée sur le marché du solaire à grande échelle en 2023 avec le RPD 35 (Robotic Pile Driver, son robot de battage de pieux autonome), la société a accumulé des volumes de données opérationnelles dans certains des environnements industriels les plus contraignants du secteur. L'objectif déclaré est de construire un "world foundation model" pour la coexistence sûre entre machines autonomes et opérateurs humains sur site. L'enjeu est structurant pour l'industrie de la construction, l'un des secteurs les plus accidentogènes au monde et l'un des derniers à amorcer sa transition vers l'autonomie robotique à grande échelle. Le partenariat cible explicitement le "sim-to-real gap" : l'écart entre la performance validée en environnement contrôlé et la robustesse réelle sur chantier, avec des centaines d'ouvriers sur des sites pouvant s'étendre sur plusieurs milliers d'acres. Le modèle edge AI de détection de personnes développé en interne par Built sera affiné à partir de ces données d'edge cases, avec l'ambition d'atteindre une perception dite "surhumaine", capable de détecter des dangers transitoires qu'un opérateur humain pourrait manquer. Pour les intégrateurs et les décideurs industriels, ce travail représente un pas vers une certifiabilité effective des systèmes autonomes outdoor, domaine où les standards de sécurité restent embryonnaires. Built est par ailleurs membre de l'Association of Equipment Manufacturers (AEM) et siège au Futures Council de l'organisation, dont Erol Ahmed, VP communications de Built, assure la présidence. Built Robotics a été fondé par Noah Ready-Campbell, diplômé de Penn, ce qui explique en partie la fluidité du rapprochement avec xLAB, dirigé par Rahul Mangharam, professeur en ingénierie électrique et des systèmes. Sur le plan concurrentiel, le segment des robots de construction autonomes voit émerger plusieurs acteurs : Caterpillar et Komatsu investissent dans l'autonomie de leurs engins lourds, tandis que des startups comme Dusty Robotics (traçage au sol) ou Trimble (géolocalisation de chantier) avancent sur des niches complémentaires. En Europe, des initiatives restent plus discrètes sur ce front spécifique. La phase initiale du pilote de recherche porte sur le déploiement du modèle edge AI de Built sur des chantiers actifs avec cartographie haute fidélité, avant une montée en puissance vers un modèle de fondation plus généraliste dont les contours et la timeline publique n'ont pas encore été précisés.

UEL'émergence d'un standard de perception 'surhumaine' et de certifiabilité pour robots autonomes outdoor pourrait servir de référence aux acteurs européens de la construction, encore en retrait sur ce segment spécifique.

IA physiqueOpinion
1 source
IA incarnée en évolution : Embodied-R1.5 améliore l'intelligence physique grâce aux modèles fondation
2arXiv cs.RO 

IA incarnée en évolution : Embodied-R1.5 améliore l'intelligence physique grâce aux modèles fondation

Une équipe de chercheurs a publié sur arXiv Embodied-R1.5, un modèle de fondation incarné (EFM pour Embodied Foundation Model) de 8 milliards de paramètres intégrant cognition incarnée, planification, auto-correction et pointage d'affordances dans une architecture unifiée, entraîné sur un corpus dépassant 15 milliards de tokens construit via trois pipelines automatisés. Le cadre Planner-Grounder-Corrector (PGC) en boucle fermée permet l'exécution autonome et l'auto-correction sur des tâches longues, soutenu par une recette d'apprentissage par renforcement multi-tâches équilibré pour atténuer les conflits entre sous-domaines hétérogènes. Sur les benchmarks standardisés, Embodied-R1.5 atteint l'état de l'art sur 16 des 24 benchmarks de VLM incarnés, devançant Gemini-Robotics-ER-1.5 de Google DeepMind et GPT-5.4 d'OpenAI. Adapté en VLA (Vision-Language-Action) avec peu de données de fine-tuning, il surpasse pi-0.5 de Physical Intelligence sur quatre suites de benchmarks de manipulation. Des tests zero-shot sur robot réel valident les performances en suivi d'instructions, ancrage d'affordances, manipulation d'objets articulés et tâches longues, les poids, le code d'entraînement et EmbodiedEvalKit, un framework d'évaluation dédié, étant publiés en open source. Qu'un modèle de 8 milliards de paramètres surpasse des systèmes adossés aux ressources de Google et d'OpenAI est un signal notable pour les intégrateurs industriels, car la compacité ouvre la voie à un déploiement embarqué sur plateformes contraintes. L'auto-correction en boucle fermée du PGC répond directement au demo-to-reality gap qui freine la commercialisation des robots polyvalents, tandis que la capacité à fine-tuner en VLA avec peu de données cible le goulot d'étranglement central de la collecte de données de manipulation étiquetées. L'open source complet facilite la comparaison reproductible et devrait accélérer les itérations communautaires, à condition que les performances zero-shot annoncées soient confirmées dans des configurations adversariales que le papier ne documente pas. Embodied-R1.5 s'inscrit dans la vague des modèles de fondation robotiques généraux densifiée depuis RT-2 de Google et OpenVLA, avec pour concurrents directs Physical Intelligence (pi-0, pi-0.5) et Google DeepMind (Gemini Robotics). L'absence d'acteurs européens parmi les concurrents benchmarkés reflète le retard du continent, où des acteurs comme Wandercraft ou Enchanted Tools restent cantonnés à des niches spécialisées. L'approche open source total distingue ce travail des modèles propriétaires de Figure AI (Figure 03) ou de 1X Technologies, positionnant potentiellement Embodied-R1.5 comme base de référence pour les laboratoires et industriels souhaitant spécialiser un EFM sur leurs propres flux de manipulation.

UELes poids et le code d'Embodied-R1.5 publiés en open source constituent une base de référence accessible pour les laboratoires européens (CEA-List, INRIA) souhaitant spécialiser un EFM sur leurs propres flux de manipulation sans dépendre des modèles propriétaires de Google ou OpenAI.

💬 8 milliards de paramètres qui coiffent Gemini Robotics et GPT-5.4 sur leurs propres benchmarks, en open source total, c'est inattendu. L'auto-correction en boucle fermée s'attaque directement au fossé entre la démo en labo et le robot qui tient la route en prod, ce qui est le vrai mur depuis RT-2. Bon, le papier esquive les configurations difficiles, donc on verra ce que ça donne quand la communauté s'en empare.

IA physiqueOpinion
1 source
Auto-cohérence guidée par la géométrie pour l'IA physique
3arXiv cs.RO 

Auto-cohérence guidée par la géométrie pour l'IA physique

KeyStone est une méthode de cohérence automatique à l'inférence pour les modèles d'IA physique basés sur la diffusion, présentée dans un preprint arXiv (arXiv:2605.08638) publié en mai 2026. Le principe opérationnel : au lieu de retenir une seule trajectoire d'action par round d'inférence, KeyStone génère K trajectoires candidates en parallèle depuis un contexte de modèle partagé, les regroupe par clustering dans l'espace d'action continu, puis retourne le médoïde du cluster le plus dense. Aucun modèle additionnel n'est requis. Les auteurs rapportent une amélioration du taux de succès allant jusqu'à 13,3 % par rapport à l'échantillonnage sur trajectoire unique, avec une latence additionnelle négligeable. La méthode a été validée sur plusieurs classes d'architectures : vision-language-action models (VLAs) et world-action models (WAMs). Le code est publié en open source sur GitHub. L'enjeu central est la fragilité intrinsèque des politiques diffusion-based : chaque inférence est stochastique, et retenir une mauvaise trajectoire compromet l'ensemble de l'épisode suivant, défaut qui se cumule sur des séquences longues. KeyStone exploite une propriété géométrique spécifique aux systèmes robotiques : la distance euclidienne entre chunks d'action reflète directement la similarité physique entre trajectoires, contrairement aux espaces token ou pixel où cette métrique est sémantiquement vide et nécessite un modèle de scoring appris. La sélection est donc principled et judge-free, sans coût d'entraînement. Pour un intégrateur ou un ingénieur robotique, l'argument est concret : gain de performance sans pipeline additionnel, sans latence notable. Ce dernier point repose sur le fait que l'inférence par diffusion est memory-bandwidth bound, laissant de la capacité de calcul disponible pour exécuter K chaînes en parallèle dans le même budget temporel. KeyStone s'inscrit dans l'écosystème des politiques de contrôle apprises pour la manipulation et la navigation physique, dont les représentants actifs sont pi0 de Physical Intelligence, OpenVLA (UC Berkeley), Octo et Diffusion Policy. Ces architectures génèrent des séquences d'action par diffusion ou flow matching, une approche en forte expansion mais exposée précisément à la variabilité stochastique que KeyStone cible. La méthode se positionne comme une amélioration orthogonale, applicable sans réentraînement à tout modèle de cette famille. Le preprint ne mentionne ni déploiement terrain, ni partenaire industriel, ni timeline commerciale : il s'agit d'une contribution de recherche académique, pas d'un produit. La mise en open source immédiate du code accélérera néanmoins l'évaluation par les équipes qui testent des pipelines VLA dans des environnements semi-structurés ou industriels.

IA physiqueOpinion
1 source
IA physique et fabrication vestimentaire : entretien avec le PDG de CreateMe sur la révolution du sans-couture
4Robotics & Automation News 

IA physique et fabrication vestimentaire : entretien avec le PDG de CreateMe sur la révolution du sans-couture

CreateMe, startup spécialisée dans l'automatisation du prêt-à-porter et dirigée par Campbell Myers, développe des systèmes de fabrication textile basés sur l'IA physique, des modèles capables de percevoir et de manipuler des matériaux souples en temps réel. L'approche centrale de l'entreprise repose sur le bonding (collage structurel) plutôt que sur la couture traditionnelle, une décision technique qui vise à simplifier radicalement la chaîne d'assemblage. L'industrie de l'habillement emploie plusieurs dizaines de millions de travailleurs à l'échelle mondiale, concentrés principalement en Asie du Sud-Est, et reste l'un des secteurs les moins automatisés de la fabrication industrielle. La manipulation de tissus constitue l'un des derniers grands verrous non résolus de la robotique. Contrairement aux pièces rigides traitées en automobile ou en électronique, les textiles se déforment, se plissent et changent de géométrie entre chaque opération, rendant inutilisables les approches classiques à trajectoire fixe. Passer du stitching au bonding n'est pas qu'un choix de process : c'est une façon de réduire le nombre d'états intermédiaires que le robot doit gérer, ce qui rend le problème de manipulation conditionnellement plus tractable pour les VLA (Vision-Language-Action models) actuels. SoftWear Automation avait tenté une première vague d'automatisation textile avec ses robots Sewbot dès les années 2010, sans atteindre la scalabilité industrielle. Sewts (Munich) travaille sur des segments adjacents liés au tri et au dépliage. CreateMe se positionne en aval, sur l'assemblage final, là où la valeur ajoutée est la plus dense. Le sim-to-real gap sur les déformables reste le principal obstacle technique non résolu ; les prochaines annonces de l'entreprise seront à lire en distinguant soigneusement démos contrôlées et déploiements en conditions réelles.

UESewts (Munich) est mentionné comme acteur européen sur des segments adjacents (tri et dépliage textile), mais CreateMe n'a annoncé aucun déploiement ni partenariat en Europe.

IA physiqueOpinion
1 source