Dossier World models

58 articles

Les world models pour l'IA physique : Cosmos, Genie, V-JEPA, simulation différentiable comme alternative au sim2real classique.

Figure 1X Technologies Tesla Optimus Boston Dynamics Unitree AgiBot Apptronik Apollo Agility Robotics — Digit UBTech Fourier Intelligence Sanctuary AI Wandercraft Tous les dossiers →

1Pandaily Chine/AsieOpinion

IA incarnée : la startup Zenbot lève près de 100 millions de yuans lors de son tour d'amorçage

La startup chinoise Zenbot, spécialisée dans l'infrastructure d'IA embodied, a bouclé un tour de financement d'amorçage de près de 100 millions de yuans (environ 14 millions de dollars). Le tour est co-piloté par trois industriels cotés de la fabrication de précision : ChangYing Precision (300115.SZ), Kedali (002850.SZ) et Zhaoming Technology (301000.SZ), auxquels s'ajoutent le fonds entrepreneurial L2F Light Source et Sirius Capital. L'utilisation des fonds cible quatre axes : le développement d'un world model à vocation généraliste pour l'IA embodied, la production en série de modules articulaires exploitant des drivers GaN de troisième génération, le déploiement d'une architecture de communication temps réel dite "cerveau-colonne vertébrale" (brain-spine), et le renforcement des capacités de conception full-stack pour la production de masse de produits complets. Ce financement signale une tendance structurelle dans l'écosystème robotique chinois : les équipementiers de précision entrent directement au capital des startups d'IA embodied, cherchant à sécuriser un accès précoce aux briques technologiques critiques. L'intégration de drivers GaN dans les modules articulaires est un pari technique notable, ces composants semi-conducteurs de troisième génération promettent une densité de puissance supérieure et des pertes réduites par rapport au silicium classique, ce qui est déterminant pour l'autonomie et la compacité des robots humanoïdes. L'architecture brain-spine en temps réel répond à un verrou bien identifié du secteur : la latence de communication entre le contrôleur central et les actionneurs périphériques, souvent citée comme obstacle au déploiement industriel fiable. Zenbot s'inscrit dans une vague dense de startups chinoises d'IA embodied qui cherchent à concurrencer Figure, Boston Dynamics ou 1X Technologies sur le terrain des briques d'infrastructure plutôt que sur celui des robots finis. Le co-fondateur Dr. Jia Zhenzhong, diplômé du département d'instruments de précision de Tsinghua et docteur de l'Université du Michigan, positionne l'entreprise à l'intersection de la robotique, de la vision par ordinateur et des grands modèles d'IA. Aucun prototype public, ni timeline de production en série, ni client annoncé à ce stade : ce tour reste une annonce d'intention, avec des jalons technologiques ambitieux encore à démontrer.

Dossier World models

IA incarnée : la startup Zenbot lève près de 100 millions de yuans lors de son tour d'amorçage

Prismatic World Model : apprentissage de la dynamique compositionnelle pour la planification dans les systèmes hybrides

Modèle du monde multimodal pour interactions physiques : prédictions visuelles et tactiles simultanées pour une précision accrue

SenseTime ouvre un magasin de proximité avec des robots à IA physique à Shanghai

Les robots humanoïdes plient, ramassent et manipulent des objets fragiles avec plus de précision grâce à une nouvelle technologie

Distillation de simulation : pré-entraîner des modèles du monde en simulation pour une adaptation rapide au réel

DreamAvoid : rêverie au moment du test sur les phases critiques pour éviter les échecs des politiques VLA

Modèles d'action du monde : la prochaine frontière de l'IA incarnée

Des futurs imaginés aux actions exécutables : mélange d'actions latentes pour la manipulation robotique

HarmoWAM : harmoniser manipulation généraliste et précise grâce aux modèles d'action du monde adaptatifs

Apprentissage par imitation 3D pour la robotique par imagination latente asymétrique et reclassement

Lumos Robotics lève près d'1 milliard de yuans en séries A1 et A2, Mitsubishi Electric en tête

Deer Robot (Luming Robotics) lève près d'un milliard de yuans lors de ses séries A1 et A2, avec Mitsubishi Electric en chef de file

Le futur est-il compatible ? Diagnostic de la cohérence dynamique dans les modèles d'action du monde

HAIC : contrôle agile d'interaction humanoïde avec les objets via un modèle du monde intégrant la dynamique

EA-WM : un modèle du monde génératif intégrant des champs d'action cinématique-visuel structurés

Reconstruction ou sémantique ? Ce qui rend un espace latent utile pour les modèles du monde en robotique

Apprendre à sentir le futur : DreamTacVLA pour la manipulation riche en contacts

RoboAlign-R1 : alignement multimodal des récompenses pour les modèles du monde vidéo robotique

ARIS : un système d'intelligence relationnelle à base d'agents pour les robots sociaux

Being-H0.7 : un modèle du monde-action en perspective égocentrique

Modèles du monde nativement physiques : perspective hamiltonienne pour la modélisation générative

Les modèles d'action du monde généralisent-ils mieux que les VLA ? Une étude sur la robustesse

Modélisation du monde centrée sur les événements avec récupération augmentée par mémoire pour la prise de décision en IA incarnée

Un robot humanoïde chinois grandeur nature avec 18 000 capteurs maîtrise 115 degrés de liberté

AI² Robotics défend les modèles VLA et lance NeuroVLA

EvolvingAgent : un agent à curriculum auto-évolutif avec modèle du monde continu pour les tâches à long horizon

Modélisation unifiée des actions dans un monde 4D à partir de vidéos avec débruitage asynchrone

LLMPhy : un raisonnement physique à paramètres identifiables combinant grands modèles de langage et moteurs physiques

dWorldEval : évaluation évolutive de politiques robotiques via un modèle du monde à diffusion discrète

Mask World Model : prédire l'essentiel pour un apprentissage robuste des politiques robotiques

RoboWM-Bench : un benchmark pour évaluer les modèles du monde en manipulation robotique

Modèle World-Value-Action : planification implicite pour les systèmes vision-langage-action (VLA)

ICAT : tests adaptatifs fondés sur des incidents réels pour la prédiction de risques physiques dans les modèles du monde incarnés

ShadowAI lève 14 millions de dollars pour ses modèles du monde en 3D

The Download : Pokémon Go pour entraîner des modèles du monde, et la course États-Unis/Chine pour trouver des extraterrestres