Aller au contenu principal
DeepCybo : une startup pékinoise mise sur les données humaines en première personne pour développer une AGI incarnée
Chine/AsiePandaily4sem

DeepCybo : une startup pékinoise mise sur les données humaines en première personne pour développer une AGI incarnée

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

DeepCybo, startup pékinoise fondée début 2025 par Chen Kai, parie sur la vidéo humaine à la première personne comme substrat d'entraînement pour l'intelligence incarnée (embodied AGI). L'approche consiste à collecter des flux vidéo authentiques captés du point de vue d'opérateurs humains, plutôt que de s'appuyer sur la simulation ou les démonstrations téléopérées. La société a levé plusieurs centaines de millions de RMB et accélère actuellement sa collecte de données pour valider l'approche à l'échelle. Pendant ce temps, le marché mondial a convergé vers une thèse similaire : en mai 2025, Tesla a annoncé réorienter l'entraînement d'Optimus vers des données vidéo humaines ; en juin 2025, GeneralistAI a présenté un système d'apprentissage imitatif validé par 270 000 heures de données collectées en conditions réelles. FigureAI a annoncé des partenariats avec des groupes immobiliers commerciaux pour instrumenter des opérateurs humains. En février 2026, NVIDIA a publié EgoScale, un modèle pré-entraîné sur 20 000 heures de vidéo egocentriques pour la manipulation dextère.

La convergence de ces annonces en moins d'un an pointe vers une même conclusion : le sim-to-real gap reste difficile à combler via la simulation seule, et les données synthétiques ne généralisent pas suffisamment aux environnements non structurés. Pour les intégrateurs industriels et les équipes R&D, cela redéfinit l'actif stratégique central : la volumétrie et la qualité des données egocentriques comptent autant que l'architecture du modèle. La course à l'embodied AI ne se joue plus uniquement sur les paramètres du réseau, mais sur la capacité à instrumenter des humains à grande échelle, ce qui soulève des questions pratiques de coût de collecte, d'annotation et de diversité des scénarios.

DeepCybo évolue dans un écosystème chinois de la robotique humanoïde très compétitif, face à des acteurs comme Unitree, Agibot ou Zhiyuan Robotics, mais avec un positionnement centré sur l'IA plutôt que sur le hardware. À noter que l'article source utilise indifféremment les noms "DeepCybo" et "DeepMotor" sans distinction claire, ce qui suggère soit un changement de nom récent, soit une imprécision éditoriale. La principale inconnue reste le transfert effectif entre données humaines et performance robotique réelle en production : ni GeneralistAI ni NVIDIA n'ont encore démontré ce gap comblé à l'échelle commerciale, et DeepCybo, malgré une levée conséquente, n'a pas publié de résultats quantitatifs indépendants à ce stade.

À lire aussi

DeepMotor : une startup de Pékin mise sur les données en première personne pour une IA incarnée générale
1Pandaily 

DeepMotor : une startup de Pékin mise sur les données en première personne pour une IA incarnée générale

DeepMotor, une startup pékinoise fondée par Chen Kai au début 2025, développe une approche d'intelligence artificielle incarnée (embodied AGI) basée sur l'entraînement à partir de vidéos en première personne capturées par des humains. Au lancement, la thèse de l'entreprise n'a convaincu ni les investisseurs domestiques ni la majorité du secteur : pourquoi parier sur une méthode que même les géants américains n'avaient pas encore validée ? La startup a levé plusieurs centaines de millions de RMB et poursuit aujourd'hui un déploiement accéléré. La chronologie des validations industrielles donne la mesure de son avance : en mai 2025, Tesla a annoncé réorienter l'entraînement d'Optimus vers des données vidéo humaines. En juin 2025, GeneralistAI a présenté une démo d'apprentissage imitatif robotique, puis a confirmé les lois de mise à l'échelle avec 270 000 heures de données humaines réelles collectées sur le terrain. FigureAI a de son côté annoncé des partenariats avec des opérateurs immobiliers commerciaux pour collecter des flux en première personne. En février 2026, NVIDIA a publié EgoScale, un modèle pré-entraîné sur 20 000 heures de vidéo première personne destiné à la manipulation dextre. L'importance de cette séquence dépasse le simple calendrier. Elle valide l'hypothèse centrale de DeepMotor : la vidéo en vue égocentrique est le signal d'apprentissage le plus dense pour combler le sim-to-real gap en robotique généraliste. Chaque acteur majeur converge vers cette approche non par choix idéologique, mais parce que les benchmarks internes le forcent. Pour les intégrateurs industriels et les décideurs B2B, cela signifie que la prochaine génération de robots manipulateurs ne sera pas entraînée dans des simulateurs mais sur des flux de travail humains réels, ce qui redéfinit les exigences en matière de collecte de données et de gouvernance des contenus vidéo. DeepMotor s'inscrit dans un écosystème robotique chinois en forte accélération, concurrent direct d'Unitree, d'Agibot et des branches robotique de Baidu et Tencent, mais avec une orientation plus fondamentale sur la couche de données brutes plutôt que sur le hardware. La startup a devancé d'environ un an le consensus industriel mondial sur l'approche egocentric data, ce qui lui confère une position de référence potentielle si elle parvient à publier ses propres scaling laws ou à ouvrir un dataset. Les prochaines étapes probables incluent la publication de résultats comparatifs et des partenariats avec des fabricants de robots humanoides pour valider le transfert de politique sur des plateformes tiers. La source originale (Waves/暗涌) reste un media chinois spécialisé, et les chiffres de levée ne sont pas précisément détaillés.

UELe basculement de l'industrie vers les données vidéo égocentristes comme signal d'entraînement de référence redéfinira les exigences de collecte de données et de gouvernance vidéo pour les intégrateurs et fabricants de robots européens, sans acteur français ou européen directement impliqué à ce stade.

Chine/AsieOpinion
1 source
Unitree dépose un dossier d'introduction en Bourse pour devenir la première action d'IA incarnée
2Pandaily 

Unitree dépose un dossier d'introduction en Bourse pour devenir la première action d'IA incarnée

Unitree Robotics, fabricant chinois de robots généraux haute performance, a soumis le 1er juin 2026 son dossier d'introduction en bourse au comité d'admission de la Bourse de Shanghai pour examen. L'entreprise vise à devenir la "première action d'intelligence incarnée" cotée sur le marché A-share chinois, plus précisément sur le STAR Market, la section dédiée aux entreprises de haute technologie. Selon son prospectus, le chiffre d'affaires de Unitree est passé de 159 millions de yuans en 2023 à 1,699 milliard de yuans en 2025, soit un taux de croissance annuel composé de 226,78 %. Sur la même période, le résultat net (hors éléments exceptionnels) a basculé d'une perte de 18 millions à un bénéfice de 591 millions de yuans. Au premier trimestre 2026, la dynamique se complique : le chiffre d'affaires progresse encore de 68,49 % en glissement annuel, mais le bénéfice net chute de 52,55 %, sous l'effet d'une hausse de 38,3 millions de yuans des dépenses de R&D et d'une augmentation sensible des coûts commerciaux. L'entreprise revendique par ailleurs le titre de premier expéditeur mondial de robots humanoïdes en 2025, avec une présence déployée du plateau du Gala du Nouvel An chinois à l'aéroport de Haneda à Tokyo. Cette introduction en bourse marque une inflexion structurelle pour le secteur robotique chinois : le marché passe d'une phase "thématique", portée par les annonces et les narratifs, à une phase de "valorisation autonome", où les fondamentaux opérationnels prennent le dessus. Pour les intégrateurs et les décideurs industriels, la trajectoire financière de Unitree (rentabilité atteinte en deux ans, malgré une compression récente des marges liée à la R&D) confirme que certains acteurs du segment humanoïde ont franchi le cap de la viabilité économique. La baisse du bénéfice net au T1 2026 mérite toutefois d'être contextualisée : elle reflète un choix délibéré d'investissement intensif, pas un retournement de tendance, ce que les observateurs du STAR Market tendent à interpréter positivement, à condition que les dépenses restent concentrées sur les technologies cœur. La levée de fonds permettra d'accélérer la R&D et d'augmenter les capacités de production, avec des effets d'entraînement attendus sur toute la chaîne d'approvisionnement : capteurs, servosystèmes, algorithmes embarqués. Fondée à Hangzhou, Unitree s'est d'abord imposée avec ses robots quadrupèdes (gamme Go et B), avant d'élargir son catalogue aux robots semi-humanoïdes à double bras et aux humanoïdes bipèdes comme le H1 et le G1. La société évolue dans un environnement concurrentiel dense : Boston Dynamics (Hyundai), Figure AI, Agility Robotics (Amazon) et Tesla Optimus sur le segment international ; Fourier Intelligence, Leju Robotics et Agibot sur le marché domestique chinois. L'IPO s'inscrit dans un contexte de soutien politique explicite de Pékin à la filière robotique, identifiée comme priorité stratégique. Les prochaines étapes observables incluront l'allocation des fonds levés entre expansion capacitaire et R&D, ainsi que l'évolution des déploiements commerciaux au-delà des applications de démonstration, critère clé pour juger si Unitree bascule réellement du statut de "robot maker" à celui d'acteur d'infrastructure industrielle.

UEL'IPO renforce la capacité de Unitree à accélérer sa R&D et ses volumes de production, intensifiant la pression concurrentielle chinoise sur les fabricants européens de robots industriels et humanoïdes.

Chine/AsieOpinion
1 source
SenseTime mise sur les caméras spatiales grand public pour collecter des données réelles destinées à l'IA incarnée
336Kr 

SenseTime mise sur les caméras spatiales grand public pour collecter des données réelles destinées à l'IA incarnée

Zhuma Innovation (竹马创新), startup chinoise fondée en novembre 2025, vient de boucler un tour Angel+ de plusieurs dizaines de millions de yuans mené par SenseTime Guoxiang Capital, le bras d'investissement de SenseTime, avec la participation de Dinghui VGC et Fengru Capital. Les fonds serviront au développement produit, à la préparation de la production en série et à l'expansion internationale. La société développe Pebble, une caméra autonome grand public intégrant le rendu 3D Gaussian Splatting (3DGS), la fusion multi-capteurs et une interface AI-native, conçue pour capturer une scène tridimensionnelle aussi simplement qu'une vidéo ordinaire. Le produit est encore en phase de R&D et n'a pas atteint la production industrielle. L'intérêt stratégique de Zhuma dépasse le marché de la caméra 3D : la société se positionne comme infrastructure de données pour l'IA incarnée (embodied AI). Les modèles VLA (Vision-Language-Action) pilotant la prochaine génération de robots humanoïdes sont aujourd'hui majoritairement entraînés sur des données de téléopération, une méthode coûteuse et difficile à scaler. Le consensus qui émerge dans la recherche est que des vidéos en première personne, des données de capteurs spatiaux et des séquences comportementales en environnement réel constitueront la prochaine source dominante d'entraînement. Zhuma propose des données photoréalistes dotées de structure 3D, de sémantique et d'échelle physique correcte, directement utilisables pour construire des world models ou affiner la perception spatiale en simulation, réduisant ainsi la dépendance aux environnements synthétiques dont le réalisme reste limité. La société est cofondée par Zhang Ji, ancien vice-président de Kujiale (plateforme de design d'intérieur à grande échelle en Chine), et dirigée scientifiquement par Guo Jie, maître de conférences permanent à l'Université de Nanjing et spécialiste reconnu du 3DGS. La technologie 3DGS, popularisée depuis 2023, reconstruit des scènes 3D photoréalistes à partir de vidéos ordinaires, avec des performances supérieures au NeRF sur les temps de rendu. L'entrée de SenseTime comme investisseur principal apporte des ressources algorithmiques complémentaires aux capacités matérielles de Zhuma. Le marché reste largement ouvert : les acteurs industriels du lidar et des scanners haute précision n'ont pas encore attaqué le segment consommateur. Les investisseurs positionnent explicitement Zhuma comme un potentiel Insta360 de la caméra spatiale, une marque capable de définir une catégorie hardware avant que le marché ne se structure.

Chine/AsieOpinion
1 source
Maniformer lance une plateforme de données d'IA physique tout-en-un pour préparer l'ère de l'AGI
4Pandaily 

Maniformer lance une plateforme de données d'IA physique tout-en-un pour préparer l'ère de l'AGI

Maniformer, startup chinoise spécialisée dans l'infrastructure de données pour l'IA physique, a officiellement lancé sa plateforme de services de données en un seul guichet, accompagnée de la gamme matérielle MEgo et du système de gouvernance MEgo Engine. La gamme MEgo comprend trois composants : le MEgo Gripper pour la capture de données de manipulation robotique, le MEgo View, un dispositif de collecte portable à tête montée, et le MEgo Engine pour le traitement et la gouvernance des données. Ces outils affichent une précision millimétrique, une synchronisation sub-milliseconde et une perception panoramique supérieure à 300 degrés. Le système est nativement compatible avec le robot G2 Air, garantissant la cohérence entre environnements simulés et réels. Selon Yao Maoqing, président-directeur général, l'entreprise vise une capacité de production de dizaines de millions d'heures de données d'ici 2026, puis des dizaines de milliards d'heures d'ici 2030. Le problème que Maniformer cherche à résoudre est structurel : les données d'interaction physique réelle disponibles pour l'IA incarnée représentent moins de 1/20 000 de ce qui existe pour les grands modèles de langage. Ce déficit, combiné à l'absence de standards, à des problèmes de qualité hétérogène et à des inadéquations entre offre et demande, freine concrètement la commercialisation des robots autonomes. En proposant une infrastructure full-stack couvrant la télé-opération réelle, la collecte sans robot dédié et la génération synthétique par simulation, Maniformer cherche à décorréler la production de données de la disponibilité des plateformes robotiques elles-mêmes, une approche qui, si elle tient ses promesses, pourrait accélérer significativement le cycle sim-to-real pour les intégrateurs et les équipes R&D. L'analogie revendiquée avec l'électricité ou l'eau comme utilities est ambitieuse ; elle reste à valider à l'échelle industrielle. L'entreprise s'inscrit dans un contexte de course mondiale aux données d'entraînement pour robots humanoïdes et manipulateurs, où des acteurs comme Physical Intelligence (Pi-0), Boston Dynamics, Figure AI ou Unitree investissent massivement dans leurs propres pipelines de données propriétaires. La stratégie de Maniformer est différente : se positionner en fournisseur tiers d'infrastructure, à la manière d'un AWS pour la donnée physique. L'initiative "Hive" annoncée vise à fédérer des partenaires mondiaux pour co-construire des standards sectoriels, une démarche de standardisation qui, si elle aboutit, pourrait bénéficier à l'ensemble de l'écosystème, y compris aux acteurs européens comme Enchanted Tools ou Wandercraft qui peinent à constituer des datasets suffisants. La prochaine étape annoncée est le déploiement d'un réseau global de collecte de données, sans calendrier précis communiqué au-delà de l'horizon 2026.

UESi l'initiative 'Hive' de standardisation aboutit, les acteurs européens comme Enchanted Tools ou Wandercraft pourraient bénéficier d'une infrastructure de données partagée pour accélérer leurs pipelines sim-to-real.

Chine/AsieActu
1 source