Dossier Physical Intelligence — π0 — page 3

339 articles · page 3 sur 7

Physical Intelligence et la famille π0 : modèles fondation cross-embodiment, transfert de compétences entre robots, levées Lux Capital et OpenAI Startup Fund.

101Pandaily Chine/AsieActu

PL-Universe Robotics dévoile sa gamme de produits d'IA physique industrielle 2.0

PL-Universe Robotics, start-up chinoise créée il y a seize mois, a présenté ce qu'elle nomme sa "Product Matrix 2.0", articulée autour de deux produits : AcCI, une solution de collecte de données multi-modale affichant une précision annoncée sub-millimétrique, et Dabai, un module robotique dédié au chargement et déchargement industriel intelligent. AcCI combine des interfaces de contrôle VR, maître-esclave et joystick, et capture simultanément des données de force, de couple, de pose, de retour tactile et de vision en boucle fermée. L'annonce s'accompagne d'une stratégie d'écosystème qualifiée d'"all-domain symbiotic" et d'un appel ouvert à des partenaires industriels mondiaux. L'enjeu déclaré est le goulot d'étranglement des données dans le déploiement à grande échelle de l'IA physique, un problème que le secteur reconnaît largement. Une plateforme de collecte end-to-end multi-modale, si elle tient ses promesses, répondrait à un besoin concret pour les intégrateurs cherchant à constituer des jeux de données de démonstration de qualité industrielle. Cependant, cette annonce reste au stade déclaratif : aucun client n'est nommé, aucun volume de déploiement n'est communiqué, et la précision sub-millimétrique est avancée sans conditions de test ni contexte de tâche précisés, ce qui rend toute évaluation indépendante impossible pour l'instant. PL-Universe s'inscrit dans un écosystème très concurrentiel : en Chine, Unitree Robotics et DEEP Robotics avancent sur le déploiement d'humanoïdes industriels, tandis qu'à l'international, Physical Intelligence avec Pi-0, Apptronik et 1X Technologies ont déjà des bases installées ou des contrats actifs sur des pipelines de données robotiques. La société cible un marché qu'elle évalue à "plusieurs milliers de milliards de yuans", une projection ambitieuse et invérifiable à ce stade. Aucune tarification ni date de disponibilité commerciale n'a été précisée ; la prochaine étape annoncée est le recrutement de partenaires d'écosystème à l'échelle mondiale, selon un modèle stratégique que l'entreprise décrit comme "1+N+infini".

Dossier Physical Intelligence — π0 — page 3

PL-Universe Robotics dévoile sa gamme de produits d'IA physique industrielle 2.0

Pro Universe Robotics dévoile sa gamme de produits d'IA incarnée industrielle 2.0

LoopVLA : l'amélioration itérative par suffisance apprise pour les modèles vision-langage-action (VLA)

HeteroGenManip : manipulation généralisable pour les interactions avec des objets hétérogènes

RePO-VLA : l'optimisation de politique guidée par la récupération pour les modèles vision-langage-action (VLA)

Wavelet Policy : apprentissage par imitation dans le domaine des échelles avec mémoire a priori du monde

CapVector : des vecteurs de capacité transférables dans l'espace paramétrique pour les modèles VLA

Système de collecte de données visuo-tactiles avec retour haptique pour l'apprentissage par imitation du grossier au précis

Apprentissage par imitation 3D pour la robotique par imagination latente asymétrique et reclassement

RLWRLD lance RLDX-1, un modèle fondation centré sur la dextérité pour mains robotiques

HAIC : contrôle agile d'interaction humanoïde avec les objets via un modèle du monde intégrant la dynamique

HumanNet : passage à l'échelle de l'apprentissage vidéo centré sur l'humain à un million d'heures

DynaRetarget : un retargeting dynamiquement réalisable par optimisation de trajectoire par échantillonnage

SeedPolicy : passage à l'échelle par politique de diffusion auto-évolutive pour la manipulation robotique

NoiseGate : plannings de bruit par pas de temps latent comme filtrage d'information dans les modèles monde-action

CSR : politiques en temps réel à horizon infini avec représentations d'état massivement en cache

AT-VLA : injection tactile adaptative pour une meilleure réactivité dans les modèles vision-langage-action

PhySPRING : réduction préservant la structure des jumeaux numériques physiques via GNN

Xiaoyu Robotics lève un nouveau tour de table, soutenu par Xiaomi, Didi et BAIC

Reconstruction ou sémantique ? Ce qui rend un espace latent utile pour les modèles du monde en robotique

VLA-GSE : améliorer l'ajustement fin efficace en paramètres des VLA avec des experts généralisés et spécialisés

Découpage Q adaptatif pour l'apprentissage par renforcement hors ligne vers en ligne

Vers une simulation visuellement réaliste : un benchmark pour évaluer la manipulation robotique en simulation

AsyncVLA : correspondance de flux asynchrone pour les modèles vision-langage-action (VLA)

Filtrage de l'information par régularisation variationnelle pour la manipulation robotique

ReActor : apprentissage par renforcement pour le reciblage de mouvement avec physique

CKT-WAM : transfert de connaissances contextuelles efficient entre modèles d'action du monde

Apprendre à sentir le futur : DreamTacVLA pour la manipulation riche en contacts

Des pixels aux tokens : étude systématique de la supervision par actions latentes pour les modèles vision-langage-action (VLA)

Générer du réalisme à partir de simulation : transfert vidéo efficace pour l'augmentation de données VLA

Revue des grands modèles de langage pour les systèmes multi-robots

ARIS : un système d'intelligence relationnelle à base d'agents pour les robots sociaux

VLA-ATTC : calcul adaptatif au moment du test pour les modèles VLA avec un critique d'action relative

Rhythm : apprentissage du contrôle interactif corps entier pour deux robots humanoïdes

Apprendre à agir par le contact : une vision unifiée de l'apprentissage multi-tâches pour les robots

VILAS : une architecture bas coût intégrant un modèle VLA avec préhension souple pour la manipulation robotique

VoxAfford : fusion multi-échelle voxel-token pour la détection d'affordances 3D à vocabulaire ouvert

Les modèles VLA sont restreints mais capables de généraliser à des instructions inédites

Unitree redéfinit le marché des robots humanoïdes d'entrée de gamme avec un modèle à 4 290 $

Les modèles d'action du monde généralisent-ils mieux que les VLA ? Une étude sur la robustesse

ViTaPEs : encodages de position visuo-tactiles pour l'alignement cross-modal dans les transformeurs multimodaux

Automatisation robotique assistée par apprentissage automatique pour la fabrication industrielle

Comment fonctionnent réellement les VLA en environnements ouverts

Un pipeline de déploiement rapide pour la préhension autonome de robots humanoïdes basé sur des modèles fondation

DeepThinkVLA : renforcer les capacités de raisonnement des modèles VLA

Modèle World-Value-Action : planification implicite pour les systèmes vision-langage-action (VLA)

π0.7 : un modèle fondation robotique généraliste et pilotable aux capacités émergentes

Modèles fondation en robotique : revue complète des méthodes, modèles, jeux de données, défis et perspectives

Calibration main-oeil en continu pour la manipulation robotique en environnement ouvert

Google DeepMind publie Gemini Robotics-ER 1.6 : raisonnement incarné amélioré et lecture d'instruments pour l'IA physique