Aller au contenu principal

Dossier Exotec

42 articles

Exotec et Skypod : licorne française de l'automatisation d'entrepôt, déploiements Carrefour, Decathlon, GAP, expansion industrielle aux États-Unis.

SAP et Cyberwave déploient des robots autonomes à base d'IA dans un entrepôt logistique SAP
1Robotics & Automation News FR/EU ecosystemeOpinion

SAP et Cyberwave déploient des robots autonomes à base d'IA dans un entrepôt logistique SAP

SAP, premier éditeur mondial de logiciels ERP avec plus de 300 000 clients dans 180 pays, et Cyberwave, startup spécialisée en logiciels IA pour la robotique, ont annoncé le déploiement de robots autonomes alimentés par intelligence artificielle dans un entrepôt logistique SAP en activité. Le communiqué ne précise pas les caractéristiques techniques des robots (payload, degrés de liberté, temps de cycle), ni les volumes traités, ni la localisation géographique du site. Cette initiative s'inscrit dans la stratégie "Physical AI" que SAP a formellement annoncée en 2025. Ce déploiement est notable parce qu'il marque un glissement de rôle pour SAP : l'éditeur ne se contente plus de fournir les logiciels WMS (Warehouse Management System) qui orchestrent la logistique, il opère désormais directement des robots autonomes dans ses propres installations. Pour les intégrateurs et les DSI industriels, cela pose une question concrète : SAP cherche-t-il à absorber la couche middleware robotique dans sa suite, réduisant la marge de manoeuvre des spécialistes tiers ? La distinction entre annonce de déploiement et mise en production pérenne reste à confirmer, le communiqué ne donnant pas de métriques opérationnelles vérifiables. Cyberwave, fondée pour développer des couches logicielles d'autonomie pour robots industriels, s'appuie ici sur l'intégration native avec l'écosystème SAP comme argument commercial différenciant. Dans l'espace AMR pour entrepôts, la concurrence est dense : Exotec (France, déjà déployé chez Decathlon et Fnac-Darty), Locus Robotics, Körber et Boston Dynamics se disputent les grands comptes. L'absence de chiffres concrets dans cette annonce invite à attendre une communication plus étoffée avant d'évaluer l'impact réel du partenariat.

UESAP, éditeur ERP allemand au cœur des systèmes logistiques européens, amorce une intégration verticale vers la couche robotique physique qui pourrait réduire la marge de manœuvre des intégrateurs tiers et forcer les DSI industriels européens à reconsidérer leur architecture middleware.

1 source
Surmonter l'aveuglement aux dynamiques : correction de vitesse et de trajectoire sans entraînement pour les modèles VLA
2arXiv cs.RO 

Surmonter l'aveuglement aux dynamiques : correction de vitesse et de trajectoire sans entraînement pour les modèles VLA

Des chercheurs ont publié mi-mai 2026 sur arXiv (référence 2605.11459) une méthode baptisée "Pace-and-Path Correction" pour corriger un angle mort structurel des modèles VLA (Vision-Language-Action). Ces modèles, socle technique des bras manipulateurs de nouvelle génération, sont entraînés sur des observations à image unique (single-frame), ce qui les rend incapables de percevoir les dynamiques temporelles lors de l'exécution d'une séquence planifiée. En pratique, dès qu'un objet bouge pendant que le robot exécute un "action chunk", les performances chutent sévèrement, même après fine-tuning sur des datasets dynamiques. L'opérateur proposé s'applique à l'inférence sans ré-entraînement, comme une couche wrapper autour de tout VLA à action chunking, et se décompose en deux canaux orthogonaux issus d'une minimisation de coût quadratique unique : un canal "pace" compressant l'exécution le long de la trajectoire prévue, et un canal "path" appliquant un décalage spatial orthogonal pour absorber les perturbations dynamiques dans la fenêtre temporelle du chunk. Évalué sur MoveBench, un benchmark conçu pour isoler le mouvement comme seule variable contrôlée, la méthode améliore le taux de succès de 28,8 points de pourcentage en environnement purement dynamique et de 25,9 points en contexte mixte statique-dynamique, surpassant les VLAs de base ainsi que les approches dynamiques-adaptatives existantes. L'enjeu est directement opérationnel : les VLAs actuels comme pi-0 de Physical Intelligence, OpenVLA ou GR00T N2 de Nvidia peinent dès qu'un convoyeur avance ou qu'un opérateur interfère avec la scène, soit le cas standard en environnement industriel réel. Corriger ce "dynamics gap" exigeait jusqu'ici un ré-entraînement coûteux, souvent rédhibitoire pour un intégrateur sans infrastructure ML dédiée. Le caractère training-free de Pace-and-Path Correction signifie qu'elle peut s'intégrer sur un modèle déjà déployé sans modifier les poids ni la pipeline d'apprentissage, abaissant drastiquement la barrière d'adoption pour des déploiements en conditions réelles. La "dynamics-blindness" des VLAs est une critique récurrente depuis l'émergence de pi-0 et OpenVLA en 2024-2025, la majorité des démonstrations publiques ayant lieu sur scènes statiques et laissant ouvert le demo-to-reality gap dès que les conditions industrielles se compliquent. Ce travail s'inscrit dans la course à la manipulation robuste que se livrent Nvidia, Figure (Figure 03), Boston Dynamics et 1X Technologies. Aucun acteur français n'est directement cité, mais les conclusions intéressent des intégrateurs comme Exotec et des équipes de recherche comme le LAAS-CNRS travaillant sur la manipulation en environnement non-structuré. La prochaine étape logique est une validation sur hardware réel - le papier reste à ce stade un benchmark simulé - et une intégration dans des stacks open-source comme LeRobot de Hugging Face.

UELes équipes LAAS-CNRS travaillant sur la manipulation non-structurée et des intégrateurs comme Exotec pourraient adopter cette correction sans ré-entraînement pour améliorer la robustesse de déploiements VLA en environnement industriel dynamique, sans infrastructure ML dédiée.

💬 Le dynamics gap des VLAs, on le connaissait depuis l'émergence de pi-0 : dès qu'un objet bouge pendant l'exécution d'un chunk, c'est la déroute. Ce qui change ici, c'est que la correction s'applique à l'inférence sans toucher aux poids, comme une couche qu'on pose par-dessus n'importe quel modèle déjà déployé. +28 points sur MoveBench, training-free : si ça tient sur hardware réel, les intégrateurs n'ont plus d'excuse pour rester sur des scènes statiques.

IA physiqueOpinion
1 source
Exotec s'associe à Musinsa pour automatiser l'entrepôt de cette marque de K-fashion en pleine croissance
3Robotics & Automation News 

Exotec s'associe à Musinsa pour automatiser l'entrepôt de cette marque de K-fashion en pleine croissance

Exotec, entreprise française de robotique logistique fondée en 2015 à Lille, annonce son premier déploiement commercial en Corée du Sud en partenariat avec Musinsa, principale plateforme de mode coréenne (K-fashion). Le projet consiste à équiper un nouvel entrepôt automatisé de Musinsa avec le système Skypod d'Exotec, des robots AMR capables de grimper sur des structures de rayonnage à grande hauteur pour préparer les commandes. Les détails opérationnels précis (nombre de robots, capacité de stockage, débit horaire) ne sont pas divulgués dans l'annonce, ce qui limite l'évaluation indépendante des performances annoncées. Ce contrat représente une étape stratégique dans la pénétration du marché asiatique par Exotec, après une implantation au Japon ces dernières années. Pour Musinsa, dont la croissance internationale s'accélère portée par l'engouement mondial pour la mode coréenne, l'automatisation de la logistique est un levier direct de scalabilité : réduire le coût de traitement par commande et absorber les pics saisonniers sans recrutement proportionnel. Ce type de déploiement confirme que les solutions de goods-to-person à robots grimpants trouvent preneurs dans la mode en ligne, un secteur à forte variabilité SKU et cadences irrégulières. Exotec a levé 335 millions de dollars en Serie D en 2022, atteignant le statut de licorne, et compte parmi ses clients Decathlon, 3PL Geodis ou encore Carrefour en Europe. La compétition sur le segment goods-to-person est intense, avec AutoStore (norvégien, très présent en logistique mode), Hai Robotics (chinois, fortement implanté en Asie), et Symbotic côté américain. L'entrée en Corée du Sud positionne Exotec dans un marché e-commerce dynamique avant une éventuelle introduction en bourse évoquée par la direction.

UECe déploiement en Corée du Sud conforte la stratégie d'expansion asiatique d'Exotec (licorne française fondée à Lille) et renforce la crédibilité de l'écosystème robotique français à l'international, avec une introduction en bourse potentielle en ligne de mire.

FR/EU ecosystemeOpinion
1 source
Vers une prédictibilité fiable du transfert simulation-réel pour la locomotion quadrupède robuste à base de MoE
4arXiv cs.RO 

Vers une prédictibilité fiable du transfert simulation-réel pour la locomotion quadrupède robuste à base de MoE

Des chercheurs ont présenté dans un preprint arXiv (2602.00678, version 4) un cadre unifié combinant une politique de locomotion Mixture-of-Experts (MoE) et RoboGauge, une suite d'évaluation prédictive du transfert simulation-réel, appliquée à la locomotion quadrupède. L'architecture MoE déploie un ensemble d'experts spécialisés activés par un mécanisme de gating, chacun modélisant un sous-espace distinct de représentation du terrain et des commandes moteur, en s'appuyant uniquement sur la proprioception (encodeurs articulaires, centrale inertielle), sans caméra ni LiDAR. Les expériences sur un Unitree Go2 ont validé une locomotion robuste sur des terrains non vus à l'entraînement: neige, sable, escaliers, pentes et obstacles de 30 cm. En tests haute vitesse, le robot a atteint 4 m/s, avec apparition spontanée d'une allure à faible écartement latéral que les auteurs associent à une meilleure stabilité dynamique à grande vitesse. L'apport central est RoboGauge, qui génère des métriques proprioceptives multi-dimensionnelles via des tests sim-to-sim couvrant plusieurs terrains, niveaux de difficulté et randomisations de domaine, permettant de sélectionner le meilleur checkpoint de politique MoE sans validation physique répétée. Pour les équipes de R&D et les intégrateurs industriels, cela adresse directement le principal goulot d'étranglement du déploiement de robots marcheurs: le coût et le risque des essais terrain. La robustesse obtenue avec proprioception seule est également significative, car elle conteste l'hypothèse fréquente selon laquelle la vision ou le LiDAR seraient indispensables hors d'environnements contrôlés, élargissant l'espace d'application en milieux non structurés (entrepôts, chantiers, extérieurs). Il convient cependant de noter que les métriques de vitesse et d'obstacle sont issues de tests en conditions choisies, sans données de taux d'échec agrégées sur des déploiements prolongés. Ce travail s'inscrit dans une filière de recherche initiée par ETH Zurich avec ANYmal (commercialisé par ANYbotics) et les équipes de Berkeley sur l'apprentissage agile en locomotion. Le Unitree Go2, vendu autour de 1 600 dollars, est devenu la plateforme de référence académique en raison de son accessibilité. Les concurrents industriels comme Boston Dynamics (Spot) ou les acteurs AMR européens comme Exotec développent des approches similaires de robustesse multi-terrain, bien que leurs validations restent largement propriétaires. Les suites naturelles de ce travail incluent la publication de RoboGauge comme outil de benchmark open-source inter-plateformes et son extension potentielle à d'autres morphologies, notamment les humanoïdes dont le transfert sim-to-real reste un défi ouvert.

UESi RoboGauge est publié en open source, les équipes européennes (ANYbotics, intégrateurs industriels UE) bénéficieraient d'un outil de benchmark standardisé réduisant les coûts de validation physique pour la locomotion quadrupède.

RecherchePaper
1 source
Décision séquentielle par apprentissage multi-échelle pour la préparation de commandes en robotique de manutention
5arXiv cs.RO 

Décision séquentielle par apprentissage multi-échelle pour la préparation de commandes en robotique de manutention

Des chercheurs ont publié en mai 2026 sur arXiv (référence 2605.08758) un framework de décision séquentielle baptisé OLSF-TRS, pour Omni-scale Learning-based Sequential Decision Framework for Tote-handling Robotic Systems. Ce système combine optimisation combinatoire structurée et apprentissage par renforcement multi-agent (MARL) pour coordonner simultanément les décisions liées aux commandes, aux bacs de manutention (totes) et aux robots dans les centres de préparation automatisés. En configuration petite échelle, OLSF-TRS affiche un écart d'optimalité moyen inférieur à 3,5% sur deux architectures système distinctes. En configuration grande échelle, il réduit les mouvements de bacs de 8 à 12% par rapport aux baselines heuristiques classiques, et de plus de 30% par rapport aux approches règle-based de l'état de l'art, tout en maintenant une réactivité en temps réel. L'enjeu concret pour les intégrateurs intralogistiques est significatif : la quasi-totalité des frameworks existants sont conçus sur mesure pour un type de système spécifique, tri-sorter, mini-load AS/RS ou AMR grid-based, ce qui rend tout transfert à un autre contexte laborieux. OLSF-TRS propose une couche de pilotage unifiée et scalable, potentiellement applicable à des architectures hétérogènes. La réduction de plus de 30% des mouvements de bacs se traduit directement en gains énergétiques, réduction de l'usure mécanique et meilleure stabilité du throughput, des KPIs centraux pour les COOs industriels. À noter cependant que les résultats reposent sur des simulations et benchmarks comparatifs sans déploiement terrain documenté, ce qui laisse entière la question du sim-to-real gap en production réelle. Ce travail s'inscrit dans une tendance structurelle de fond : la substitution des palettes par les bacs comme unité logistique primaire, portée par l'explosion du e-commerce et la fragmentation des commandes en petites séries. Des acteurs comme Exotec (France, système Skypod), AutoStore (Norvège) ou Geek+ (Chine) opèrent des déploiements massifs en grid-based robotics confrontés exactement à ces problèmes de coordination ordres-bacs-robots à grande échelle. La convergence entre optimisation combinatoire de type VRP et MARL est un champ de recherche en pleine effervescence, porté par des laboratoires industriels en Europe et en Asie. L'article ne mentionne ni partenariat industriel ni timeline de commercialisation, le positionnant comme une contribution académique précompétitive.

UEExotec (France, Skypod) et AutoStore (Norvège) opèrent des déploiements massifs confrontés exactement aux problèmes de coordination ordres-bacs-robots adressés par ce framework, en faisant une piste de R&D directement pertinente pour l'intralogistique européenne.

IndustrielPaper
1 source
Livraison multi-agents avec correspondances multiples
6arXiv cs.RO 

Livraison multi-agents avec correspondances multiples

Des chercheurs ont publié sur arXiv (référence 2605.07835) un algorithme baptisé M2M (Many-to-Many Multi-Agent Pickup and Delivery) pour optimiser la coordination de flottes de robots dans des entrepôts automatisés. La majorité des travaux antérieurs sur le problème MAPD (Multi-Agent Pickup and Delivery) supposent qu'une tâche a un unique point de collecte et un unique point de dépôt, le paradigme dit "one-to-one". M2M s'attaque à la variante "many-to-many" : dans un entrepôt réel, un article identifié par son SKU (Stock Keeping Unit) peut être prélevé ou stocké à plusieurs emplacements, ce qui génère un problème d'affectation à quatre dimensions classé NP-difficile. L'équipe propose deux variantes : M2M, qui minimise la durée estimée de chaque tâche, et M2M-wSKU, qui intègre en plus la distribution physique des SKUs dans la fonction objectif. En simulation sur des opérations de 8 heures, M2M complète jusqu'à 22 000 tâches supplémentaires en moyenne par rapport aux meilleures méthodes existantes, selon les configurations d'environnement et la densité d'inventaire. Le gain de 22 000 tâches sur une journée simulée de 8 heures représente un saut de throughput significatif pour un entrepôt à forte rotation. Pour un intégrateur ou un COO industriel, cela se traduit directement en capacité de traitement d'ordres supplémentaires sans augmenter le parc de robots. L'enjeu théorique est tout aussi notable : la transition du paradigme one-to-one vers many-to-many reflète fidèlement la réalité des entrepôts modernes, où la redondance d'emplacements est un mécanisme délibéré de résilience logistique. Une limite mérite d'être soulignée : les simulations sur 8 heures ne capturent pas les pannes matérielles, la variabilité des temps de manipulation, ni les interactions humaines en zones mixtes. Sur le plan académique toutefois, M2M établit une nouvelle référence sur ce sous-problème MAPD jusqu'ici peu traité. Le MAPD est un champ de recherche actif depuis une quinzaine d'années, porté par l'essor des entrepôts automatisés et des systèmes AMR (Autonomous Mobile Robots). Les algorithmes classiques ciblaient des scénarios one-to-one correspondant aux premières architectures d'entrepôts, mais les systèmes industriels modernes opèrent quasi universellement en many-to-many. L'entreprise française Exotec, avec son système Skypod déployé chez plus de 400 clients dans 15 pays, incarne précisément cette réalité multi-emplacements, aux côtés d'acteurs comme Amazon Robotics, Geek+ ou AutoStore. La publication de M2M sur arXiv ouvre la voie à son intégration dans des frameworks open-source de planification multi-robots. Les prochaines étapes attendues incluent une validation sur environnements physiques et la prise en compte de contraintes temporelles réelles, telles que les fenêtres de livraison ou les priorités dynamiques de commande.

UEL'algorithme M2M pourrait être directement intégré dans des systèmes comme le Skypod d'Exotec, permettant d'augmenter le débit des entrepôts automatisés européens sans extension du parc de robots.

IndustrielPaper
1 source
Planification robotique sous contraintes de ressources face à une incertitude mixte
7arXiv cs.RO 

Planification robotique sous contraintes de ressources face à une incertitude mixte

Des chercheurs présentent le CMDPST (Consumption Markov Decision Process with Set-valued Transitions), un cadre formel inédit permettant à un robot de planifier ses actions en tenant compte simultanément de deux types d'incertitudes : le bruit probabiliste mesurable et les inconnues structurellement non-quantifiables, tout en garantissant que le système ne tombe jamais à court de ressources opérationnelles (batterie, capacité de charge, quota de déplacements). Publiée sur arXiv en mai 2026 (réf. 2605.05797), la contribution couple ce modèle à une spécification de tâche exprimée en LTLf (logique temporelle linéaire sur traces finies), un formalisme permettant d'encoder des objectifs complexes avec des contraintes temporelles précises. Les auteurs proposent deux algorithmes de synthèse de stratégie : une méthode directe par déroulage d'états et une version optimisée par élagage de l'espace d'états, plus efficace en temps de calcul. Les expériences sont conduites sur un réseau de transport en entrepôt simulé, sans validation sur hardware réel à ce stade. La contribution adresse un angle mort récurrent dans la planification robotique industrielle : la plupart des approches existantes traitent soit l'incertitude probabiliste via les MDP classiques, soit les contraintes de ressources, rarement les deux ensemble. Dans les déploiements AMR (autonomous mobile robots) d'entrepôt, où une flotte doit honorer des missions tout en gérant niveaux de batterie et pannes imprévisibles, cette dualité est pourtant critique. Le cadre CMDPST offre aux intégrateurs une garantie formelle : la stratégie synthétisée ne laissera jamais un robot en panne sèche, même face à des perturbations non modélisées. C'est un argument solide pour des environnements industriels où l'interruption de service a un coût direct et mesurable. Ce type de planification sous contraintes mixtes s'inscrit dans un corpus plus large incluant la vérification probabiliste de modèles (outils PRISM, Storm) et la planification formelle par MDP. Les acteurs de la logistique automatisée comme Exotec (France) ou Hai Robotics, dont les flottes AMR évoluent dans des environnements partiellement inconnus, sont directement concernés par ces avancées théoriques. Côté alternatives académiques, le reinforcement learning robuste et le model predictive control probabiliste existent, mais sans les garanties formelles d'épuisement de ressources que revendique cette approche. La prochaine étape attendue est une implémentation sur robot physique pour évaluer concrètement le gap sim-to-real.

UEExotec (France) est explicitement citée comme acteur directement concerné par ces avancées théoriques, ses flottes AMR en entrepôt étant précisément le cas d'usage visé par les garanties formelles de non-épuisement des ressources du cadre CMDPST.

RecherchePaper
1 source
Brightpick présente sa feuille de route vers les entrepôts entièrement automatisés au Robotics Summit
8The Robot Report 

Brightpick présente sa feuille de route vers les entrepôts entièrement automatisés au Robotics Summit

Jan Zizka, co-fondateur et PDG de Brightpick, présentera le 27 mai 2026 à 14h45 lors du Robotics Summit & Expo de Boston une conférence intitulée "When Robots Don't Sleep: The Path Toward Lights-Out Warehouses". L'exposé portera sur une feuille de route concrète vers les entrepôts en fonctionnement autonome total, dits "lights-out", sans opérateurs humains présents. Brightpick, fondée en 2021 par essaimage depuis l'éditeur de vision machine Photoneo (racheté par Zebra Technologies en 2024), développe des robots d'order picking basés sur l'IA. Son produit phare, l'Autopicker, lauréat du RBR50 Robotics Innovation Award 2024, s'installe en quelques semaines dans des entrepôts de toute taille et couvre le picking, le buffering, la consolidation, l'expédition et le réapprovisionnement de stock. La société est basée à Austin, Texas. Le message central de Zizka est délibérément pragmatique : le lights-out total reste hors de portée économique à court terme, mais un mode hybride est déjà opérationnel. Dans ce modèle, les robots assurent la majorité des tâches répétitives de nuit sans supervision, tandis que les humains interviennent le jour pour les pics de volume et les cas exceptionnels. Le vrai verrou n'est pas technique mais économique : automatiser les derniers 10 à 20 % des flux, là où se concentrent les cas limites et les décisions de jugement, coûte disproportionnellement cher par rapport au gain. La stratégie rationnelle consiste donc à maximiser le ROI sur les flux à fort volume, préserver la flexibilité humaine là où elle crée de la valeur, et réduire progressivement l'ensemble des exceptions à mesure que la technologie mature. C'est une posture moins spectaculaire que les annonces "révolutionnaires" du secteur, mais plus alignée avec les contraintes réelles des opérateurs logistiques. Brightpick s'inscrit dans une course à la commercialisation des robots d'entrepôt autonomes où les acteurs sont nombreux : Exotec (France, systèmes Skypod pour le stockage dense), Symbotic, Locus Robotics, ou encore Grey Orange sur le segment des AMR de fulfillment. La particularité de Brightpick est son héritage en vision 3D via Photoneo, qui lui confère une expertise en manipulation autonome plutôt que sur le simple transport. Zizka cumule plus de 20 brevets couvrant la détection 3D, la robotique mobile et la manipulation, et a conduit des recherches sur les caméras computationnelles au MIT. La conférence de Boston permettra de calibrer où en est réellement la technologie par rapport aux promesses marketing du secteur, un exercice d'autant plus utile que les déploiements lights-out effectifs restent rares et souvent cantonnés à des environnements très contraints (température, SKU limités, flux prévisibles).

UELa présence d'Exotec comme concurrent direct positionne les acteurs européens face à cette offre américaine, mais aucun déploiement en France/UE n'est documenté dans l'article.

IndustrielActu
1 source
Geekplus s'associe à Mindugar pour accélérer l'automatisation d'entrepôt en Amérique latine
9Robotics & Automation News 

Geekplus s'associe à Mindugar pour accélérer l'automatisation d'entrepôt en Amérique latine

Geekplus, entreprise chinoise spécialisée dans la robotique d'entrepôt et l'un des plus grands fournisseurs mondiaux d'AMR (robots mobiles autonomes), a annoncé un partenariat stratégique avec Mindugar, intégrateur latino-américain de systèmes de stockage industriel et de rayonnages. L'accord, dont les termes financiers ne sont pas divulgués, vise à accélérer l'adoption de l'automatisation logistique au sein de la région Amérique latine. Mindugar apporte son réseau commercial et son expertise locale en infrastructure d'entrepôt, tandis que Geekplus fournit ses solutions robotiques, robots goods-to-person, systèmes de tri et convoyage autonome. Pour le marché latino-américain, cette alliance représente un signal clair : la convergence entre les fabricants de racks traditionnels et les éditeurs de solutions robotiques s'accélère, reproduisant un modèle déjà observé en Europe et au Moyen-Orient. Pour les intégrateurs et les décideurs logistiques de la région, cela signifie un accès simplifié à des solutions clés en main combinant infrastructure physique et automatisation. La LatAm reste un marché à fort potentiel mais sous-pénétré en robotique d'entrepôt, avec des contraintes propres, coûts d'importation, instabilité monétaire, main-d'oeuvre relativement bon marché, qui freinent jusqu'ici les déploiements à grande échelle. À noter : le communiqué s'apparente davantage à une annonce de partenariat canal qu'à la confirmation de déploiements opérationnels. Fondée en 2015 à Pékin, Geekplus revendique des milliers de robots déployés dans plus de 40 pays, avec une présence établie en Europe, aux États-Unis et au Moyen-Orient. L'entreprise concurrence directement Quicktron (Alibaba), Hai Robotics et, sur le segment haut de gamme, Exotec (France) dont la solution Skypod est également présente en logistique e-commerce. Le partenariat avec Mindugar s'inscrit dans une stratégie de distribution indirecte typique de la phase d'internationalisation de Geekplus, sans timeline de déploiement ni volume de projets annoncé à ce stade.

UEL'expansion internationale de Geekplus via des partenariats canal renforce sa pression concurrentielle sur Exotec (France), qui opère sur le même segment AMR logistique e-commerce à l'international, sans impact direct sur le marché européen à ce stade.

IndustrielActu
1 source
Apprentissage par renforcement modulaire pour essaims coopératifs
10arXiv cs.RO 

Apprentissage par renforcement modulaire pour essaims coopératifs

Une équipe de chercheurs propose, dans un preprint déposé sur arXiv le 7 mai 2026 (arXiv:2605.04939), une méthode d'apprentissage par renforcement modulaire pour les essaims de robots coopératifs. Le problème ciblé est précis : dans un essaim, chaque robot dispose d'une capacité de calcul et de mémoire limitée, n'observe qu'un sous-ensemble restreint de ses voisins, et n'a aucune visibilité sur l'effet de ses actions sur l'utilité collective. Les approches standard de MARL distribué (Multi-Agent Reinforcement Learning) apprennent à chaque agent à coordonner ses actions avec le groupe, mais elles imposent de représenter un espace d'états d'interaction potentiellement combinatoire, ce qui dépasse rapidement les contraintes mémoire de robots à faible puissance. La solution proposée est une représentation décomposée : chaque dimension de l'état spatial est traitée par un module d'apprentissage indépendant, et les résultats sont ensuite agrégés pour guider la politique. Les auteurs valident l'approche sur des simulations de tâches de collecte (foraging), un benchmark classique en robotique en essaim. L'intérêt industriel est direct pour toute architecture multi-robots à budget matériel contraint. La croissance combinatoire de l'espace d'états est un goulot d'étranglement bien documenté qui freine le passage à l'échelle des essaims : augmenter la taille du groupe multiplie le problème. En décomposant la représentation, l'approche modulaire pourrait permettre de déployer des politiques coopératives sur des robots bon marché sans recourir à une unité centrale de coordination. C'est une direction complémentaire aux approches centralisées lors de l'entraînement et décentralisées à l'exécution (CTDE), qui restent lourdes en entraînement. À noter cependant que les résultats présentés reposent uniquement sur des simulations, sans validation sur hardware réel, ce qui laisse ouverte la question du sim-to-real gap. La robotique en essaim est un domaine actif depuis les travaux de Marco Dorigo sur les fourmis artificielles dans les années 1990. Les avancées récentes en MARL, notamment QMIX et MADDPG, ont montré que la coordination émergente est accessible sans communication explicite, mais au prix d'une complexité croissante de représentation. Sur le terrain, des acteurs comme Bitcraze (drones Crazyflie), Exotec (essaims AMR pour entrepôts logistiques), ou encore des labos européens sur les micro-robots explorent des architectures contraintes similaires. La prochaine étape naturelle pour ce travail serait une validation sur plateforme physique et une comparaison quantitative avec les baselines CTDE standard.

UEExotec (France), acteur des essaims AMR logistiques, opère dans un contexte de contraintes matérielles similaires à celles ciblées par ce preprint, mais la contribution reste académique et simulée, sans déploiement ou validation européenne directe.

RecherchePaper
1 source
Emballage dans des contenants partiellement remplis par contact
11arXiv cs.RO 

Emballage dans des contenants partiellement remplis par contact

Une équipe de chercheurs publie sur arXiv (référence 2602.12095, version 3, première soumission en février 2026) une approche de bin-packing robotique capable de placer des objets dans des conteneurs déjà partiellement remplis, contrairement aux méthodes existantes qui supposent des conteneurs vides. L'algorithme repose sur trois composants couplés: un optimiseur de trajectoire multi-objets basé sur les contacts, intégré dans un contrôleur prédictif (MPC); un système de perception physiquement informé qui estime les poses des objets même en présence d'occlusions inévitables; et un module de suggestion de positions d'empilement physiquement réalisables. La contribution centrale est l'exploitation délibérée des interactions de contact avec les objets déjà en place pour créer de l'espace libre et permettre l'insertion de nouveaux items, sans recourir à la stratégie collision-free qui prévaut dans la littérature. Dans les entrepôts réels, les bacs ne sont presque jamais vides: ils circulent entre zones de tri, postes de préparation et quais d'expédition, accumulant des configurations sous-optimales au fil des déplacements. Les approches sans contact dominantes échouent ou produisent des taux de remplissage médiocres face à ces conditions, creusant un écart persistant entre la recherche en laboratoire et les contraintes opérationnelles. Ce travail propose un changement de paradigme: traiter les contacts comme un levier d'organisation spatiale plutôt que comme un obstacle à éviter. Pour un intégrateur ou un opérateur logistique, l'impact potentiel est direct: densité de remplissage accrue, moins de passages en reprise manuelle, réduction des coûts de transport et de surface de stockage. L'absence de métriques quantitatives dans l'abstract (taux de succès, temps de cycle, payload) empêche toutefois d'évaluer les performances réelles à ce stade. Le bin-packing robotique reste un problème ouvert malgré les investissements d'Amazon Robotics, Ocado et Covariant, et la montée de spécialistes comme Nimble Robotics. Côté européen, Exotec (AMR de stockage, Lille) et Enchanted Tools évoluent dans des espaces adjacents sans cibler encore ce niveau de manipulation dense en conteneur partiellement rempli. Ce travail est un preprint en version 3, sans déploiement ni partenariat industriel annoncé: il s'agit d'une contribution académique, pas d'un produit expédié. Si les performances se confirment hors laboratoire, cette approche orientée contact pourrait s'intégrer à la prochaine génération de cellules de picking-packing autonomes, où la robustesse face au désordre constitue le vrai différenciateur commercial.

UEImpact indirect : si les performances se confirment hors laboratoire, des acteurs logistiques européens comme Exotec pourraient intégrer cette approche orientée contact dans leurs cellules de picking-packing, réduisant la dépendance aux reprises manuelles dans les entrepôts.

RecherchePaper
1 source
SOAR : optimisation conjointe en temps réel pour l'allocation des commandes et l'ordonnancement des robots mobiles
12arXiv cs.RO 

SOAR : optimisation conjointe en temps réel pour l'allocation des commandes et l'ordonnancement des robots mobiles

Des chercheurs, en collaboration avec Geekplus, ont publié SOAR (Simultaneous Order Allocation and Robot Scheduling), un framework d'apprentissage par renforcement profond conçu pour optimiser en temps réel la coordination des robots dans les systèmes de préparation de commandes automatisés (RMFS, Robotic Mobile Fulfillment Systems). Déposé sur arXiv en mai 2026 (arXiv:2605.03842), le système unifie deux sous-problèmes classiquement découplés, l'allocation des commandes et la planification des robots mobiles, en un seul agent décisionnel. Sur des données industrielles réelles fournies par Geekplus, SOAR réduit le makespan global de 7,5 % et le temps moyen de complétion des commandes de 15,4 %, avec une latence de décision inférieure à 100 ms. La viabilité du système a été confirmée par un déploiement en environnement de production via une procédure sim-to-real. Techniquement, le problème est formulé comme un processus de décision de Markov piloté par événements (Event-Driven MDP), où l'agent réagit à des événements asynchrones (fin de tâche, arrivée de commande) grâce à un Heterogeneous Graph Transformer encodant l'état de l'entrepôt, complété par une stratégie de reward shaping pour gérer la rareté du signal de récompense sur les longues séquences. Les RMFS équipent aujourd'hui les grands centres logistiques : des flottes de robots mobiles (AMR) transportent des étagères entières vers des postes de picking humains ou automatisés. Le goulot d'étranglement traditionnel vient du couplage fort entre allocation et ordonnancement : les approches décomposées sacrifient l'optimalité globale pour garantir la réactivité, tandis que les modèles d'optimisation classiques comme les MILP ou CP-SAT sont trop lents pour des environnements à haute cadence. SOAR casse ce compromis en prouvant qu'un agent de deep RL peut raisonner globalement tout en répondant en moins de 100 ms, ce qui constituait un verrou industriel reconnu. Plus significatif encore, la validation sim-to-real en conditions de production distingue ce travail de la majorité des publications académiques qui restent cantonnées à la simulation. Geekplus, fondé en 2015 à Pékin, est l'un des leaders mondiaux des AMR pour la logistique d'entrepôt, avec des déploiements dans plus de 40 pays chez des clients comme Decathlon et JD.com. Sa participation directe à cette recherche signale une intégration croissante entre laboratoires académiques et industriels pour raccourcir le cycle lab-to-production. Sur le marché, Geekplus concurrence Hai Robotics et AutoStore, mais aussi en Europe des acteurs comme Exotec (France), dont le système Skypod adresse des problèmes similaires de coordination multi-robots à grande échelle. SOAR s'inscrit dans un corpus actif de travaux sur le RL multi-agent pour la planification en entrepôt, mais se distingue par son approche unifiée et son ancrage en production confirmé. Le code est disponible en open source sur GitHub, ce qui devrait faciliter son adaptation à d'autres architectures RMFS.

UELe code open-source SOAR, validé en production chez des clients de Geekplus dont Decathlon, constitue une référence technique directe pour Exotec et les intégrateurs AMR européens confrontés aux mêmes problèmes de coordination multi-robots à grande échelle.

IndustrielPaper
1 source
FORMULA : MPC de formation avec apprentissage de barrières neuronales pour la garantie de sécurité
13arXiv cs.RO 

FORMULA : MPC de formation avec apprentissage de barrières neuronales pour la garantie de sécurité

Une équipe de chercheurs propose FORMULA (FORmation MPC with neUral barrier Learning for safety Assurance), un framework de contrôle distribué pour systèmes multi-robots (MRS) publié sur arXiv (réf. 2604.04409v2). L'approche combine trois briques algorithmiques : du Model Predictive Control (MPC) pour la planification prédictive, des Control Lyapunov Functions (CLFs) pour garantir la stabilité de la formation, et des Control Barrier Functions (CBFs) implémentées sous forme de réseaux de neurones pour assurer la sécurité de manière décentralisée. L'objectif est de permettre à une flotte de robots de naviguer en formation dans des environnements encombrés et dynamiques, sans conception manuelle des contraintes de sécurité. Les résultats présentés sont issus de simulations uniquement ; aucun déploiement matériel n'est rapporté à ce stade. Le verrou technique adressé est réel : les approches MPC classiques pour la formation multi-robots peinent à passer à l'échelle, tandis que les CBFs, pourtant fondées mathématiquement pour l'enforcement de sécurité, sont difficiles à concevoir à la main pour des systèmes non-linéaires complexes. FORMULA automatise cette conception via l'apprentissage, ce qui réduit la charge de calcul en ligne et permet de résoudre les situations de blocage (deadlocks) en configuration dense. Pour un intégrateur ou un COO industriel, c'est le type de brique qui conditionne le passage de pilotes en cellule à des déploiements flotte réelle dans des entrepôts ou sur des sites logistiques. La formation en robotique mobile est un problème ouvert depuis les années 2000, et les approches MPC centralisées ont longtemps buté sur la scalabilité. Le contexte applicatif visé -- logistique entrepôt, transport de matériaux, réponse aux catastrophes -- est précisément celui où des acteurs comme Exotec (France) ou Locus Robotics opèrent avec des flottes d'AMR (Autonomous Mobile Robots) sans formation rigide. FORMULA se positionne donc sur un créneau de contrôle coordonné plus contraignant que les AMR classiques. La limite principale reste l'absence de validation sur hardware réel : le gap sim-to-real pour les CBFs neuronales, notamment en présence de bruit de capteurs et de latences réseau, n'est pas adressé dans ce preprint.

UESi les résultats se confirment sur hardware réel, des acteurs européens de la logistique robotisée (dont Exotec en France) pourraient intégrer ce type de brique de contrôle coordonné pour des flottes d'AMR en environnements denses, mais l'impact reste conditionnel à la validation sim-to-real.

RecherchePaper
1 source
Faut-il vraiment réinitialiser immédiatement ? Repenser la gestion des collisions pour une navigation robotique efficace
14arXiv cs.RO 

Faut-il vraiment réinitialiser immédiatement ? Repenser la gestion des collisions pour une navigation robotique efficace

Une équipe de chercheurs propose, dans un préprint déposé sur arXiv le 2 mai 2026 (référence 2605.02192), un nouveau cadre d'entraînement pour la navigation robotique par apprentissage par renforcement profond (DRL), baptisé Multi-Collision reset Budget (MCB). La convention actuelle dans la majorité des frameworks DRL est la suivante : toute collision déclenche immédiatement un reset global de l'épisode et est comptabilisée comme un échec total de la tâche. MCB rompt avec cette logique en découplant la terminaison locale sur collision du reset global de l'environnement, permettant à l'agent d'effectuer plusieurs tentatives au sein d'un même épisode sur une configuration d'obstacles difficile, jusqu'à épuisement d'un budget de collisions défini. Les expériences ont été conduites sur plusieurs plateformes robotiques simulées et réelles, et les auteurs rapportent des gains de taux de succès et d'efficacité de navigation supérieurs aux baselines à collision unique, avec un budget de collisions réduit produisant les meilleurs résultats. L'enjeu est directement lié à une limite connue du DRL appliqué à la navigation en environnements denses : en pénalisant durement chaque collision dès les premières étapes d'entraînement, les agents évitent les configurations complexes plutôt que de les apprendre, ce qui ralentit la convergence. MCB autorise une exploration plus agressive des zones difficiles sans pour autant sacrifier la sécurité en déploiement, où la politique apprise conserve un comportement zéro-collision. Cela adresse indirectement le "sim-to-real gap" en exposant l'agent à des scénarios d'entassement d'obstacles que les resets prématurés rendaient statistiquement rares durant la phase d'exploration précoce. L'approche n'est toutefois présentée que dans un contexte de résultats expérimentaux préliminaires, sans benchmark comparatif exhaustif sur des datasets standardisés. Cette publication s'inscrit dans un débat plus large sur la conception des fonctions de récompense et des conditions de terminaison en DRL pour la navigation mobile, un domaine où des travaux comme ceux de Berkeley (sur la navigation sociale) ou les approches curriculum learning d'OpenAI ont montré l'importance des dynamiques d'exploration en début d'entraînement. Côté robotique industrielle, les AMR (Autonomous Mobile Robots) de Exotec ou des intégrateurs logistiques européens utilisent majoritairement des planificateurs classiques, mais la pression vers des politiques apprises pour des environnements non-structurés rend ce type de recherche pertinent à moyen terme. La prochaine étape logique serait une validation sur des plateformes de référence (TurtleBot, Spot, ou robots humanoïdes à roues) et une comparaison directe avec des méthodes curriculum existantes.

UEImpact indirect à moyen terme : si l'approche MCB se confirme sur des benchmarks standardisés, des acteurs comme Exotec ou des intégrateurs AMR européens opérant en environnements non-structurés pourraient en tirer parti pour passer à des politiques de navigation apprises.

RecherchePaper
1 source
Planification heuristique à base de LLM pour la navigation robotique dans des environnements dynamiques, intégrant la conscience sémantique du risque
15arXiv cs.RO 

Planification heuristique à base de LLM pour la navigation robotique dans des environnements dynamiques, intégrant la conscience sémantique du risque

Des chercheurs ont publié début mai 2026, via un preprint arXiv (2605.02862), un planificateur de navigation robotique baptisé SRAH (Semantic Risk-Aware Heuristic), conçu pour intégrer des principes de raisonnement issus des grands modèles de langage (LLM) dans le cadre classique de recherche de chemin A. L'algorithme encode des fonctions de coût sémantiques qui pénalisent les zones géométriquement encombrées ou identifiées comme à risque élevé, et déclenche un replanification en boucle fermée dès qu'un obstacle dynamique est détecté. Les auteurs l'ont évalué sur 200 essais randomisés dans un environnement grille 15x15 cases, avec 20% de densité d'obstacles statiques et des obstacles dynamiques stochastiques. SRAH atteint un taux de succès de 62,0%, contre 56,5% pour BFS avec replanification (soit +9,7% d'amélioration relative) et 4,0% pour une heuristique Greedy sans replanification. Une étude d'ablation sur la densité d'obstacles confirme que le façonnage sémantique des coûts améliore la navigation sur des environnements de difficulté variable. Ce travail s'inscrit dans un courant de recherche qui cherche à exploiter la capacité des LLM à encoder du raisonnement contextuel sans les déployer en inférence temps réel, ce qui réduirait la latence et les coûts de calcul embarqués. L'idée centrale, injecter une représentation sémantique du risque dans la fonction heuristique d'A, est pertinente pour les développeurs d'AMR (robots mobiles autonomes) industriels confrontés à des environnements semi-structurés changeants. Cela dit, les résultats doivent être nuancés : un taux de succès de 62% dans une grille 15x15 reste modeste pour une tâche de navigation, et la comparaison avec un Greedy sans replanification est méthodologiquement inégale. La valeur démontrée reste celle de principe, pas de déploiement à l'échelle. La navigation en environnement dynamique est un problème central depuis les travaux fondateurs sur A (Hart, Nilsson, Raphael, 1968) et les variantes D et D*-Lite des années 1990-2000. L'émergence des LLM a relancé l'intérêt pour des heuristiques fondées sur la sémantique plutôt que sur la pure géométrie, une piste explorée par des équipes comme celles de Stanford (SayCan, 2022) ou de Google DeepMind avec RT-2. Sur le segment de la navigation mobile, des acteurs comme Boston Dynamics, MiR ou Exotec (France) intègrent déjà des couches de replanification dynamique dans leurs flottes d'AMR industriels. Ce preprint n'annonce pas de produit ni de déploiement : c'est une contribution algorithmique à valider sur des benchmarks plus réalistes (ROS 2, Gazebo, environnements 3D) avant tout transfert industriel.

UECe preprint pourrait à terme informer les développeurs d'AMR industriels européens sur les heuristiques sémantiques LLM, mais les résultats restent trop préliminaires et le benchmark trop limité (grille 15x15) pour un transfert industriel immédiat.

RecherchePaper
1 source
Les robots transforment les transpalettes
16Robotics & Automation News 

Les robots transforment les transpalettes

Les chariots élévateurs à palette, longtemps cantonnés à un usage manuel dans les entrepôts, franchissent un cap technologique notable avec l'intégration massive de la robotique. Ces engins se muent progressivement en AGV (Automated Guided Vehicles) ou en AMR (Autonomous Mobile Robots), deux architectures distinctes : les AGV suivent des trajets prédéfinis via rails magnétiques ou marquages au sol, tandis que les AMR naviguent librement grâce à des capteurs LiDAR, des caméras stéréo et des algorithmes de cartographie SLAM. La fusion de ces technologies avec des couches d'intelligence artificielle permet aux chariots de détecter des obstacles, de replannifier leurs itinéraires en temps réel et de s'intégrer aux systèmes WMS (Warehouse Management System) existants. Pour un intégrateur ou un COO industriel, l'enjeu est direct : l'automatisation des tâches de manutention répétitives réduit les coûts opérationnels, augmente la cadence de traitement des palettes et limite les incidents liés à la fatigue humaine. Les AMR modernes atteignent des charges utiles de plusieurs tonnes et opèrent en multi-équipe sans interruption, ce qui modifie en profondeur les calculs de ROI sur les projets logistiques. Cela dit, l'article analysé relève davantage du contenu marketing généraliste que d'une annonce produit ou d'un déploiement chiffré, et n'apporte pas de métriques concrètes validant ces performances. Le marché de la manutention autonome est aujourd'hui dominé par des acteurs comme Linde, Toyota Industries, Jungheinrich ou Still côté chariots traditionnels reconvertis, face à des pure-players robotiques tels que Balyo, Exotec ou Fetch Robotics. En Europe, des acteurs français comme Exotec positionnent leurs solutions sur des segments adjacents (stockage automatisé dense), tandis que la pression des grands opérateurs e-commerce accélère les cycles d'adoption. Les prochaines étapes du secteur portent sur l'interopérabilité flotte et la standardisation des interfaces API entre AMR et WMS.

UEPlusieurs acteurs européens (Jungheinrich, Still, Linde, Balyo) et le français Exotec sont directement positionnés sur ce marché en consolidation, leur conférant un avantage structurel face aux pure-players américains et asiatiques.

IndustrielOpinion
1 source
Prise de décision enrichie par la causalité pour robots mobiles autonomes en environnements dynamiques
17arXiv cs.RO 

Prise de décision enrichie par la causalité pour robots mobiles autonomes en environnements dynamiques

Des chercheurs ont publié sur arXiv (ref. 2504.11901, cinquième version) un framework de prise de décision basé sur l'inférence causale pour les robots mobiles autonomes (AMR) évoluant dans des environnements partagés avec des humains. Plutôt que de s'appuyer uniquement sur des corrélations statistiques, leur système apprend un modèle causal explicite des dynamiques d'environnement, notamment l'estimation de la consommation batterie et les risques d'obstruction par des passants, pour décider quand et comment exécuter une tâche. Pour valider leur approche, l'équipe a développé PeopleFlow, un simulateur basé sur Gazebo capable de générer des trajectoires réalistes de multiples agents (humains et robots) en tenant compte de facteurs contextuels comme l'heure, la configuration spatiale et l'état du robot. Le cas d'usage principal est un entrepôt en activité partagée, benchmark face à une baseline non-causale classique. L'apport principal est de déplacer la logique de décision de la corrélation vers la causalité, une distinction non triviale en robotique opérationnelle. Là où un système standard détecte qu'il y a "souvent du monde à 14h dans l'allée B" et l'évite, un modèle causal comprend pourquoi, ce qui lui permet d'anticiper des situations nouvelles et de planifier la minuterie d'une tâche logistique en conséquence. Pour un COO gérant une flotte d'AMR dans un entrepôt mutualisé avec des préparateurs de commandes, cela se traduit potentiellement par moins d'arrêts non planifiés, une meilleure gestion de la charge batterie, et une cohabitation plus fluide. Il convient toutefois de noter que les résultats présentés sont exclusivement issus de simulation, sans validation terrain, ce qui constitue une limite importante à ce stade. Ce travail s'inscrit dans un contexte de déploiement croissant d'AMR dans des espaces mixtes, des entrepôts e-commerce aux hôpitaux, où des acteurs comme MiR (Teradyne), Locus Robotics ou le français Exotec font face à des défis de navigation sociale de plus en plus complexes. La recherche en planification causale reste largement académique, mais elle trace une voie complémentaire aux approches par apprentissage par renforcement ou par règles explicites. La prochaine étape logique serait une validation sur robot physique en environnement réel, un passage sim-to-real que l'article n'adresse pas encore.

UELes opérateurs français d'AMR comme Exotec, confrontés à la navigation en entrepôts partagés avec des préparateurs humains, sont le public cible naturel de ce framework, mais l'absence de validation terrain limite l'applicabilité immédiate.

RecherchePaper
1 source
Locus Robotics déploie Locus Array pour l'automatisation complète des entrepôts
18Robotics & Automation News 

Locus Robotics déploie Locus Array pour l'automatisation complète des entrepôts

Locus Robotics, spécialiste américain des systèmes d'automatisation d'entrepôts, a officialisé le lancement de Locus Array, une solution qu'elle qualifie de système de préparation de commandes entièrement autonome. La plateforme intègre des robots mobiles autonomes (AMR), un bras de préhension robotisé et un module de perception piloté par IA, avec l'objectif de couvrir l'ensemble du flux de traitement des commandes sans intervention humaine. Des déploiements en accès anticipé sont déjà engagés chez des clients en Amérique du Nord, bien que les détails opérationnels (payload, cadence de cycle, taux de précision) n'aient pas encore été communiqués publiquement. L'enjeu industriel est réel : les AMR de première génération automatisaient le transport inter-zones, mais laissaient le picking, tâche la plus coûteuse en main-d'oeuvre -- à des opérateurs humains. Intégrer un bras de préhension directement sur la plateforme mobile représente un saut architectural vers l'autonomie bout-en-bout. Pour les intégrateurs et les décideurs logistiques, cela change le calcul du ROI : si les métriques tiennent à l'échelle, l'argument pour réduire les effectifs de picking devient structurel. Reste à valider la robustesse hors conditions contrôlées, un point que l'annonce ne documente pas encore. Locus Robotics a levé plus de 400 millions de dollars depuis sa fondation en 2015, mais a traversé une période difficile en 2023, avec des réductions d'effectifs significatives liées à un ralentissement du marché e-commerce. Locus Array s'inscrit donc dans une stratégie de repositionnement vers la valeur ajoutée. Sur ce segment, la concurrence est dense : Exotec (Roubaix, France) avec son système Skypod, Symbotic, Geek+ et Boston Dynamics avec Stretch visent tous le même créneau de préparation autonome. La phase d'accès anticipé devra produire des données opérationnelles convaincantes pour crédibiliser la proposition face à ces acteurs déjà déployés à grande échelle.

UEExotec (Roubaix, France) est directement en compétition sur ce créneau de préparation autonome et devra défendre sa position si Locus Array produit des métriques opérationnelles convaincantes à l'échelle.

IndustrielOpinion
1 source
Régulateur de stabilité de phase basé sur deux paramètres dynamiques pour robots mobiles autonomes
19Robotics Business Review 

Régulateur de stabilité de phase basé sur deux paramètres dynamiques pour robots mobiles autonomes

Un chercheur propose une couche de supervision légère pour stabiliser les piles de contrôle des robots mobiles autonomes (AMR), en s'appuyant sur deux gradients dynamiques calculés en temps réel. L'approche, décrite dans une publication technique récente, introduit un régulateur de phase comportemental à deux paramètres : ΔN, le gradient de tâche externe, qui mesure l'écart de l'état courant par rapport à l'équilibre nominal de mission (erreur de trajectoire, croissance de la covariance de localisation, densité d'obstacles) ; et ΔD, la divergence comportementale interne, qui capte les conflits au sein de la pile de contrôle. Ce régulateur intervient avant qu'une oscillation ou un blocage ne survienne, en limitant dynamiquement la profondeur et le branchement des recherches dans les planificateurs globaux et locaux (A, Hybrid A, RRT*, MPC). Un moteur de compression combinatoire associé, le Combinatorial Compression Engine (CCE), est disponible en open source sur GitHub. Le problème adressé est concret pour tout intégrateur déployant des AMR en environnement dynamique : entrepôt logistique, hôpital, centre commercial. Les AMR modernes combinent SLAM, arbres de comportement, politiques apprises et mécanismes de récupération ; chaque composant est individuellement stable, mais leur intégration génère des divergences computationnelles lorsque la pression environnementale et les conflits internes s'amplifient simultanément. En pratique, cela se manifeste par une latence accrue, une surcharge processeur et une perte de déterminisme du cycle de décision, des symptômes souvent mal diagnostiqués comme des pannes matérielles. Le régulateur de phase proposé offre une intervention au niveau méta, limitant la croissance combinatoire sans sacrifier la validité de la solution. C'est une piste sérieuse pour réduire les gels et oscillations qui plombent les SLA de déploiement industriel, même si l'article reste à ce stade une proposition conceptuelle, sans validation expérimentale publiée à grande échelle en production réelle. L'article s'inscrit dans un effort plus large de formalisation de l'architecture de contrôle des AMR, dont l'auteur avait précédemment proposé une couche de prévisibilité prioritaire reposant sur des hiérarchies de missions et des niveaux de décision contextuels. Ce travail complète cette approche structurelle par une couche comportementale temps réel. Le paysage concurrentiel des AMR en entrepôt inclut MiR (Teradyne), Locus Robotics, Fetch Robotics (Zebra), ainsi que des acteurs européens comme Exotec, dont les systèmes Skypod opèrent en environnements denses sans ce type de formalisation publiée. Les éditeurs de middleware robotique, notamment ROS 2 et ses surcouches Nav2, pourraient constituer des cibles naturelles pour intégrer ce type de régulateur comme couche de supervision standardisable si les résultats expérimentaux venaient confirmer les gains de déterminisme annoncés.

UESi validé expérimentalement, ce régulateur open source pourrait intéresser Exotec et d'autres intégrateurs AMR européens cherchant à améliorer le déterminisme de leurs systèmes en entrepôt dense.

💬 Le vrai bug ici, c'est pas le robot, c'est la pile de contrôle qui déraille sous pression et qu'on diagnostique à tort comme une panne matérielle. Mettre une couche de supervision méta qui bride les planificateurs avant que ça parte en oscillation, c'est une idée propre, et le CCE open source facilite l'expérimentation. Reste à valider en entrepôt réel, parce qu'un papier sans test terrain, ça reste un papier.

IndustrielPaper
1 source
Coordination par relais pour la collecte et livraison multi-robots économe en énergie
20arXiv cs.RO 

Coordination par relais pour la collecte et livraison multi-robots économe en énergie

Une équipe de chercheurs a publié sur arXiv (identifiant 2509.14127, version 2, septembre 2025) un cadre de planification baptisé VCST-RCP (Voronoi-Constrained Steiner Tree Relay Coordination Planning), conçu pour coordonner des flottes homogènes de robots mobiles dans des missions de livraison multi-colis depuis un dépôt unique vers des destinations dispersées. L'algorithme opère en deux phases: la construction d'un réseau de relais sparse combinant des interfaces d'échange dérivées de diagrammes de Voronoï à une optimisation par arbre de Steiner, puis la génération des plannings de collecte, relais et livraison sous contraintes de capacité de charge et de temps de service. Sur des expériences menées à plusieurs échelles, VCST-RCP réduit la distance totale parcourue par la flotte de 31% en moyenne, avec des pics proches de 50%, par rapport à l'algorithme d'affectation Hungarian assignment, et surpasse significativement OR-Tools CVRP, le solveur de référence de Google. La significativité statistique est établie à p inférieur à 10^-3, et le gain d'efficacité de livraison, mesuré en colis par kilomètre parcouru, dépasse 50%. Ces résultats intéressent directement les opérateurs de flottes AMR (robots mobiles autonomes) en intralogistique et en livraison de dernier kilomètre, où la distance parcourue est directement corrélée au coût énergétique et à l'usure matérielle. L'étude d'ablation incluse dans les travaux est particulièrement instructive: elle démontre que l'optimisation du placement des points de relais génère des gains substantiellement supérieurs à ceux obtenus par simple repartitionnement spatial, établissant le design des relais comme levier dominant de la performance système. Cela remet en question l'hypothèse implicite répandue chez les intégrateurs, selon laquelle le transport direct source-destination constitue la référence optimale par défaut. La scalabilité démontrée à différentes tailles de flotte est un argument supplémentaire pour une adoption industrielle. Le problème MRPD (Multi-Robot Pickup and Delivery) est un classique de l'optimisation combinatoire en robotique, mais les architectures relay-based à grande échelle restent peu explorées. Hungarian assignment et OR-Tools CVRP, les deux références battues dans cette étude, sont précisément les solveurs utilisés par les éditeurs de WMS et les intégrateurs de flottes dans des environnements comme ceux d'Exotec (Roubaix), 6 River Systems ou Locus Robotics. Ce travail reste cependant un preprint arXiv, sans validation sur plateforme réelle annoncée: les gains en simulation sont solides, mais la transition sim-to-real, notamment face à la congestion dynamique et aux pannes robot en cours de mission, reste à prouver. Les extensions naturelles incluent des flottes hétérogènes et des dépôts multiples.

UEL'algorithme VCST-RCP, s'il est validé en environnement réel, pourrait réduire de ~30% les coûts énergétiques des flottes AMR d'acteurs européens comme Exotec (Roubaix) qui utilisent actuellement Hungarian assignment ou OR-Tools CVRP comme solveurs de référence.

RecherchePaper
1 source
Flex et Teradyne Robotics renforcent leur partenariat pour déployer l'automatisation intelligente dans l'industrie mondiale
21Robotics & Automation News 

Flex et Teradyne Robotics renforcent leur partenariat pour déployer l'automatisation intelligente dans l'industrie mondiale

Flex, l'un des plus grands sous-traitants industriels mondiaux avec des dizaines de sites de production dans une trentaine de pays, et Teradyne Robotics ont annoncé en avril 2026 l'élargissement de leur partenariat pour déployer l'automatisation intelligente à grande échelle dans la fabrication mondiale. L'accord instaure une double relation : Flex intègre les solutions de Teradyne Robotics directement dans ses propres lignes de production, tout en assurant la fabrication de composants robotiques clés pour permettre des déploiements plus larges chez les clients de Teradyne. Les volumes de déploiement visés et les détails financiers de l'accord n'ont pas été communiqués. Ce positionnement simultané en tant que client et fournisseur constitue un modèle industriel peu courant et potentiellement structurant. Pour un décideur B2B, le signal est clair : un EMS (Electronics Manufacturing Services) de cette envergure valide en conditions réelles la maturité opérationnelle des cobots Universal Robots et des robots mobiles MiR, les deux marques regroupées sous Teradyne Robotics. L'accord sécurise également une capacité de fabrication de composants externe pour Teradyne, réduisant les risques de montée en volume sans investissement industriel propre supplémentaire, un avantage concret dans un marché où la capacité de production reste un goulot d'étranglement. Teradyne Robotics est la division robotique de Teradyne Inc., issue de l'acquisition d'Universal Robots en 2015 (environ 285 millions de dollars) puis de MiR en 2018. L'entreprise fait face à une concurrence croissante sur les deux segments : Fanuc, Doosan et Techman Robot gagnent du terrain sur les cobots, tandis qu'Exotec (acteur français en logistique automatisée) et Zebra Technologies (Fetch Robotics) accélèrent sur les AMR. Le réseau de production de Flex, qui couvre des verticales aussi variées que l'automobile, le médical et l'électronique grand public, pourrait servir de terrain d'expansion accéléré pour Teradyne sans passer par les cycles habituels d'intégration terrain.

UEUniversal Robots et MiR, deux marques danoises regroupées sous Teradyne Robotics, bénéficient d'une validation industrielle à grande échelle via Flex qui renforce leur position concurrentielle face aux cobots asiatiques sur le marché européen.

IndustrielActu
1 source
Conception conjointe pilotée par la tâche de systèmes multi-robots hétérogènes
22arXiv cs.RO 

Conception conjointe pilotée par la tâche de systèmes multi-robots hétérogènes

Une équipe de recherche a publié sur arXiv (référence 2604.21894) un cadre formel pour la co-conception pilotée par les tâches de systèmes multi-robots hétérogènes. Le problème adressé est fondamental : concevoir une flotte robotique implique de prendre simultanément des décisions sur la morphologie des robots, la composition de la flotte (nombre, types), et les algorithmes de planification, trois domaines traditionnellement traités séparément. Le framework proposé repose sur la théorie de co-conception monotone, qui permet de modéliser robots, flottes, planificateurs et évaluateurs comme des problèmes de conception interconnectés avec des interfaces bien définies, indépendantes des implémentations spécifiques et des tâches cibles. Des séries d'études de cas illustrent l'intégration de nouveaux types de robots, de profils de tâches variés, et d'objectifs de perception probabilistes dans un seul pipeline d'optimisation. L'intérêt industriel tient à la promesse d'optimisation jointe avec garanties d'optimalité, ce que les approches séquentielles actuelles ne peuvent offrir. Pour un intégrateur système ou un COO déployant une flotte AMR dans un entrepôt, la question n'est jamais "quel robot est le meilleur seul" mais "quelle combinaison robot + planificateur + composition de flotte minimise le temps de cycle global sous contrainte budgétaire". Ce framework rend ce raisonnement formellement traçable, et les auteurs soulignent qu'il fait émerger des alternatives de conception non-intuitives que les méthodes ad hoc auraient manquées. La scalabilité et l'interprétabilité revendiquées restent à valider sur des déploiements réels à grande échelle, les résultats publiés restent des études de cas académiques. Ce travail s'inscrit dans un courant de recherche en robotique qui cherche à dépasser les silos disciplinaires : d'un côté la co-conception morphologique (ex : travaux MIT CSAIL sur la co-optimisation structure/contrôle), de l'autre les frameworks de planification multi-agents (ROS 2 Nav2, MoveIt Task Constructor). La théorie de co-conception monotone, développée notamment par Andrea Censi et Luca Carlone, constitue la base théorique. Ce papier étend cette base aux systèmes hétérogènes à grande échelle. Aucune timeline de transfert industriel n'est annoncée, mais le framework pourrait intéresser les éditeurs de logiciels de fleet management (Exotec, Intrinsic/Google, Siemens Xcelerator) comme couche de raisonnement amont à la configuration de flotte.

UEExotec (Bordeaux) et d'autres éditeurs européens de logiciels de gestion de flottes AMR pourraient exploiter ce framework comme couche de raisonnement amont pour l'optimisation conjointe morphologie/composition/planification, mais aucun transfert industriel n'est annoncé.

RecherchePaper
1 source
Pudu Robotics lève près de 150 millions de dollars pour cibler les applications industrielles
23Robotics Business Review 

Pudu Robotics lève près de 150 millions de dollars pour cibler les applications industrielles

Pudu Technology Inc., fabricant de robots de service basé à Shenzhen, a annoncé le 23 avril 2026 avoir levé près de 150 millions de dollars lors d'un nouveau tour de financement. Cette opération porte la valorisation de l'entreprise au-delà de 1,5 milliard de dollars, et son financement cumulé à plus de 300 millions de dollars depuis sa création en 2016. Pudu structure son offre autour de trois gammes de produits -- robots de livraison intérieure, systèmes de nettoyage commercial, et plateformes logistiques -- déployées dans dix secteurs d'activité incluant la restauration, le retail, l'hôtellerie, la santé, l'éducation et l'industrie. Sur le plan produit, la société a lancé en 2024 le PUDU T300, un robot mobile conçu pour évoluer dans des allées étroites avec des charges lourdes, avant de dévoiler début 2026 le PUDU T150, un AMR à faible charge utile ciblant la manutention en environnements d'entrepôt et de fabrication. Le T150 est disponible en Chine continentale et dans les régions de Hong Kong, Macao et Taïwan, avec un déploiement prévu dans plusieurs marchés à forte croissance : Vietnam, Thaïlande, Singapour, Malaisie, Indonésie, Corée du Sud et Turquie. Ce tour de table illustre un mouvement structurel dans la robotique de service : la migration vers l'industrie. Pudu, longtemps cantonné aux robots de livraison en restauration et hôtellerie, accélère son repositionnement sur la manutention industrielle et l'IA incarnée (embodied AI), un segment où les marges et les contrats sont plus solides qu'en service grand public. Les fonds seront affectés au développement de technologies d'IA embarquée, à l'élargissement du portefeuille produit, à l'expansion internationale et à la montée en capacité de production. Pour les intégrateurs et décideurs industriels, ce pivot signifie une concurrence accrue sur le segment AMR léger, traditionnellement occupé par des acteurs comme Geek+, Hai Robotics ou le français Exotec -- qui reste cependant positionné sur un créneau plus automatisé et dense. Aucune métrique de performance n'a été communiquée sur le T150 (vitesse, charge utile exacte, temps de cycle), ce qui rend toute comparaison technique prématurée à ce stade. Pudu n'est pas un cas isolé : D-Robotics, également basé à Shenzhen et spécialisé dans les plateformes matérielles et logicielles pour robots grand public et IA incarnée, a levé 270 millions de dollars en Série B quelques semaines plus tôt, en avril 2026. Ces levées massives de capitaux dans la robotique chinoise reflètent une course à l'échelle mondiale, soutenue par une chaîne d'approvisionnement locale compétitive et une pression croissante des gouvernements asiatiques pour automatiser leur secteur manufacturier. Fondée en 2016 par Felix Zhang, Pudu a d'abord conquis le marché de la restauration avant d'élargir progressivement son empreinte ; la prochaine étape déclarée est l'accélération hors de Chine, avec un focus sur l'Asie du Sud-Est et potentiellement l'Europe, sans calendrier précis annoncé à ce jour.

UELe pivot de Pudu vers l'AMR industriel léger intensifie la pression concurrentielle sur Exotec (FR), acteur de référence sur ce segment, bien que positionné sur un créneau plus automatisé et dense.

Chine/AsieActu
1 source
Chaleur et compétence dans l'essaim : concevoir des équipes humain-robot efficaces
24arXiv cs.RO 

Chaleur et compétence dans l'essaim : concevoir des équipes humain-robot efficaces

Une équipe de chercheurs a publié sur arXiv (identifiant 2604.19270, avril 2026) une étude portant sur la perception sociale des essaims de robots lors de collaborations avec des humains. Via deux expériences structurées autour d'une tâche collective de recherche, les participants ont évalué différentes configurations d'essaim en tant qu'observateurs passifs dans la première étude, puis en tant qu'opérateurs actifs dans la seconde. Les résultats sont consistants sur les deux études : les variations de comportement du groupe de robots modifient systématiquement les jugements de chaleur relationnelle (warmth) et de compétence attribués au collectif. Une durée de diffusion de signal plus longue augmente la chaleur perçue ; une distance de séparation inter-robots plus grande augmente la compétence perçue. La vitesse individuelle de chaque robot, en revanche, n'a d'effet significatif sur aucun des deux attributs. Le résultat le plus contre-intuitif est que les perceptions sociales prédisent les préférences d'équipe plus fortement que la performance brute. Les participants ont préféré les équipes à la fois chaleureuses et compétentes à celles qui accomplissaient la tâche le plus rapidement. Pour les intégrateurs de systèmes multi-robots et les responsables industriels, ce constat remet en cause un postulat courant : optimiser un essaim pour la vitesse ou l'efficacité pure ne suffit pas à obtenir l'adhésion des opérateurs humains. La dimension sociale du comportement collectif, la façon dont le groupe semble agir plutôt que ce qu'il accomplit, détermine l'acceptation et la confiance. Dans des environnements collaboratifs intégrant des AMR ou des flottes robotiques, ignorer ces paramètres constitue un facteur de risque d'adoption sous-estimé. Le cadre théorique utilisé, le modèle competence-warmth issu de la psychologie sociale, est bien établi pour la perception des individus et des groupes humains, mais son application aux essaims robotiques reste émergente. La littérature en HRI (human-robot interaction) s'est jusqu'ici principalement focalisée sur des agents individuels. Ce preprint arXiv, non encore évalué par les pairs, s'inscrit dans une direction de recherche croissante à l'intersection du swarm robotics et de la HRI. Des entreprises déployant des flottes en environnement humain, de Boston Dynamics à des acteurs européens comme Exotec ou Enchanted Tools, auraient intérêt à intégrer ces paramètres comportementaux dès la conception. La prochaine étape logique serait de valider ces résultats en environnement industriel réel, avec des opérateurs non-experts et des tâches à plus forte variabilité.

UEExotec et Enchanted Tools, acteurs européens déployant des flottes robotiques en environnement humain, sont explicitement cités comme pouvant intégrer dès la conception les paramètres comportementaux (durée de signal, distance inter-robots) identifiés par cette étude.

💬 Ce qui est frappant, c'est que la vitesse ne change rien à la perception. Les opérateurs préfèrent un essaim qui semble chaleureux et compétent à celui qui boucle la tâche le plus vite, ce qui chamboule pas mal les priorités si tu déploies une flotte en entrepôt avec des humains. Exotec, Enchanted Tools : ces paramètres comportementaux, c'est à intégrer dès la conception, pas après coup.

RecherchePaper
1 source
Estimation de la présence humaine par vision pour améliorer la sécurité et l'efficacité des AMR en entrepôt industriel
25arXiv cs.RO 

Estimation de la présence humaine par vision pour améliorer la sécurité et l'efficacité des AMR en entrepôt industriel

Des chercheurs ont publié sur arXiv (référence 2604.18627) un système temps réel permettant à un robot mobile autonome (AMR) d'estimer, via une unique caméra RGB, si un opérateur humain à proximité a conscience de sa présence. La méthode combine deux modules : un estimateur de pose humaine 3D ("3D pose lifting") qui reconstruit la position du corps dans l'espace, et un module d'estimation d'orientation de la tête qui calcule le cône de vision du travailleur. Si l'humain est orienté vers le robot et se trouve dans ce cône, le système le catégorise comme "conscient de l'AMR" ; dans le cas contraire, le robot adopte un comportement de précaution. L'ensemble du pipeline a été validé sur données synthétiques dans NVIDIA Isaac Sim, sans validation sur environnement physique réel annoncée à ce stade. L'intérêt industriel de cette approche réside dans l'inefficacité chronique des systèmes actuels : les AMRs déployés aujourd'hui traitent tout humain comme un obstacle dynamique générique, ce qui entraîne des ralentissements ou détours systématiques, même lorsque l'opérateur a clairement vu le robot et s'est écarté de sa trajectoire. En distinguant les travailleurs attentifs des travailleurs inattentifs, le système permettrait théoriquement d'augmenter les cadences opérationnelles sans dégrader la sécurité. Pour les intégrateurs et les COO industriels, c'est une piste concrète pour réduire les temps de cycle dans des environnements à forte densité humaine. La validation reste cependant limitée à des données simulées, ce qui laisse entier le problème du sim-to-real gap pour les cas limites : occlusions partielles, éclairage variable, postures atypiques. Ce travail s'inscrit dans un contexte de forte croissance des flottes AMR dans la logistique mondiale, porté par des acteurs comme MiR (acquis par Teradyne), Locus Robotics, Geek+, ou côté français Exotec dont les robots Skypod évoluent dans des allées partagées avec des opérateurs humains. Les approches concurrentes misent généralement sur des systèmes LIDAR multicouche ou des zones de sécurité paramétrables conformes à la norme ISO 3691-4, sans modélisation explicite de l'attention humaine. La prochaine étape naturelle serait une validation sur données réelles et une intégration dans une stack de navigation type ROS 2 Nav2, mais ni timeline ni partenariat industriel ne sont mentionnés dans ce preprint.

UEDirectement pertinent pour Exotec (Skypod) qui opère des flottes AMR en allées partagées avec des opérateurs, mais aucune collaboration ni validation sur environnement réel n'est annoncée à ce stade.

IndustrielPaper
1 source
Vers un MAPF réaliste : SMART, un banc de test multi-agents extensible pour le monde réel
26arXiv cs.RO 

Vers un MAPF réaliste : SMART, un banc de test multi-agents extensible pour le monde réel

Une équipe de chercheurs a publié SMART (Scalable Multi-Agent Realistic Testbed), un environnement de simulation open-source destiné à l'évaluation des algorithmes MAPF (Multi-Agent Path Finding), c'est-à-dire la planification de trajectoires sans collision pour des flottes de robots. Le papier, référencé arXiv:2503.04798, présente un outil capable de simuler jusqu'à plusieurs milliers de robots simultanément, en intégrant un moteur physique complet qui modélise la kinodynamique des robots et les incertitudes d'exécution réelles. SMART s'appuie sur un cadre de supervision d'exécution basé sur l'Action Dependency Graph (ADG), ce qui permet une intégration modulaire avec différents planificateurs MAPF et modèles de robots. Le code est disponible publiquement sur GitHub, accompagné d'un service de démonstration en ligne. L'enjeu industriel est direct : les meilleurs planificateurs MAPF actuels sont capables de calculer des trajectoires pour des centaines de robots en quelques secondes, mais ils reposent presque tous sur des modèles de robots simplifiés, ignorant la dynamique réelle, les glissements, les délais de démarrage ou les imprécisions de positionnement. Ce fossé entre simulation idéalisée et comportement terrain est un frein majeur au déploiement en entrepôt ou en atelier. SMART propose de combler ce gap en permettant aux intégrateurs et aux équipes R&D de tester leurs algorithmes dans des conditions proches de la réalité sans avoir besoin de dizaines ou de centaines de robots physiques, ressource quasi-inaccessible en laboratoire. Pour un COO industriel qui évalue des solutions AMR (Autonomous Mobile Robots), disposer d'un simulateur crédible et open-source réduit significativement le risque d'un déploiement raté. Le problème du sim-to-real gap dans le MAPF est documenté depuis plusieurs années, et des acteurs comme Amazon Robotics, Geek+ ou Exotec en Europe ont développé leurs propres outils internes. SMART vise à démocratiser cet accès, notamment pour les équipes académiques et les intégrateurs de taille intermédiaire. Le framework ADG n'est pas nouveau, il était déjà central dans les travaux antérieurs sur l'exécution robuste de MAPF, mais son intégration dans un simulateur à physique réaliste et passant à l'échelle représente une avancée méthodologique. Les prochaines étapes probables incluent la validation sur des cas industriels concrets et l'ajout de modèles de robots commerciaux comme les AMR à différentiel ou les AGV à guidage magnétique.

UEExotec, acteur français des AMR d'entrepôt, est cité parmi les rares industriels disposant d'outils internes similaires ; SMART pourrait réduire la barrière à l'entrée pour les équipes R&D et intégrateurs européens de taille intermédiaire souhaitant valider des algorithmes MAPF sans flotte physique.

RecherchePaper
1 source
Flow-Opt : optimisation centralisée et scalable de trajectoires multi-robots par flow matching et optimisation différentiable
27arXiv cs.RO 

Flow-Opt : optimisation centralisée et scalable de trajectoires multi-robots par flow matching et optimisation différentiable

Flow-Opt est une méthode de planification de trajectoires multi-robots publiée sur arXiv (référence 2510.09204v2) qui s'attaque à un verrou connu de la robotique en essaim : l'optimisation centralisée dans l'espace joint de plusieurs robots est théoriquement supérieure (accès à un espace de solutions plus large, trajectoires plus fluides dans les espaces contraints), mais devient informatiquement intractable dès que la flotte dépasse quelques unités. L'approche proposée décompose le problème en deux étapes : un modèle génératif basé sur le flow matching, implémenté via un diffusion transformer (DiT) augmenté d'encodeurs invariants aux permutations pour les positions des robots et la carte, produit des trajectoires candidates ; un Safety-Filter (SF) différentiable, doté d'un réseau de neurones qui prédit une initialisation spécifique au contexte de façon auto-supervisée, garantit ensuite la satisfaction des contraintes à l'inférence. Résultat annoncé : génération de trajectoires pour des dizaines de robots en environnement encombré en quelques dizaines de millisecondes, avec la capacité de résoudre plusieurs dizaines d'instances en parallèle en une fraction de seconde. Ces performances, si elles se confirment hors benchmark contrôlé, changeraient concrètement le dimensionnement des systèmes de gestion de flotte (FMS) pour les AMR en entrepôt ou en environnement industriel. Aujourd'hui, les planificateurs centralisés sont réservés à de petites flottes ou nécessitent des horizons de planification longs ; les approches décentralisées sacrifient l'optimalité globale. Flow-Opt revendique de combler cet écart en rendant le calcul centralisé compatible avec les contraintes temps-réel. La capacité de batching est particulièrement notable : elle permet de traiter des dizaines d'instances simultanément, ce qui ouvre la voie à une planification à re-planification fréquente ou à des architectures de simulation-dans-la-boucle. Il faut cependant noter que les résultats sont présentés sur des benchmarks simulés et que le gap sim-to-real n'est pas adressé dans ce papier. La planification de trajectoires multi-robots centralisée est un problème ouvert depuis les années 2010, avec des travaux fondateurs comme CBS (Conflict-Based Search) et ses dérivés. Les approches par apprentissage profond, notamment les modèles de diffusion appliqués à la planification (DDPM, Score Matching), ont montré des gains de vitesse mais peinaient à garantir la faisabilité des trajectoires produites. Flow-Opt se positionne comme une alternative plus rapide et plus fiable face à ces baselines diffusion, tout en restant dans le registre académique : aucun déploiement industriel n'est annoncé. Les acteurs comme Exotec (Hauts-de-France), qui opère des flottes denses de robots Skypod, ou MiR et Locus Robotics, pourraient être des débouchés naturels si les auteurs industrialisent leur approche. La prochaine étape logique serait une validation sur hardware réel avec des perturbations dynamiques.

UEExotec (Hauts-de-France), opérateur de flottes denses de robots Skypod, est explicitement cité comme débouché naturel si la méthode est industrialisée, ce qui représente un impact potentiel direct sur l'écosystème robotique français.

RecherchePaper
1 source
HAVEN : navigation hiérarchique sensible aux adversaires, visibilité et couverts par réseaux Q à transformeurs profonds
28arXiv cs.RO 

HAVEN : navigation hiérarchique sensible aux adversaires, visibilité et couverts par réseaux Q à transformeurs profonds

Des chercheurs ont publié sur arXiv (arXiv:2512.00592v2) un framework de navigation autonome baptisé HAVEN, Hierarchical Adversary-aware Visibility-Enabled Navigation, conçu pour faire évoluer des agents robotiques dans des environnements partiellement observables, c'est-à-dire là où les capteurs ne voient pas tout et où des obstacles occultent une partie de la scène. L'architecture combine un réseau de neurones de type Deep Transformer Q-Network (DTQN) pour la sélection de sous-objectifs à haut niveau, et un contrôleur bas niveau à champs de potentiel pour l'exécution des waypoints. Le DTQN ingère des historiques courts de features contextuelles, odométrie, direction de l'objectif, proximité des obstacles, indices de visibilité, et produit des Q-values qui classent les sous-objectifs candidats. Une génération de candidats dite "visibility-aware" introduit des pénalités d'exposition et récompense l'utilisation des couverts, favorisant un comportement anticipatoire plutôt que réactif. Le système a été validé en simulation 2D puis transféré sans modification architecturale vers un environnement 3D Unity-ROS, en projetant la perception point-cloud dans le même schéma de features. Ce travail s'attaque à un problème concret dans les déploiements robotiques réels : les planificateurs classiques (A*, RRT) et les politiques de reinforcement learning sans mémoire peinent dès que le champ de vision est limité, générant des manœuvres sous-optimales ou dangereuses dans des espaces encombrés. L'apport du Transformer réside dans sa capacité à exploiter l'historique temporel pour inférer l'état caché de l'environnement, là où un réseau feedforward réagirait à l'instant présent. Les résultats montrent des améliorations mesurées sur le taux de succès, les marges de sécurité et le temps jusqu'à l'objectif par rapport aux baselines RL et aux planificateurs classiques, bien que les expériences restent en simulation, sans banc d'essai sur hardware réel, ce qui laisse ouverte la question du sim-to-real gap. HAVEN s'inscrit dans une tendance de recherche qui applique les architectures Transformer, initialement conçues pour le NLP, au contrôle séquentiel de robots en environnements incertains. Le champ de l'autonomie sous occlusion est particulièrement actif : des travaux comme Decision Transformer ou GTrXL ont posé les bases de l'usage de la mémoire contextuelle en RL. Les domaines d'application cités par les auteurs couvrent la logistique entrepôt (AMR en environnement dynamique), la conduite urbaine et la surveillance, un positionnement qui rejoint les problématiques des acteurs de la navigation indoor comme Exotec ou Balyo côté français. La prochaine étape naturelle serait une validation sur plateforme physique et des benchmarks en environnements réels avec adversaires mobiles, conditions non encore adressées dans cette version.

UELes acteurs français de la navigation indoor comme Exotec et Balyo pourraient être concernés par cette approche de planification sous occlusion, mais le travail reste entièrement en simulation sans validation matérielle.

RecherchePaper
1 source
Learning-Based Sparsification of Dynamic Graphs in Robotic Exploration Algorithms
29arXiv cs.RO 

Learning-Based Sparsification of Dynamic Graphs in Robotic Exploration Algorithms

Des chercheurs ont publié sur arXiv (arXiv:2504.16509) une architecture transformer entraînée par apprentissage par renforcement, spécifiquement l'algorithme PPO (Proximal Policy Optimization), pour élaguer dynamiquement les graphes de planification utilisés dans les algorithmes d'exploration robotique. Le système cible les graphes RRT (Rapidly Exploring Random Trees) employés dans l'exploration par frontières, une méthode classique où un robot identifie les limites entre zones cartographiées et inconnues pour piloter sa navigation. En simulation, le framework réduit la taille des graphes jusqu'à 96 % sans intervention humaine, en prenant des décisions de suppression de nœuds en temps réel pendant que le robot explore son environnement. L'intérêt opérationnel est direct : dans les systèmes d'exploration autonome longue durée, entrepôts, sites industriels, bâtiments en intervention d'urgence, les graphes de planification grossissent de façon non bornée et dégradent les performances au fil du temps, forçant soit des redémarrages, soit des architectures mémoire coûteuses. Ici, la politique apprise parvient à associer des décisions locales d'élagage à des résultats d'exploration globaux malgré un signal de récompense rare et retardé, ce qui constitue le résultat le plus difficile à obtenir en RL appliqué à la planification. En contrepartie, le taux d'exploration moyen est légèrement inférieur aux baselines non élagués, mais l'écart-type de couverture est le plus bas observé : le robot explore moins vite, mais de façon nettement plus prévisible d'un environnement à l'autre, un critère souvent plus pertinent en déploiement industriel que la vitesse brute. La sparsification de graphes dynamiques est un problème connu en SLAM et planification de mouvement, traditionnellement traité par des heuristiques géométriques ou des seuils fixes. Appliquer du RL à cette couche basse de la pile robotique est, selon les auteurs, une première. Le travail reste à ce stade une preuve de concept en simulation, sans validation sur hardware réel ni comparaison avec des systèmes commerciaux comme les AMR de MiR, Fetch Robotics ou Exotec. Les prochaines étapes naturelles seraient un transfert sim-to-real et une évaluation sur des graphes issus de LiDAR 3D, contexte dans lequel la croissance exponentielle des graphes est particulièrement problématique.

RecherchePaper
1 source
Un système d'IA apprend à fluidifier la circulation des robots en entrepôt
30Robohub 

Un système d'IA apprend à fluidifier la circulation des robots en entrepôt

Des chercheurs du MIT et de la société américaine Symbotic ont publié le 20 avril 2026 dans le Journal of Artificial Intelligence Research un système hybride capable de coordonner en temps réel des flottes de centaines de robots autonomes (AMR) dans des entrepôts e-commerce à grande échelle. La méthode repose sur un réseau de neurones entraîné par apprentissage par renforcement profond (deep RL), qui décide en continu lesquels des robots doivent être priorisés à chaque instant en fonction de la formation de congestions. Une fois cette décision prise, un algorithme de planification déterministe transmet les instructions aux robots pour qu'ils se reroutent avant d'atteindre un point de blocage. Dans des simulations inspirées de layouts réels d'entrepôts e-commerce, le système a atteint un gain de débit (throughput) d'environ 25 % par rapport aux méthodes de référence actuelles. Han Zheng, doctorant au Laboratory for Information and Decision Systems (LIDS) du MIT et auteur principal, précise que même une amélioration de 2 à 3 % du throughput représente un impact économique significatif à cette échelle. L'enjeu opérationnel est concret : dans un entrepôt dense, une collision ou un embouteillage mineur peut forcer l'arrêt complet du site pendant plusieurs heures pour intervention manuelle, un coût inacceptable pour les opérateurs logistiques. Ce que prouve ce travail, c'est que le deep RL peut dépasser les performances des algorithmes conçus par des experts humains sur un problème combinatoire dynamique, là où les heuristiques classiques peinent à s'adapter aux variations de charge ou de topologie. Le système démontre aussi une capacité de généralisation : entraîné sur certains layouts, il s'adapte à des configurations différentes (nombre de robots, géométrie de l'entrepôt) sans réentraînement complet. Pour les intégrateurs et les COO industriels, cela signifie qu'un modèle unique pourrait être déployé sur plusieurs sites sans re-paramétrage lourd, réduisant le coût de mise en oeuvre. Il faut toutefois noter que les résultats présentés restent à ce stade issus de simulations, et qu'aucun déploiement réel en production n'est encore documenté dans la publication. Symbotic, partenaire industriel de ces travaux, est un acteur américain spécialisé dans l'automatisation d'entrepôts qui équipe notamment les centres de distribution de Walmart et de C&S Wholesale Grocers. La collaboration avec le groupe de Cathy Wu (professeure associée en génie civil et environnemental au MIT, membre du LIDS) s'inscrit dans une tendance plus large d'intégration de méthodes d'IA avancées dans la gestion de flottes robotiques, un domaine où l'on retrouve également des approches concurrentes chez Amazon Robotics, 6 River Systems (Shopify) et Locus Robotics. Du côté européen, des acteurs comme Exotec (France), dont le système Skypod opère dans des entrepôts Decathlon et Carrefour, s'appuient encore principalement sur des planificateurs déterministes ; ce type de travaux pourrait orienter leurs prochaines générations de software. La prochaine étape logique pour l'équipe MIT/Symbotic sera une validation en environnement réel, dont aucune timeline n'est encore annoncée publiquement.

UEExotec (France), dont le système Skypod s'appuie sur des planificateurs déterministes dans les entrepôts Decathlon et Carrefour, pourrait s'orienter vers ce type d'approches RL hybrides pour ses prochaines générations de software de gestion de flotte.

AutrePaper
1 source
GIST : extraction de connaissances multimodales et ancrage spatial par topologie sémantique intelligente
31arXiv cs.RO 

GIST : extraction de connaissances multimodales et ancrage spatial par topologie sémantique intelligente

Des chercheurs ont publié GIST (Grounded Intelligent Semantic Topology), un pipeline de traitement multimodal capable de transformer un nuage de points 3D capturé avec un équipement grand public en une carte de navigation sémantiquement annotée. Le système construit d'abord une carte d'occupation 2D, en extrait la topologie spatiale, puis y superpose une couche sémantique légère par sélection intelligente de keyframes. Quatre modules sont démontrés en aval : un moteur de recherche sémantique capable d'inférer des alternatives catégorielles quand la correspondance exacte échoue, un localisateur one-shot atteignant 1,04 mètre d'erreur de translation moyenne (top-5), un classificateur de zones segmentant le plan de sol en régions sémantiques de haut niveau, et un générateur d'instructions de navigation en langage naturel ancré visuellement dans des repères contextuels. Une évaluation in situ sur cinq participants affiche un taux de succès de navigation de 80 % en s'appuyant uniquement sur des instructions verbales. L'intérêt pour les intégrateurs industriels réside dans l'approche bas coût : GIST ne requiert pas de LiDAR haute précision, mais exploite un nuage de points mobile grand public, ce qui abaisse significativement le seuil d'entrée pour des déploiements en entrepôt, hôpital ou grande surface. La robustesse à la distribution longue des sémantiques visuelles, problème classique dans les environnements retail denses où les rayonnages changent fréquemment, est explicitement adressée, là où les VLMs (Vision-Language Models) courants échouent sur le grounding spatial en environnement encombré. Cela dit, l'évaluation reste exploratoire (N=5), et les résultats ne constituent pas une validation à l'échelle industrielle. Le papier s'inscrit dans un courant de recherche actif autour de la navigation sémantique pour l'IA incarnée, en concurrence directe avec des approches comme les semantic maps dérivées de NeRF ou les pipelines SLAM enrichis par LLM. Côté Europe, des acteurs comme Enchanted Tools (robots hospitaliers) ou Exotec (systèmes AMR pour entrepôts) pourraient trouver dans ce type de représentation topologique une brique utile pour la localisation fine et la génération d'instructions opérateur. L'article est disponible en preprint sur arXiv (2604.15495) et n'a pas encore été soumis à évaluation par les pairs au moment de sa publication.

UEDes acteurs français comme Enchanted Tools (robots hospitaliers) et Exotec (AMR entrepôts) pourraient exploiter ce type de cartographie sémantique bas coût pour améliorer la localisation fine et la génération d'instructions opérateur, sans investissement LiDAR haute précision.

RecherchePaper
1 source