Dossier AMR & automatisation d'entrepôt

11 articles

AMR et automatisation d'entrepôt : Amazon Robotics, Symbotic, Locus, GreyOrange, Geek+, déploiements e-commerce et logistique tiers.

Figure 1X Technologies Tesla Optimus Boston Dynamics Unitree AgiBot Apptronik Apollo Agility Robotics — Digit UBTech Fourier Intelligence Sanctuary AI Wandercraft Tous les dossiers →

1arXiv cs.RO RecherchePaper

PECMAN : navigation collaborative multi-agents par perception en environnements inconnus

Des chercheurs ont publié sur arXiv (réf. 2605.09344) PECMAN, un système de navigation collaborative multi-agents conçu pour des environnements inconnus et dynamiques. L'algorithme s'appuie sur SMART-3D, un planificateur de trajectoires fondé sur la structure RRT* (Rapidly-exploring Random Tree) capable de reconfigurer en temps réel son arbre de planification dès qu'un obstacle ou une nouvelle structure est détecté : plutôt que de reconstruire l'arbre depuis zéro, SMART-3D élague les noeuds et arêtes invalidés, puis répare les sous-arbres déconnectés à des points critiques appelés "hot-nodes". PECMAN étend ce mécanisme à la coopération multi-agents via deux stratégies combinées : une morphologie d'arbre distribuée, où chaque robot replanifie localement, et une perception partagée, par laquelle chaque agent diffuse les structures nouvellement découvertes à ses coéquipiers, leur permettant de replanifier proactivement même dans des zones encore inexplorées. Évalué sur 28 000 simulations couvrant sept scénarios 2D distincts, le système atteint jusqu'à 52 % de réduction du temps de complétion collective avec un taux de succès proche de 100 %. Les expériences ont également été validées sur deux robots autonomes réels dans un environnement de bâtiment. La contribution architecturale centrale est la perception partagée sans coordinateur central : chaque agent enrichit la carte collective en temps réel, ce qui réduit les replanifications redondantes et la latence de réaction de la flotte entière. Pour les intégrateurs de systèmes AMR (Autonomous Mobile Robots) en logistique ou en inspection industrielle, c'est précisément le verrou qui bloque le passage à l'échelle des flottes dans des environnements semi-structurés. La validation physique, même limitée à deux robots, apporte un début de réponse au problème classique du sim-to-real gap, l'un des obstacles majeurs au déploiement de planificateurs collaboratifs en conditions réelles. La réduction de 52 % du temps de complétion est prometteuse, mais mérite d'être interprétée avec prudence : les simulations 2D ne capturent pas la complexité des environnements 3D, et les scénarios de test ne sont pas détaillés dans l'abstract. Les approches multi-agents existantes comme CBS (Conflict-Based Search) ou ORCA supposent généralement des cartes connues à l'avance, ce qui les rend difficilement applicables à une exploration progressive. SMART-3D avait résolu ce problème pour un agent unique ; PECMAN en est l'extension coopérative naturelle. Aucun partenaire industriel ni déploiement commercial n'est mentionné dans la publication, qui reste une contribution académique. Les prochaines étapes logiques seraient des tests sur des flottes plus larges et en environnements 3D réels, conditions nécessaires pour envisager un transfert vers des entrepôts multi-niveaux ou des bâtiments industriels complexes, où les systèmes AMR actuels peinent encore à coordonner leur navigation de façon autonome.

1 source

2Pandaily

LDROBOT Robotics bondit de 103 % lors de son introduction en bourse à Hong Kong, valorisée à 2,4 milliards de dollars

LDROBOT Robotics, fabricant de capteurs pour la robotique basé à Shenzhen, a fait ses débuts à la Bourse de Hong Kong le 9 mai 2026 avec une hausse de 103 %, clôturant à HK$53,5 par action et atteignant une capitalisation boursière de HK$17,8 milliards (environ 2,4 milliards de dollars). L'introduction en bourse a levé HK$878,7 millions (~113 millions de dollars), avec une sursouscription du compartiment retail de 6 707 fois, l'une des plus élevées enregistrées pour une IPO hongkongaise en 2026. La société fournit principalement des capteurs LiDAR à technologie DTOF (Direct Time-of-Flight) à des fabricants d'aspirateurs robots et d'appareils domestiques autonomes, dont Ecovacs et Dreame, et revendique un déploiement de sa technologie dans plus de 6 millions de robots à l'échelle mondiale. L'engouement des investisseurs traduit un pari structurel sur la couche perception de la robotique, distincte du hardware locomoteur ou du software d'IA. Le LiDAR DTOF est un composant critique pour la navigation autonome à courte portée dans les robots de service et les AMR (Autonomous Mobile Robots) d'intérieur. La valorisation atteinte dès le premier jour signale que les marchés capitalisent désormais sur les fournisseurs de composants robotiques, pas seulement sur les intégrateurs finaux ou les plateformes logicielles. LDROBOT devient la deuxième entreprise robotique cotée à Shenzhen après UBTECH, ce qui consolide le Guangdong comme épicentre de l'écosystème hardware chinois. Il convient toutefois de noter que la performance boursière du premier jour reflète en partie une demande comprimée par la sursouscription et ne garantit pas une valorisation stable à moyen terme. La société a été fondée par Zhou Wei, entrepreneur en série de 85 ans et ancien de l'Université des Sciences et Technologies de Huazhong. Il avait auparavant dirigé Shenzhen Lexing Tianxia dans le secteur des trottinettes électriques à équilibrage, avant de pivoter vers les capteurs robotiques et d'atteindre la première place mondiale en volume de livraisons de LiDAR DTOF. Le tour de table pré-IPO associait des fonds institutionnels (Source Code Capital, China Unicom CICC Fund, Shenzhen Gaotou) à des investisseurs industriels comme New Hope Group, ainsi qu'à la holding personnelle de Wu Yongming, PDG d'Alibaba. Du côté concurrentiel, LDROBOT se positionne face à des acteurs comme Livox (filiale DJI) sur le LiDAR embarqué et à des fournisseurs coréens et japonais sur les marchés export, mais son ancrage dans l'écosystème robot domestique chinois lui confère un avantage de volume difficile à répliquer rapidement.

Chine/AsieOpinion

1 source

3arXiv cs.RO

Livraison multi-agents avec correspondances multiples

Des chercheurs ont publié sur arXiv (référence 2605.07835) un algorithme baptisé M2M (Many-to-Many Multi-Agent Pickup and Delivery) pour optimiser la coordination de flottes de robots dans des entrepôts automatisés. La majorité des travaux antérieurs sur le problème MAPD (Multi-Agent Pickup and Delivery) supposent qu'une tâche a un unique point de collecte et un unique point de dépôt, le paradigme dit "one-to-one". M2M s'attaque à la variante "many-to-many" : dans un entrepôt réel, un article identifié par son SKU (Stock Keeping Unit) peut être prélevé ou stocké à plusieurs emplacements, ce qui génère un problème d'affectation à quatre dimensions classé NP-difficile. L'équipe propose deux variantes : M2M, qui minimise la durée estimée de chaque tâche, et M2M-wSKU, qui intègre en plus la distribution physique des SKUs dans la fonction objectif. En simulation sur des opérations de 8 heures, M2M complète jusqu'à 22 000 tâches supplémentaires en moyenne par rapport aux meilleures méthodes existantes, selon les configurations d'environnement et la densité d'inventaire. Le gain de 22 000 tâches sur une journée simulée de 8 heures représente un saut de throughput significatif pour un entrepôt à forte rotation. Pour un intégrateur ou un COO industriel, cela se traduit directement en capacité de traitement d'ordres supplémentaires sans augmenter le parc de robots. L'enjeu théorique est tout aussi notable : la transition du paradigme one-to-one vers many-to-many reflète fidèlement la réalité des entrepôts modernes, où la redondance d'emplacements est un mécanisme délibéré de résilience logistique. Une limite mérite d'être soulignée : les simulations sur 8 heures ne capturent pas les pannes matérielles, la variabilité des temps de manipulation, ni les interactions humaines en zones mixtes. Sur le plan académique toutefois, M2M établit une nouvelle référence sur ce sous-problème MAPD jusqu'ici peu traité. Le MAPD est un champ de recherche actif depuis une quinzaine d'années, porté par l'essor des entrepôts automatisés et des systèmes AMR (Autonomous Mobile Robots). Les algorithmes classiques ciblaient des scénarios one-to-one correspondant aux premières architectures d'entrepôts, mais les systèmes industriels modernes opèrent quasi universellement en many-to-many. L'entreprise française Exotec, avec son système Skypod déployé chez plus de 400 clients dans 15 pays, incarne précisément cette réalité multi-emplacements, aux côtés d'acteurs comme Amazon Robotics, Geek+ ou AutoStore. La publication de M2M sur arXiv ouvre la voie à son intégration dans des frameworks open-source de planification multi-robots. Les prochaines étapes attendues incluent une validation sur environnements physiques et la prise en compte de contraintes temporelles réelles, telles que les fenêtres de livraison ou les priorités dynamiques de commande.

UEL'algorithme M2M pourrait être directement intégré dans des systèmes comme le Skypod d'Exotec, permettant d'augmenter le débit des entrepôts automatisés européens sans extension du parc de robots.

IndustrielPaper

1 source

4arXiv cs.RO

Bi3 : un jeu de données biplateforme, biculturel et bipersonnel pour la navigation des robots sociaux

Bi3 est un jeu de données pour la navigation sociale de robots en espaces contraints, publié en preprint sur arXiv en mai 2026. L'expérience place systématiquement un robot face à deux humains dans un espace de laboratoire restreint, avec 74 participants recrutés sur deux sites : un aux États-Unis, un en France. Le dataset totalise 10,5 heures de trajectoires avec vérité terrain pour humains et robots, des flux vidéo RGB et des évaluations subjectives des participants sur les performances du robot. Cinq algorithmes de navigation distincts ont été testés sur deux plateformes robotiques différentes, ce qui constitue une couverture algorithmique et matérielle inédite dans ce domaine. La navigation sociale en milieu dense reste l'un des verrous techniques majeurs de la robotique de service et de la logistique en environnement humain. Les benchmarks existants souffrent généralement d'un biais culturel marqué et d'une densité d'interaction artificiellement faible. Bi3 cible ces lacunes directement : la dimension biculturelle France/USA permet de tester si les comportements proximaux humains varient selon les normes sociales locales, une hypothèse rarement éprouvée empiriquement. Les métriques publiées, densité d'interaction et vélocité humaine, montrent une complexité comportementale supérieure aux datasets précédents, ce qui en fait un terrain d'évaluation plus exigeant pour les modèles de prédiction de mouvement et les politiques de contrôle de navigation. Ce dataset s'inscrit dans l'effort collectif de la communauté robotique pour réduire l'écart entre simulations et déploiements réels. La présence d'un site de collecte en France est notable : elle apporte une représentation européenne rare dans ce type de benchmark, où les données américaines ou asiatiques dominent historiquement. Bi3 est conçu comme une ressource ouverte pour entraîner des architectures VLA (Vision-Language-Action) et des politiques de navigation en espaces denses, ainsi que des modèles de prédiction de mouvement humain. À ce stade, il s'agit d'un preprint académique, pas d'un déploiement opérationnel. Les suites naturelles incluent l'intégration dans des benchmarks standardisés et l'utilisation pour affiner des politiques de navigation sur des AMR (Autonomous Mobile Robots) en environnement industriel ou hospitalier.

UELa présence d'un site de collecte en France apporte des données comportementales européennes dans un benchmark de navigation sociale, offrant une référence plus représentative pour calibrer des AMR déployés en milieu hospitalier ou industriel en Europe.

RecherchePaper

1 source

5arXiv cs.RO

Planification robotique sous contraintes de ressources face à une incertitude mixte

Des chercheurs présentent le CMDPST (Consumption Markov Decision Process with Set-valued Transitions), un cadre formel inédit permettant à un robot de planifier ses actions en tenant compte simultanément de deux types d'incertitudes : le bruit probabiliste mesurable et les inconnues structurellement non-quantifiables, tout en garantissant que le système ne tombe jamais à court de ressources opérationnelles (batterie, capacité de charge, quota de déplacements). Publiée sur arXiv en mai 2026 (réf. 2605.05797), la contribution couple ce modèle à une spécification de tâche exprimée en LTLf (logique temporelle linéaire sur traces finies), un formalisme permettant d'encoder des objectifs complexes avec des contraintes temporelles précises. Les auteurs proposent deux algorithmes de synthèse de stratégie : une méthode directe par déroulage d'états et une version optimisée par élagage de l'espace d'états, plus efficace en temps de calcul. Les expériences sont conduites sur un réseau de transport en entrepôt simulé, sans validation sur hardware réel à ce stade. La contribution adresse un angle mort récurrent dans la planification robotique industrielle : la plupart des approches existantes traitent soit l'incertitude probabiliste via les MDP classiques, soit les contraintes de ressources, rarement les deux ensemble. Dans les déploiements AMR (autonomous mobile robots) d'entrepôt, où une flotte doit honorer des missions tout en gérant niveaux de batterie et pannes imprévisibles, cette dualité est pourtant critique. Le cadre CMDPST offre aux intégrateurs une garantie formelle : la stratégie synthétisée ne laissera jamais un robot en panne sèche, même face à des perturbations non modélisées. C'est un argument solide pour des environnements industriels où l'interruption de service a un coût direct et mesurable. Ce type de planification sous contraintes mixtes s'inscrit dans un corpus plus large incluant la vérification probabiliste de modèles (outils PRISM, Storm) et la planification formelle par MDP. Les acteurs de la logistique automatisée comme Exotec (France) ou Hai Robotics, dont les flottes AMR évoluent dans des environnements partiellement inconnus, sont directement concernés par ces avancées théoriques. Côté alternatives académiques, le reinforcement learning robuste et le model predictive control probabiliste existent, mais sans les garanties formelles d'épuisement de ressources que revendique cette approche. La prochaine étape attendue est une implémentation sur robot physique pour évaluer concrètement le gap sim-to-real.

UEExotec (France) est explicitement citée comme acteur directement concerné par ces avancées théoriques, ses flottes AMR en entrepôt étant précisément le cas d'usage visé par les garanties formelles de non-épuisement des ressources du cadre CMDPST.

RecherchePaper

1 source

6arXiv cs.RO

Apprentissage par renforcement basé sur un modèle pour le contrôle robotique via optimisation en ligne

Des chercheurs ont publié sur arXiv (arXiv:2510.18518v2) un algorithme d'apprentissage par renforcement basé sur un modèle (MBRL) conçu pour contrôler des systèmes robotiques complexes directement dans le monde réel, sans passer par une phase de simulation intensive. L'approche construit un modèle de dynamique à partir des données d'interaction en temps réel, puis effectue des mises à jour de politique guidées par ce modèle appris. Les validations expérimentales ont été conduites sur deux plateformes distinctes : un bras d'excavatrice hydraulique et un bras robot souple. Dans les deux cas, l'algorithme atteint des performances comparables aux méthodes model-free en quelques heures d'entraînement, là où ces dernières réclament habituellement des millions d'interactions simulées. La robustesse de l'adaptation a également été évaluée sous conditions de charge utile (payload) aléatoire, avec des résultats stables malgré le changement de dynamique. L'enjeu principal est la réduction de ce que le secteur appelle le "sim-to-real gap" : l'écart entre les politiques apprises en simulation et leur comportement réel une fois déployées sur du matériel. Les pipelines dominants, adoptés aussi bien par des labos académiques que par des industriels comme Boston Dynamics ou Figure AI, reposent sur des millions de rollouts en simulation avant tout contact avec un robot physique, ce qui introduit un biais systématique difficile à corriger. Cet algorithme court-circuite cette étape en apprenant directement sur données réelles, avec une garantie formelle de progression : les auteurs démontrent des bornes de regret sous-linéaires (sublinear regret bounds) sous hypothèses d'optimisation stochastique en ligne, ce qui est rare dans la littérature MBRL appliquée à la robotique physique. Pour un intégrateur ou un industriel, cela se traduit par une réduction potentielle du temps de mise en service sur des tâches à dynamique variable (variation de charge, usure mécanique, changement de matériau). Ce travail s'inscrit dans un débat structurant du champ : model-based vs model-free RL pour la robotique physique. Les méthodes model-free comme PPO ou SAC dominent les benchmarks simulés mais peinent à s'adapter efficacement en production réelle. Des approches hybrides comme MBPO ou DreamerV3 ont tenté de combler cet écart, mais rarement validées sur des systèmes aussi hétérogènes qu'un bras hydraulique industriel et un manipulateur souple. La prochaine étape naturelle serait une validation sur des plateformes humanoïdes ou des AMR (autonomous mobile robots) à haute dimension, où les enjeux de sample efficiency sont directement liés aux coûts d'exploitation et à la durée de vie des actionneurs.

RecherchePaper

1 source

7arXiv cs.RO

FORMULA : MPC de formation avec apprentissage de barrières neuronales pour la garantie de sécurité

Une équipe de chercheurs propose FORMULA (FORmation MPC with neUral barrier Learning for safety Assurance), un framework de contrôle distribué pour systèmes multi-robots (MRS) publié sur arXiv (réf. 2604.04409v2). L'approche combine trois briques algorithmiques : du Model Predictive Control (MPC) pour la planification prédictive, des Control Lyapunov Functions (CLFs) pour garantir la stabilité de la formation, et des Control Barrier Functions (CBFs) implémentées sous forme de réseaux de neurones pour assurer la sécurité de manière décentralisée. L'objectif est de permettre à une flotte de robots de naviguer en formation dans des environnements encombrés et dynamiques, sans conception manuelle des contraintes de sécurité. Les résultats présentés sont issus de simulations uniquement ; aucun déploiement matériel n'est rapporté à ce stade. Le verrou technique adressé est réel : les approches MPC classiques pour la formation multi-robots peinent à passer à l'échelle, tandis que les CBFs, pourtant fondées mathématiquement pour l'enforcement de sécurité, sont difficiles à concevoir à la main pour des systèmes non-linéaires complexes. FORMULA automatise cette conception via l'apprentissage, ce qui réduit la charge de calcul en ligne et permet de résoudre les situations de blocage (deadlocks) en configuration dense. Pour un intégrateur ou un COO industriel, c'est le type de brique qui conditionne le passage de pilotes en cellule à des déploiements flotte réelle dans des entrepôts ou sur des sites logistiques. La formation en robotique mobile est un problème ouvert depuis les années 2000, et les approches MPC centralisées ont longtemps buté sur la scalabilité. Le contexte applicatif visé -- logistique entrepôt, transport de matériaux, réponse aux catastrophes -- est précisément celui où des acteurs comme Exotec (France) ou Locus Robotics opèrent avec des flottes d'AMR (Autonomous Mobile Robots) sans formation rigide. FORMULA se positionne donc sur un créneau de contrôle coordonné plus contraignant que les AMR classiques. La limite principale reste l'absence de validation sur hardware réel : le gap sim-to-real pour les CBFs neuronales, notamment en présence de bruit de capteurs et de latences réseau, n'est pas adressé dans ce preprint.

UESi les résultats se confirment sur hardware réel, des acteurs européens de la logistique robotisée (dont Exotec en France) pourraient intégrer ce type de brique de contrôle coordonné pour des flottes d'AMR en environnements denses, mais l'impact reste conditionnel à la validation sim-to-real.

RecherchePaper

1 source

8arXiv cs.RO

Faut-il vraiment réinitialiser immédiatement ? Repenser la gestion des collisions pour une navigation robotique efficace

Une équipe de chercheurs propose, dans un préprint déposé sur arXiv le 2 mai 2026 (référence 2605.02192), un nouveau cadre d'entraînement pour la navigation robotique par apprentissage par renforcement profond (DRL), baptisé Multi-Collision reset Budget (MCB). La convention actuelle dans la majorité des frameworks DRL est la suivante : toute collision déclenche immédiatement un reset global de l'épisode et est comptabilisée comme un échec total de la tâche. MCB rompt avec cette logique en découplant la terminaison locale sur collision du reset global de l'environnement, permettant à l'agent d'effectuer plusieurs tentatives au sein d'un même épisode sur une configuration d'obstacles difficile, jusqu'à épuisement d'un budget de collisions défini. Les expériences ont été conduites sur plusieurs plateformes robotiques simulées et réelles, et les auteurs rapportent des gains de taux de succès et d'efficacité de navigation supérieurs aux baselines à collision unique, avec un budget de collisions réduit produisant les meilleurs résultats. L'enjeu est directement lié à une limite connue du DRL appliqué à la navigation en environnements denses : en pénalisant durement chaque collision dès les premières étapes d'entraînement, les agents évitent les configurations complexes plutôt que de les apprendre, ce qui ralentit la convergence. MCB autorise une exploration plus agressive des zones difficiles sans pour autant sacrifier la sécurité en déploiement, où la politique apprise conserve un comportement zéro-collision. Cela adresse indirectement le "sim-to-real gap" en exposant l'agent à des scénarios d'entassement d'obstacles que les resets prématurés rendaient statistiquement rares durant la phase d'exploration précoce. L'approche n'est toutefois présentée que dans un contexte de résultats expérimentaux préliminaires, sans benchmark comparatif exhaustif sur des datasets standardisés. Cette publication s'inscrit dans un débat plus large sur la conception des fonctions de récompense et des conditions de terminaison en DRL pour la navigation mobile, un domaine où des travaux comme ceux de Berkeley (sur la navigation sociale) ou les approches curriculum learning d'OpenAI ont montré l'importance des dynamiques d'exploration en début d'entraînement. Côté robotique industrielle, les AMR (Autonomous Mobile Robots) de Exotec ou des intégrateurs logistiques européens utilisent majoritairement des planificateurs classiques, mais la pression vers des politiques apprises pour des environnements non-structurés rend ce type de recherche pertinent à moyen terme. La prochaine étape logique serait une validation sur des plateformes de référence (TurtleBot, Spot, ou robots humanoïdes à roues) et une comparaison directe avec des méthodes curriculum existantes.

UEImpact indirect à moyen terme : si l'approche MCB se confirme sur des benchmarks standardisés, des acteurs comme Exotec ou des intégrateurs AMR européens opérant en environnements non-structurés pourraient en tirer parti pour passer à des politiques de navigation apprises.

RecherchePaper

1 source

9Robotics & Automation News

Les robots transforment les transpalettes

Les chariots élévateurs à palette, longtemps cantonnés à un usage manuel dans les entrepôts, franchissent un cap technologique notable avec l'intégration massive de la robotique. Ces engins se muent progressivement en AGV (Automated Guided Vehicles) ou en AMR (Autonomous Mobile Robots), deux architectures distinctes : les AGV suivent des trajets prédéfinis via rails magnétiques ou marquages au sol, tandis que les AMR naviguent librement grâce à des capteurs LiDAR, des caméras stéréo et des algorithmes de cartographie SLAM. La fusion de ces technologies avec des couches d'intelligence artificielle permet aux chariots de détecter des obstacles, de replannifier leurs itinéraires en temps réel et de s'intégrer aux systèmes WMS (Warehouse Management System) existants. Pour un intégrateur ou un COO industriel, l'enjeu est direct : l'automatisation des tâches de manutention répétitives réduit les coûts opérationnels, augmente la cadence de traitement des palettes et limite les incidents liés à la fatigue humaine. Les AMR modernes atteignent des charges utiles de plusieurs tonnes et opèrent en multi-équipe sans interruption, ce qui modifie en profondeur les calculs de ROI sur les projets logistiques. Cela dit, l'article analysé relève davantage du contenu marketing généraliste que d'une annonce produit ou d'un déploiement chiffré, et n'apporte pas de métriques concrètes validant ces performances. Le marché de la manutention autonome est aujourd'hui dominé par des acteurs comme Linde, Toyota Industries, Jungheinrich ou Still côté chariots traditionnels reconvertis, face à des pure-players robotiques tels que Balyo, Exotec ou Fetch Robotics. En Europe, des acteurs français comme Exotec positionnent leurs solutions sur des segments adjacents (stockage automatisé dense), tandis que la pression des grands opérateurs e-commerce accélère les cycles d'adoption. Les prochaines étapes du secteur portent sur l'interopérabilité flotte et la standardisation des interfaces API entre AMR et WMS.

UEPlusieurs acteurs européens (Jungheinrich, Still, Linde, Balyo) et le français Exotec sont directement positionnés sur ce marché en consolidation, leur conférant un avantage structurel face aux pure-players américains et asiatiques.

IndustrielOpinion

1 source

10arXiv cs.RO

Vers un MAPF réaliste : SMART, un banc de test multi-agents extensible pour le monde réel

Une équipe de chercheurs a publié SMART (Scalable Multi-Agent Realistic Testbed), un environnement de simulation open-source destiné à l'évaluation des algorithmes MAPF (Multi-Agent Path Finding), c'est-à-dire la planification de trajectoires sans collision pour des flottes de robots. Le papier, référencé arXiv:2503.04798, présente un outil capable de simuler jusqu'à plusieurs milliers de robots simultanément, en intégrant un moteur physique complet qui modélise la kinodynamique des robots et les incertitudes d'exécution réelles. SMART s'appuie sur un cadre de supervision d'exécution basé sur l'Action Dependency Graph (ADG), ce qui permet une intégration modulaire avec différents planificateurs MAPF et modèles de robots. Le code est disponible publiquement sur GitHub, accompagné d'un service de démonstration en ligne. L'enjeu industriel est direct : les meilleurs planificateurs MAPF actuels sont capables de calculer des trajectoires pour des centaines de robots en quelques secondes, mais ils reposent presque tous sur des modèles de robots simplifiés, ignorant la dynamique réelle, les glissements, les délais de démarrage ou les imprécisions de positionnement. Ce fossé entre simulation idéalisée et comportement terrain est un frein majeur au déploiement en entrepôt ou en atelier. SMART propose de combler ce gap en permettant aux intégrateurs et aux équipes R&D de tester leurs algorithmes dans des conditions proches de la réalité sans avoir besoin de dizaines ou de centaines de robots physiques, ressource quasi-inaccessible en laboratoire. Pour un COO industriel qui évalue des solutions AMR (Autonomous Mobile Robots), disposer d'un simulateur crédible et open-source réduit significativement le risque d'un déploiement raté. Le problème du sim-to-real gap dans le MAPF est documenté depuis plusieurs années, et des acteurs comme Amazon Robotics, Geek+ ou Exotec en Europe ont développé leurs propres outils internes. SMART vise à démocratiser cet accès, notamment pour les équipes académiques et les intégrateurs de taille intermédiaire. Le framework ADG n'est pas nouveau, il était déjà central dans les travaux antérieurs sur l'exécution robuste de MAPF, mais son intégration dans un simulateur à physique réaliste et passant à l'échelle représente une avancée méthodologique. Les prochaines étapes probables incluent la validation sur des cas industriels concrets et l'ajout de modèles de robots commerciaux comme les AMR à différentiel ou les AGV à guidage magnétique.

UEExotec, acteur français des AMR d'entrepôt, est cité parmi les rares industriels disposant d'outils internes similaires ; SMART pourrait réduire la barrière à l'entrée pour les équipes R&D et intégrateurs européens de taille intermédiaire souhaitant valider des algorithmes MAPF sans flotte physique.

RecherchePaper

1 source

11arXiv cs.RO

Amélioration de la reconstruction de surfaces en verre par estimation de profondeur pour la navigation robotique

Des chercheurs ont publié le 25 avril 2026 sur arXiv (arXiv:2604.18336) un framework de reconstruction de surfaces vitrées destiné à améliorer la navigation autonome en intérieur. Le problème visé est concret : les capteurs de profondeur (LiDAR, RGB-D) échouent systématiquement face aux surfaces transparentes ou réfléchissantes comme le verre, qui génèrent des mesures erronées ou absentes. L'approche proposée exploite Depth Anything 3, un modèle fondationnel de vision monoculaire, comme prior géométrique, puis aligne ce prior sur les données brutes du capteur via un algorithme RANSAC local. Ce mécanisme permet d'éviter que les mesures corrompues par le verre ne contaminent la reconstruction finale, tout en récupérant une échelle métrique absolue que le modèle de fondation seul ne fournit pas. L'équipe publie également GlassRecon, un dataset RGB-D inédit avec vérité terrain dérivée géométriquement pour les régions vitrées, et annonce la mise à disposition du code et des données sur GitHub. Ce travail adresse un angle mort réel de la navigation robotique en milieu tertiaire. Les bureaux, centres commerciaux, aéroports et hôpitaux sont truffés de cloisons vitrées, de vitrines et de portes transparentes qui font échouer les AMR (Autonomous Mobile Robots) commerciaux en production. Le fait que le framework soit training-free est un avantage pratique direct pour les intégrateurs : il ne nécessite pas de retrainer un modèle sur des données propriétaires, et peut s'insérer dans un pipeline de navigation existant sans modification majeure. Les expériences montrent des gains consistants par rapport aux baselines de l'état de l'art, particulièrement dans les cas de corruption sévère du capteur, ce qui suggère une robustesse utile en conditions réelles plutôt qu'en environnement de laboratoire contrôlé. La détection et la reconstruction de surfaces transparentes est un problème ouvert depuis plusieurs années dans la communauté robotique. Des travaux antérieurs comme GlassNet ou Trans10K avaient abordé la segmentation du verre en RGB pur, mais la fusion avec des données de profondeur restait peu explorée de manière training-free. Du côté concurrentiel, des approches de completion de profondeur par deep learning (IP-Basic, PENet) ou de slam robuste aux occultations existent, mais elles requièrent typiquement un entraînement spécialisé. La contribution de ce papier est de positionner les modèles de fondation non pas comme remplaçants du capteur, mais comme régularisateurs géométriques. Les prochaines étapes annoncées sont la publication du dataset GlassRecon et du code, ce qui permettra à la communauté d'évaluer la reproductibilité des résultats. Aucun déploiement terrain ni partenaire industriel n'est mentionné à ce stade : il s'agit d'une contribution de recherche, pas d'un produit.

RecherchePaper

1 source