DiffuseDrive lutte contre la pénurie de données pour l’entraînement des robots et de l’IA

Dans l’univers en constante évolution de la robotique, la qualité des données est devenue le pilier fondamental de l’innovation. Les avancées en intelligence artificielle reposent sur des ensembles de données réalistes et exhaustifs. C’est ici qu’intervient DiffuseDrive, une entreprise pionnière dans la génération d’images photoréalistes.
Fondée en 2023 par Balint Pasztor et Roland Pinter, DiffuseDrive s’est rapidement imposée comme un acteur clé dans le domaine de la robotique autonome. En s’appuyant sur des modèles de diffusion propriétaires, l’entreprise parvient à combler les lacunes des données synthétiques souvent décalées par rapport à la réalité. Cette approche innovante permet de réduire considérablement le fossé entre la simulation et la réalité, essentiel pour le développement de systèmes autonomes fiables.

Les robots et les systèmes d’intelligence artificielle nécessitent une quantité colossale de données pour s’entraîner efficacement. Cependant, la collecte de données réelles peut s’avérer coûteuse et chronophage. Traditionnellement, les données issues des simulations basées sur des moteurs de jeu laissent souvent place à des écarts significatifs par rapport à la réalité, compromettant ainsi la fiabilité des systèmes développés. DiffuseDrive propose une solution en évaluant les données existantes, identifiant les insuffisances et utilisant des modèles de diffusion avancés pour générer des données photoréalistes de haute qualité.

Balint Pasztor, ingénieur de formation, et Roland Pinter, physicien, se sont rencontrés chez Bosch avant de fonder DiffuseDrive. Leur expérience commune dans le développement de véhicules autonomes de niveau 4 pour Porsche leur a permis de comprendre en profondeur les défis liés à la disponibilité des données. Pasztor souligne que la rareté des données est le maillon manquant pour résoudre les énigmes de l’IA physique, qui s’étend sur des secteurs variés tels que la fabrication, la surveillance, l’agriculture et l’aérospatiale.

L’expertise de DiffuseDrive réside dans sa capacité à générer des données spécifiques au domaine d’application. Les industries utilisent souvent les mêmes modèles depuis le début des années 2010, ce qui limite la couverture des domaines de conception opérationnelle. Selon Pasztor, les données synthétiques issues des simulations traditionnelles manquent de réalisme, particulièrement pour les fonctions critiques en termes de sécurité ou de mission. La plateforme de DiffuseDrive comble ce vide en produisant des données générées par l’IA qui sont indiscernables de la réalité.

Lors de la Conférence IEEE/CVF sur la Vision par Ordinateur et la Reconnaissance de Formes (CVPR) de cette année, seulement 50 % des participants parvenaient à reproduire fidèlement des images, témoignant des défis actuels dans le domaine de la génération de données réalistes. DiffuseDrive se positionne comme une solution efficace en identifiant et en comblant les lacunes des ensembles de données en quelques jours plutôt qu’en plusieurs mois ou années. Cette rapidité est cruciale pour répondre aux besoins croissants des applications robotiques commerciales, allant des véhicules autonomes à la reconnaissance d’articles pour le e-commerce.

La méthodologie de DiffuseDrive repose sur une analyse statistique classique et de nouvelles approches pour comprendre contextuellement les données existantes et élaborer de nouveaux points de données, similaires à un nuage de points. En construisant des arbres de décision basés sur les exigences spécifiques des clients, l’entreprise parvient à créer des ensembles de données pertinents et étendus, améliorant ainsi les performances des systèmes de 40 %. Par exemple, pour la conduite autonome de niveau 2, DiffuseDrive a développé une carte thermique des scénarios de stationnement et de la distribution des emplacements des objets, identifiant ainsi des éléments manquants et optimisant la distribution des données.

Un aspect clé de l’approche de DiffuseDrive est que les clients gardent le contrôle total de leurs données de domaine opérationnel (ODD). L’entreprise ne se positionne pas comme experte du domaine, mais comme un partenaire qui assimile la documentation et les données réelles des clients. Cette collaboration permet de générer des exigences spécifiques sans remplacer les rôles des experts du domaine. En utilisant des techniques de segmentation sémantique, de balisage contextuel et visuel, ainsi que des boîtes englobantes 2D et 3D, DiffuseDrive enrichit continuellement la connaissance de l’ODD des clients à chaque génération d’images.

Le potentiel de marché pour l’IA dans la robotique est immense, avec un taux de croissance annuel composé estimé à 38,5 %, passant de 12,77 milliards de dollars en 2023 à 124,77 milliards de dollars d’ici 2030, selon Grand View Research. DiffuseDrive vise à ce que chaque système autonome, qu’il s’agisse d’un projet d’entreprise ou individuel, utilise ses données. En se concentrant initialement sur les véhicules autonomes et les drones, l’entreprise prévoit d’étendre ses services à des secteurs comme la défense, l’entreposage, la construction et l’agriculture.

Les clients actuels de DiffuseDrive incluent des géants de l’industrie comme AISIN, Continental et Denso. Lors de la dernière édition de la CVPR, l’entreprise a rencontré 50 clients potentiels issus du Fortune 500, démontrant l’intérêt croissant pour des systèmes autonomes et des robots industriels. En mai, DiffuseDrive a levé 3,5 millions de dollars en financement d’amorçage, en plus de 1 million de dollars déjà reçus d’E2VC. L’ajout de Jordan Kretchmer au conseil d’administration renforce l’expertise de l’entreprise en investissement robotique.

Selon Pasztor, « les moteurs comme GPT ou Dali peuvent générer des modèles, mais vous avez besoin d’une couche d’assurance qualité comme DiffuseDrive ». Cette couche se base sur l’application ou le cas d’utilisation spécifique, permettant une compréhension approfondie des données déjà présentes et assurant ainsi la pertinence et la fiabilité des nouvelles données générées. La différenciation de DiffuseDrive ne réside plus seulement dans la génération de données synthétiques, mais dans la création d’un véritable moteur de données adapté aux besoins variés des différents secteurs.

diffusedrive s'engage à résoudre la pénurie de données essentielles pour l'entraînement des robots et de l'intelligence artificielle, en proposant des solutions innovantes et performantes pour optimiser le développement technologique.

« `html

Dans le monde en constante évolution de la robotique et de l’intelligence artificielle (IA), l’accès à des données de haute qualité est essentiel pour le développement et l’entraînement efficaces des systèmes. Cependant, la pénurie de données réalistes représente un obstacle majeur. C’est ici que DiffuseDrive intervient, offrant des solutions innovantes pour combler ce déficit et propulser les technologies robotiques vers de nouveaux sommets.

Comment diffuseDrive utilise l’IA générative pour créer des données photoréalistes

DiffuseDrive se distingue par sa capacité à générer des images photoréalistes à partir de ensembles de données réels. Contrairement aux méthodes traditionnelles basées sur des simulations provenant de moteurs de jeu, qui souvent présentent des écarts significatifs par rapport à la réalité, la plateforme de DiffuseDrive utilise des modèles de diffusion propriétaires pour créer des données synthétiques d’une authenticité remarquable.

Les robots et les systèmes d’IA nécessitent une quantité énorme de données pour leur entraînement. Les données réelles peuvent être coûteuses et chronophages à collecter, tandis que les données générées par simulation manquent parfois de réalisme, créant ainsi des lacunes entre la simulation et la réalité. DiffuseDrive aborde ce problème en analysant les données existantes, identifiant les manques et générant des données photoréalistes qui comblent ces vides.

Par exemple, dans le domaine de la conduite autonome, où chaque scénario de conduite doit être minutieusement simulé, DiffuseDrive permet de créer rapidement des environnements de conduite variés et réalistes, améliorant ainsi la performance des véhicules autonomes de manière significative.

Vous pourriez aimer aussi ces articles:

Quel est l’impact de diffuseDrive sur la simulation-to-réalité

L’un des principaux défis dans le développement des systèmes robotiques et d’IA est le fossé entre la simulation et la réalité. Les données générées par les simulations traditionnelles, souvent dérivées de moteurs de jeu, ne capturent pas fidèlement les complexités du monde réel, ce qui limite l’efficacité des modèles entraînés. DiffuseDrive comble ce fossé en fournissant des données synthétiques d’une qualité telle qu’elles sont pratiquement indistinguables des données réelles.

En permettant la génération rapide et réaliste de données, DiffuseDrive réduit considérablement le temps et les ressources nécessaires pour entraîner les systèmes d’IA. Cette capacité permet aux entreprises de développer et tester leurs technologies dans des environnements virtuels qui reflètent étroitement les conditions du monde réel, améliorant ainsi la fiabilité et la performance des solutions robotiques.

Par exemple, lors de la conférence IEEE/CVF sur la vision par ordinateur et la reconnaissance de formes (CVPR) de cette année, il a été constaté que les solutions existantes n’atteignaient que 50 % de précision en raison des limitations des données simulées. Grâce à DiffuseDrive, ces chiffres pourraient être significativement améliorés, ouvrant la voie à des innovations plus robustes et sécurisées.

Vous pourriez aimer aussi ces articles:

Quels sont les fondateurs et l’histoire de diffuseDrive

DiffuseDrive a été fondée en 2023 par Balint Pasztor, ingénieur, et Roland Pinter, physicien, après leur rencontre chez Bosch. Cette collaboration fructueuse les a conduits à déménager l’entreprise de Hongrie à San Francisco, un hub technologique mondial. Balint Pasztor et Roland Pinter ont apporté une expertise complémentaire qui a permis à DiffuseDrive de se positionner rapidement comme un acteur clé dans le domaine de la génération de données synthétiques.

Avant de fonder DiffuseDrive, Balint Pasztor et Roland Pinter travaillaient sur des projets de conduite autonome de niveau 4 pour Porsche. Leur expérience dans la collecte et l’analyse de données pour des systèmes critiques leur a permis de mieux comprendre les défis liés à la pénurie de données et à la nécessité de données réalistes pour l’entraînement des IA.

Leur vision était claire : combler le manque de données réalistes est la clé pour avancer dans divers domaines tels que la fabrication, la surveillance, l’agriculture et l’aérospatiale. Cette vision a propulsé DiffuseDrive à l’avant-garde de la technologie, leur permettant d’attirer des clients prestigieux comme AISIN, Continental et Denso, tout en explorant des opportunités dans des secteurs variés tels que la défense et la santé.

Quelles sont les applications commerciales des données générées par diffuseDrive

Les applications commerciales de DiffuseDrive sont vastes et variées, couvrant de nombreux secteurs où l’IA et la robotique jouent un rôle crucial. Les véhicules autonomes et la reconnaissance d’objets pour le e-commerce ne sont que deux exemples des domaines bénéficiant des données synthétiques de haute qualité fournies par DiffuseDrive.

Dans le secteur de l’automobile, les données générées permettent d’améliorer les systèmes de conduite autonome en créant des scénarios diversifiés et réalistes. Cela se traduit par une meilleure préparation des véhicules autonomes à affronter des situations réelles complexes, augmentant ainsi la sécurité et l’efficacité des transports.

De même, dans le domaine de la logistique, les robots de picking pour le e-commerce dépendent de données précises pour identifier et manipuler correctement les articles. Les données synthétiques de DiffuseDrive permettent d’entraîner ces robots de manière plus précise, réduisant ainsi les erreurs et augmentant la productivité.

Pour en savoir plus sur les innovations dans le domaine de la robotique appliquée à l’agriculture, consultez Comment les robots laitiers transforment le travail des vaches et des agriculteurs, ou découvrez comment les humanoïdes gagnent en autonomie grâce à de nouveaux modèles sur Le humanoïde Néo de 1X acquiert une autonomie grâce au nouveau modèle Dia Redwood.

Comment les clients contrôlent les données de domaine avec diffuseDrive

Mis à part la création de données synthétiques, DiffuseDrive offre à ses clients un contrôle total sur leurs données de domaine opérationnel (ODD). Contrairement à d’autres fournisseurs, DiffuseDrive ne cherche pas à remplacer l’expertise de ses clients, mais plutôt à la compléter en générant des données qui répondent précisément à leurs besoins spécifiques.

Les clients restent les experts de leur domaine et déterminent les exigences en matière de données. DiffuseDrive se charge de digérer la documentation existante et les données ODD réelles, utilisant des techniques telles que la segmentation sémantique, l’étiquetage contextuel et visuel, ainsi que des boîtes englobantes en 2D et 3D pour enrichir les ensembles de données.

Chaque image générée par DiffuseDrive remplit non seulement les lacunes identifiées, mais étend également la connaissance de l’ODD, permettant une amélioration continue des modèles d’IA. Pour un aperçu de solutions robotiques avancées dans d’autres secteurs, visitez Chef Robotics lève 43 millions de dollars pour déployer davantage de robots d’assemblage alimentaire ou explorez les options de location de robots sur Louer un robot en Eure-et-Loir : 28 La solution futuriste pour vos besoins.

Quelles sont les opportunités de marché et les perspectives d’avenir pour diffuseDrive

Le marché mondial de l’IA en robotique connaît une croissance exponentielle, avec un taux de croissance annuel composé de 38,5 % prévu pour passer de 12,77 milliards de dollars en 2023 à 124,77 milliards de dollars d’ici 2030, selon Grand View Research. DiffuseDrive est bien positionné pour tirer parti de cette expansion grâce à sa technologie innovante de génération de données synthétiques.

La vision de DiffuseDrive est ambitieuse : permettre à chaque système autonome, qu’il s’agisse d’un projet d’entreprise ou d’un projet individuel, d’utiliser les données générées par leur plateforme. Forts de leur expérience avec les véhicules et les drones autonomes, ils reconnaissent que de nombreuses entreprises n’ont pas l’envergure nécessaire pour collecter les quantités massives de données requises, contrairement à des géants comme Tesla.

Actuellement, DiffuseDrive en est à sa troisième vague d’intégration de clients, incluant des pilotes de drones, des développeurs de conduite autonome et des spécialistes de la surveillance de la sécurité. Parmi leurs clients figurent des leaders industriels tels qu’AISIN, Continental et Denso. De plus, DiffuseDrive identifie des opportunités prometteuses dans des secteurs variés comme la défense, l’entreposage, la construction et l’agriculture.

En mai, DiffuseDrive a levé 3,5 millions de dollars en financement initial, en plus du million de dollars précédemment reçu de E2VC. L’ajout de Jordan Kretchmer, un partenaire senior chez Outlander VC et co-fondateur de Rapid Robotics Inc., à son conseil d’administration renforce leur position stratégique. Selon Balint Pasztor, « Jordan a une expérience précieuse dans l’investissement en robotique, et notre stratégie est d’être agnostiques en termes d’industrie, couvrant des applications allant du contrôle qualité dans la fabrication aux robots de picking domestiques. »

Pour suivre les découvertes majeures en robotique et rester informé des dernières innovations, consultez Découvertes majeures en robotique du mois de juin 2025.

Comme le co-fondateur le souligne, « Tout comme les logiciels sont développés de manière itérative, les données devraient suivre le même principe. »