icône du site Web Expert en numérique

Figure AI présente « Helix », un système d'IA robotique pour robots humanoïdes, basé sur le modèle Vision-Langage-Action (VLA)

Figure 1 présente « Helix », le système d'IA robotique pour robots humanoïdes – un modèle Vision-Langage-Action (VLA)

Figure AI présente « Helix », un système d'intelligence artificielle robotique destiné aux robots humanoïdes – un modèle Vision-Langage-Action (VLA) – Image : Xpert.Digital

Helix : Le système d'IA qui propulse les robots humanoïdes vers de nouveaux sommets

Résumé : Vision, langage, mouvement : Helix, une étape importante en robotique

Helix est un système d'IA innovant pour robots humanoïdes, développé par Figure AI. Ce modèle Vision-Langage-Action (VLA) combine perception visuelle, compréhension de la parole et contrôle moteur précis au sein d'un même système. Helix représente une avancée majeure dans le développement de systèmes robotiques flexibles pour les environnements non structurés, tels que les habitations. Capable d'effectuer des tâches complexes sans apprentissage préalable, il pourrait révolutionner l'interaction homme-machine.

En lien avec ceci :

Les capacités d'Helix

  • Contrôle en temps réel de l'ensemble du haut du corps des robots humanoïdes, y compris 35 axes de mouvement
  • Traitement des données vocales et visuelles pour réaliser des tâches complexes
  • Reconnaissance et manipulation d'objets inconnus sans formation spécifique
  • Collaboration entre plusieurs robots dans l'exécution de tâches
  • Effectuer des tâches ménagères comme remplir un réfrigérateur

Détails techniques

Il se compose de deux éléments principaux :

  1. Un modèle de langage multimodal avec 7 milliards de paramètres (7-9 Hz)
  2. Une IA de mouvement avec 80 millions de paramètres (200 Hz)
  • Formation dispensée en seulement 500 heures sous supervision
  • Fonctionne sur des GPU embarqués à faible consommation d'énergie

Principaux concurrents

  1. Google DeepMind : Développement de modèles VLA similaires à RT-2
  2. Meta : Je travaille sur des robots humanoïdes avancés
  3. Apple : Également dans la course au développement d'humanoïdes dotés d'une IA avancée
  4. OpenAI : Ancien partenaire de Figure AI, désormais concurrent dans le domaine du développement de l'IA
Google DeepMind

Google DeepMind a dévoilé RT-2 (Robotics Transformer 2), un modèle vision-langage-action (VLA) révolutionnaire. RT-2 permet aux robots d'effectuer de nouvelles tâches sans formation spécifique en apprenant des concepts à partir de données textuelles et visuelles disponibles sur Internet et en les traduisant en actions robotiques. Lors des tests, RT-2 a démontré des performances nettement supérieures à celles de son prédécesseur, RT-1, pour des tâches inédites.

En lien avec ceci :

Méta

Meta investit massivement dans le développement de robots humanoïdes dotés d'intelligence artificielle. L'entreprise a créé une nouvelle équipe au sein de sa division Reality Labs, dédiée à la recherche et au développement de robots destinés aux consommateurs. Meta prévoit de développer des systèmes d'IA, des capteurs et des plateformes logicielles utilisables également par d'autres fabricants.

Pomme

Apple explore également des conceptions de robots humanoïdes et non humanoïdes. Cependant, l'entreprise n'en est qu'à ses débuts. L'analyste Ming-Chi Kuo prévoit qu'une production de masse ne sera pas possible avant 2028 au plus tôt. Apple se concentre particulièrement sur l'interaction homme-robot.

En lien avec ceci :

OpenAI

OpenAI, ancien partenaire de Figure AI, développe sa propre division de robotique et se concentre sur les robots comme incarnation de l'intelligence artificielle dans le monde réel. L'entreprise est désormais en concurrence directe avec Google DeepMind et d'autres acteurs du développement de l'IA pour la robotique.

 

🎯🎯🎯 Bénéficiez de l'expertise étendue et quintuple de Xpert.Digital dans une offre de services complète : développement commercial, recherche et développement, expérience client (XR), relations publiques et optimisation de la visibilité numérique

Bénéficiez de l'expertise approfondie et diversifiée d'Xpert.Digital, articulée autour de cinq axes, grâce à une offre de services complète : R&D, XR, RP et optimisation de la visibilité numérique. – Image : Xpert.Digital

Xpert.Digital possède une connaissance approfondie de divers secteurs d'activité. Cela nous permet d'élaborer des stratégies sur mesure, parfaitement adaptées aux exigences et aux défis de votre segment de marché spécifique. En analysant en permanence les tendances du marché et en suivant l'évolution du secteur, nous agissons de manière proactive et proposons des solutions innovantes. L'alliance de notre expérience et de notre expertise génère une valeur ajoutée et confère à nos clients un avantage concurrentiel décisif.

Plus d'informations ici :

 

Helix : Différenciation par rapport aux autres systèmes d’IA pour robots

Modèle VLA innovant : Helix combine perception, langage et mouvement

Le récent lancement d'Helix par Figure AI marque une avancée majeure dans le domaine de l'IA robotique. Ce modèle Vision-Langage-Action (VLA) innovant se distingue des systèmes existants par plusieurs fonctionnalités révolutionnaires, établissant de nouvelles normes pour le contrôle des robots humanoïdes. Helix intègre la perception visuelle, la compréhension de la parole et un contrôle précis des mouvements au sein d'un système unique, conçu spécifiquement pour relever les défis de la robotique physique.

Architecture unique à double système

La différence la plus significative entre Helix et les autres systèmes d'IA pour robots réside peut-être dans son architecture innovante à deux composants. Cette structure à double système résout un problème fondamental de l'IA en robotique.

Système 1 et Système 2 : une intelligence complémentaire

Contrairement aux approches classiques, Helix utilise deux systèmes complémentaires qui, ensemble, offrent un équilibre unique entre universalité et rapidité. Le système 2 (S2) est un modèle de langage multimodal doté de 7 milliards de paramètres, fonctionnant à une fréquence de 7 à 9 Hz, et qui fait office de « cerveau » analytique du robot. Il traite les données visuelles et les commandes vocales, interprète l'environnement et détermine les actions à entreprendre.

Le système est complété par le Système 1 (S1), une unité de contrôle visuomotrice rapide et réactive dotée de 80 millions de paramètres. Ce composant traduit les informations sémantiques fournies par S2 en actions robotiques précises et continues à une fréquence impressionnante de 200 Hz. Figure AI explique que les approches précédentes ont échoué par manque d'universalité ou de vitesse : « L'utilisation d'un VLM (Visual Large Language Model) est universelle mais lente, et l'utilisation de stratégies de mouvement visuel pour les robots est rapide mais non universelle. » Helix surmonte cette dichotomie grâce à sa structure duale.

Cette architecture diffère fondamentalement d'autres modèles VLA bien connus tels que le RT-2 de Google DeepMind, qui combine également données visuelles et commandes vocales, mais ne présente pas une division comparable en deux parties.

En lien avec ceci :

capacités de contrôle complètes

Contrôle de plus de 35 degrés de liberté

Une autre caractéristique distinctive d'Helix est sa capacité à coordonner simultanément 35 degrés de liberté. Ce contrôle complet permet une manipulation précise et rapide de l'ensemble du haut du corps humanoïde, y compris les poignets, le torse, la tête et chaque doigt. Cette capacité de contrôle surpasse la plupart des systèmes existants et permet d'effectuer des tâches de manipulation complexes exigeant une grande dextérité manuelle.

Généralisation et apprentissage d'objets

Reconnaissance universelle d'objets sans formation spécifique

L'une des principales caractéristiques d'Helix est sa capacité à reconnaître et à manipuler pratiquement n'importe quel petit objet domestique sans apprentissage préalable de ses spécificités. Cette grande polyvalence permet au système de gérer des milliers d'objets de formes, de tailles, de couleurs et de matériaux variés.

Contrairement à de nombreux autres systèmes robotiques dotés d'IA qui nécessitent une reprogrammation ou un réentraînement pour chaque nouvelle tâche ou type d'objet, Helix s'adapte à différentes situations et répond aux commandes en langage naturel. Il s'agit d'un changement de paradigme, car le système utilise un seul réseau neuronal pour apprendre tous les comportements — comme ramasser et déposer des objets, utiliser des tiroirs et des réfrigérateurs, et interagir avec d'autres robots — sans réglage fin spécifique à chaque tâche.

Coordination multi-robots

compétences de collaboration uniques

Helix est le premier modèle VLA capable de contrôler simultanément deux robots et de leur permettre de collaborer. Cette capacité leur permet de résoudre conjointement des tâches complexes impliquant le passage d'objets et la coordination de leurs mouvements. La communication quasi humaine entre les robots, grâce aux hochements de tête et aux contacts visuels, est particulièrement remarquable.

Ce type de coordination représente une avancée significative par rapport aux systèmes conventionnels, où chaque robot est généralement contrôlé individuellement ou nécessite une formation spécifique pour des rôles particuliers. Avec Helix, les deux robots utilisent les mêmes poids de modèle sans qu'il soit nécessaire de procéder à des réglages individuels.

Efficacité et mise en œuvre de la formation

Formation minimale requise, performances maximales

Une autre différence majeure réside dans l'efficacité remarquable du processus d'entraînement. Helix a été développé à partir de seulement 500 heures de données d'entraînement de haute qualité, issues de la téléopération, soit beaucoup moins que les approches comparables qui nécessitent souvent des milliers d'heures de démonstrations spécifiques. Cette efficacité souligne non seulement la sophistication technique du système, mais aussi sa viabilité économique pour les applications commerciales.

Traitement embarqué

Contrairement à de nombreux systèmes d'IA robotiques qui dépendent de serveurs externes puissants, Helix fonctionne entièrement sur des GPU embarqués et économes en énergie au sein même des robots. Ce traitement embarqué élimine le besoin d'une connexion permanente à des ressources informatiques externes, ce qui rend le robot plus autonome et adaptable à différents environnements.

Différenciation stratégique

Intégration verticale plutôt que modèles d'IA génériques

Figure AI s'est stratégiquement démarquée de ses concurrents en mettant fin à sa collaboration avec OpenAI et en adoptant une stratégie d'intégration verticale, développant en interne à la fois le matériel et les logiciels. Son PDG, Brett Adcock, a expliqué que les modèles d'IA génériques sont insuffisants pour répondre aux exigences de l'IA embarquée, c'est-à-dire l'IA intégrée aux robots physiques. Cette décision souligne la volonté de l'entreprise de développer des solutions sur mesure pour relever les défis spécifiques de la robotique, plutôt que de s'appuyer sur des modèles d'IA généraux.

Orientation de l'application

Concentrez-vous sur l'usage domestique

Alors que de nombreux acteurs du secteur se concentrent actuellement sur les applications robotiques industrielles ou de bureau, Figure AI adopte une approche stratégique surprenante avec Helix, axée sur la robotique domestique. La capacité de ces robots à effectuer des tâches quotidiennes telles que trier les courses, remplir le réfrigérateur ou manipuler une grande variété d'objets ménagers cible un marché que les autres acteurs jugent souvent trop complexe à pénétrer.

Coordination multi-robots : la clé de la robotique de nouvelle génération

Helix se distingue des autres systèmes robotiques d'IA par son architecture à double système, ses capacités de contrôle complètes, son impressionnante capacité de généralisation et sa coordination multi-robots. Grâce à son processus d'apprentissage efficace, son traitement embarqué et son orientation stratégique vers les applications domestiques, il représente une avancée significative dans le développement des robots humanoïdes. Alors que d'autres systèmes, tels que RT-2 de Google DeepMind, adoptent des approches similaires combinant données visuelles et commandes vocales, Helix offre des avantages distinctifs grâce à son architecture unique et son approche de développement intégrée, ce qui en fait un pionnier de la prochaine génération de robots dotés d'IA.

 

Nous sommes là pour vous - Conseil - Planification - Mise en œuvre - Gestion de projet

☑️ Accompagnement des PME en matière de stratégie, de conseil, de planification et de mise en œuvre

☑️ Création ou réalignement de la stratégie numérique et de la numérisation

☑️ Expansion et optimisation des processus de vente internationaux

☑️ Plateformes de commerce B2B mondiales et numériques

☑️ Développement commercial pionnier

 

Konrad Wolfenstein

Je serais heureux de vous servir de conseiller personnel.

Vous pouvez me contacter en remplissant le formulaire de contact ci-dessous ou simplement m'appeler au +49 7348 4088 965 .

J'attends avec impatience notre projet commun.

 

 

Écris-moi

 
Xpert.Digital - Konrad Wolfenstein

Xpert.Digital est un pôle industriel spécialisé dans la numérisation, le génie mécanique, la logistique/intralogistique et le photovoltaïque.

Grâce à notre solution de développement commercial à 360°, nous accompagnons des entreprises de renom, de la prospection à l'après-vente.

L'intelligence de marché, le marketing digital, l'automatisation du marketing, le développement de contenu, les relations publiques, les campagnes de publipostage, les médias sociaux personnalisés et la fidélisation des prospects font partie de nos outils numériques.

Vous trouverez plus d'informations sur : www.xpert.digital - www.xpert.solar - www.xpert.plus

Rester en contact

 

Quitter la version mobile