Figure AI's AI-systeem voor robotica "Helix" voor humanoïde robots – een Vision-Language-Action (VLA)-model

Konrad Wolfenstein

1 jaar geleden

Figure AI's robotica-AI-systeem "Helix" voor humanoïde robots – een Vision-Language-Action (VLA)-model – Afbeelding: Xpert.Digital

Helix: Het AI-systeem dat humanoïde robots naar een nieuw niveau tilt

Samenvatting: Visie, taal, beweging: Helix als mijlpaal in de robotica

Helix is een innovatief AI-systeem voor humanoïde robots, ontwikkeld door Figure AI. Het is een Vision-Language-Action (VLA)-model dat visuele waarneming, spraakbegrip en nauwkeurige motorische besturing combineert in één systeem. Helix is een belangrijke stap voorwaarts in de ontwikkeling van flexibele robotsystemen voor ongestructureerde omgevingen zoals huizen. Dankzij de mogelijkheid om complexe taken uit te voeren zonder voorafgaande training, zou het de interactie tussen mens en machine kunnen revolutioneren.

Dit is hiermee gerelateerd:

Spraakgestuurde robots: Helix van Figure AI verandert alles! Industrie, huishouden, toekomst – begrijpen, leren, uitvoeren in realtime

Helix' vaardigheden

Realtime besturing van het gehele bovenlichaam van humanoïde robots, inclusief 35 bewegingsassen
Het verwerken van spraakinput en visuele informatie om complexe taken uit te voeren
Het herkennen en hanteren van onbekende objecten zonder specifieke training
Samenwerking tussen meerdere robots bij de uitvoering van taken
Huishoudelijke taken uitvoeren, zoals het vullen van de koelkast

Technische details

Bestaat uit twee hoofdbestanddelen:

Een multimodaal taalmodel met 7 miljard parameters (7-9 Hz)
Een bewegings-AI met 80 miljoen parameters (200 Hz)

Opgeleid met slechts 500 uur begeleide training
Draait op energiezuinige ingebouwde GPU's

Grootste concurrenten

Google DeepMind: Ontwikkelt vergelijkbare VLA-modellen als RT-2
Meta: Werken aan geavanceerde humanoïde robots
Apple: Ook Apple doet mee aan de race om geavanceerde AI-humanoiden te ontwikkelen
OpenAI: Voormalige partner van Figure AI, nu een concurrent op het gebied van AI-ontwikkeling

Google DeepMind

Google DeepMind heeft RT-2 (Robotics Transformer 2) onthuld, een baanbrekend vision-language-action (VLA)-model. RT-2 stelt robots in staat om nieuwe taken uit te voeren zonder specifieke training door concepten te leren uit tekst- en beeldgegevens op internet en deze te vertalen naar robotacties. In tests liet RT-2 aanzienlijk betere prestaties zien bij nieuwe taken in vergelijking met zijn voorganger, RT-1.

Dit is hiermee gerelateerd:

Google Project Mariner: Experimentele AI-agent als browserextensie – Autonome webnavigatie met DeepMind-technologie

Appel

Apple onderzoekt zowel humanoïde als niet-humanoïde robotontwerpen. Het bedrijf bevindt zich echter nog in een vroeg ontwikkelingsstadium. Analist Ming-Chi Kuo voorspelt dat massaproductie op zijn vroegst in 2028 mogelijk zal zijn. Apple richt zich met name op de interactie tussen mens en robot.

Dit is hiermee gerelateerd:

Is Apple in de ban van robots? Vacatures onthullen Apple's robotoffensief: valt de techgigant nu ook de markt voor huishoudelijke apparaten aan?

OpenAI

OpenAI, een voormalige partner van Figure AI, bouwt een eigen robotica-afdeling op en richt zich op robots als de belichaming van kunstmatige intelligentie in de echte wereld. Het bedrijf concurreert nu rechtstreeks met Google DeepMind en andere spelers op het gebied van AI-ontwikkeling voor robotica.

🎯🎯🎯 Profiteer van de uitgebreide, vijfvoudige expertise van Xpert.Digital in één compleet servicepakket | Business Development, R&D, XR, PR & Optimalisatie van digitale zichtbaarheid

Profiteer van de uitgebreide, vijfvoudige expertise van Xpert.Digital in een compleet servicepakket | R&D, XR, PR & Optimalisatie van digitale zichtbaarheid - Afbeelding: Xpert.Digital

Xpert.Digital beschikt over diepgaande kennis van diverse sectoren. Hierdoor kunnen we strategieën op maat ontwikkelen die precies aansluiten op de behoeften en uitdagingen van uw specifieke marktsegment. Door continu markttrends te analyseren en ontwikkelingen in de sector te volgen, kunnen we proactief handelen en innovatieve oplossingen bieden. De combinatie van ervaring en expertise genereert toegevoegde waarde en geeft onze klanten een doorslaggevend concurrentievoordeel.

Meer informatie vindt u hier:

Profiteer van de 5 expertisegebieden van Xpert.Digital in één pakket – al vanaf €500 per maand

Helix: Onderscheidend vermogen ten opzichte van andere AI-systemen voor robots

Innovatief VLA-model: Helix combineert waarneming, taal en beweging

De recente lancering van Helix door Figure AI markeert een belangrijke vooruitgang in de AI-wereld van robotica. Dit innovatieve Vision-Language-Action (VLA)-model onderscheidt zich van bestaande systemen door een aantal baanbrekende functies, waarmee nieuwe standaarden worden gezet voor de besturing van humanoïde robots. Helix integreert visuele waarneming, spraakherkenning en nauwkeurige bewegingsbesturing in één systeem dat specifiek is ontworpen om de uitdagingen van fysieke robotica aan te pakken.

Unieke dual-systeemarchitectuur

Het meest significante verschil tussen Helix en andere AI-systemen voor robots schuilt wellicht in de innovatieve architectuur met twee componenten. Deze structuur met twee systemen lost een fundamenteel probleem in de AI voor robots op.

Systeem 1 en Systeem 2: een complementaire intelligentie

In tegenstelling tot conventionele benaderingen gebruikt Helix twee complementaire systemen die samen een unieke balans tussen universaliteit en snelheid bereiken. Systeem 2 (S2) is een multimodaal taalmodel met 7 miljard parameters, werkend op een frequentie van 7-9 Hz, en functioneert als het analytische "brein" van de robot. Het verwerkt visuele gegevens en spraakopdrachten, interpreteert de omgeving en besluit welke acties moeten worden uitgevoerd.

Als aanvulling hierop is er Systeem 1 (S1), een snelle, reactieve visuomotorische besturingseenheid met 80 miljoen parameters. Deze component vertaalt de semantische informatie van S2 naar precieze, continue robotacties met een indrukwekkende frequentie van 200 Hz. Figure AI legt uit dat eerdere benaderingen faalden vanwege een gebrek aan universaliteit of snelheid: "Het gebruik van VLM (Visual Large Language Model) is universeel maar niet snel, en het gebruik van visuele bewegingsstrategieën voor robots is snel maar niet universeel." Helix overbrugt deze tegenstelling door zijn dubbele structuur.

Deze architectuur verschilt fundamenteel van andere bekende VLA-modellen, zoals Google DeepMind's RT-2, dat ook visuele data en spraakopdrachten combineert, maar geen vergelijkbare verdeling in twee delen kent.

Dit is hiermee gerelateerd:

Google's Gemini-platform met Google AI Studio, Google Deep Research met Gemini Advanced en Google DeepMind

Uitgebreide besturingsmogelijkheden

Controle over 35 vrijheidsgraden

Een ander onderscheidend kenmerk van Helix is het vermogen om 35 vrijheidsgraden tegelijk te coördineren. Deze uitgebreide besturing maakt nauwkeurige, snelle manipulatie van het gehele bovenlichaam van de humanoïde mogelijk, inclusief polsen, romp, hoofd en individuele vingers. Deze besturingsmogelijkheid overtreft de meeste bestaande systemen en maakt complexe manipulatietaken mogelijk die een hoge mate van fijne motoriek vereisen.

Objectgeneralisatie en leren

Universele objectherkenning zonder specifieke training

Een belangrijk kenmerk van Helix is het vermogen om vrijwel elk klein huishoudelijk voorwerp te herkennen en te verwerken zonder voorafgaande training over de specifieke eigenschappen ervan. Deze brede generaliseerbaarheid stelt het systeem in staat om duizenden voorwerpen met uiteenlopende vormen, maten, kleuren en materiaaleigenschappen te verwerken.

In tegenstelling tot veel andere AI-robotsystemen die voor elke nieuwe taak of elk nieuw objecttype opnieuw geprogrammeerd of getraind moeten worden, kan Helix zich aanpassen aan verschillende situaties en reageren op commando's in natuurlijke taal. Dit is een paradigmaverschuiving, omdat het systeem één enkel neuraal netwerk gebruikt om alle gedragingen te leren – zoals het oppakken en neerzetten van objecten, het gebruiken van lades en koelkasten en de interactie met andere robots – zonder taakspecifieke fijnafstemming.

Coördinatie van meerdere robots

Unieke samenwerkingsvaardigheden

Helix is het eerste VLA-model dat twee robots tegelijk kan besturen en ze kan laten samenwerken. Dankzij deze mogelijkheid kunnen de robots gezamenlijk complexe taken uitvoeren, zoals het doorgeven van objecten en het coördineren van hun bewegingen. Bijzonder opmerkelijk is de bijna menselijke communicatie tussen de robots door middel van knikken met het hoofd en oogcontact.

Deze vorm van coördinatie is een aanzienlijke verbetering ten opzichte van conventionele systemen, waarbij elke robot doorgaans individueel wordt bestuurd of specifieke training vereist voor bepaalde taken. Met Helix gebruiken beide robots dezelfde modelgewichten zonder dat individuele aanpassingen nodig zijn.

Trainingsefficiëntie en implementatie

Minimale trainingseisen, maximale prestaties

Een ander belangrijk verschil zit hem in de opmerkelijke efficiëntie van het trainingsproces. Helix is ontwikkeld met slechts 500 uur aan hoogwaardige, op afstand aangestuurde trainingsdata, aanzienlijk minder dan vergelijkbare methoden die vaak duizenden uren aan specifieke demonstraties vereisen. Deze efficiëntie onderstreept niet alleen de technische geavanceerdheid van het systeem, maar ook de economische haalbaarheid ervan voor commerciële toepassingen.

ingebedde verwerking

In tegenstelling tot veel AI-systemen voor robotica die afhankelijk zijn van krachtige externe servers, draait Helix volledig op ingebouwde, energiezuinige GPU's in de robots. Deze interne verwerking elimineert de noodzaak van een constante verbinding met externe computerbronnen, waardoor de robot autonomer en flexibeler is in verschillende omgevingen.

Strategische differentiatie

Verticale integratie in plaats van generieke AI-modellen

Figure AI heeft zich strategisch onderscheiden van andere bedrijven door de samenwerking met OpenAI te beëindigen en een verticaal geïntegreerde strategie na te streven, waarbij zowel hardware als software intern worden ontwikkeld. CEO Brett Adcock legde uit dat generieke AI-modellen niet volstaan om te voldoen aan de eisen van belichaamde AI, oftewel AI in fysieke robots. Deze beslissing onderstreept de aanpak van het bedrijf om oplossingen op maat te ontwikkelen voor de specifieke uitdagingen van robotica, in plaats van te vertrouwen op algemene AI-modellen.

Toepassingsoriëntatie

Focus op huishoudelijk gebruik

Terwijl veel spelers in de industrie zich momenteel richten op industriële of werkplekrobots, kiest Figure AI met Helix voor een strategisch verrassende aanpak door zich te concentreren op huishoudrobots. De robots kunnen alledaagse taken uitvoeren, zoals boodschappen sorteren, de koelkast vullen of een breed scala aan huishoudelijke artikelen hanteren. Ze richten zich op een markt die andere spelers vaak te complex vinden om te betreden.

Coördinatie van meerdere robots: de sleutel tot de volgende generatie robotica

Helix onderscheidt zich van andere AI-robotsystemen door zijn dual-system architectuur, uitgebreide besturingsmogelijkheden, opmerkelijke generalisatievermogen en multi-robotcoördinatie. Met zijn efficiënte trainingsproces, ingebouwde verwerking en strategische focus op huishoudelijke toepassingen, vertegenwoordigt het een belangrijke vooruitgang in de ontwikkeling van humanoïde robots. Terwijl andere systemen, zoals Google DeepMind's RT-2, vergelijkbare benaderingen volgen door visuele data en spraakopdrachten te combineren, biedt Helix onderscheidende voordelen door zijn unieke architectuur en geïntegreerde ontwikkelingsaanpak, waardoor het een pionier is in de volgende generatie AI-gestuurde robots.

Wij staan voor u klaar - Advies - Planning - Implementatie - Projectmanagement

☑️ Ondersteuning van het MKB op het gebied van strategie, advies, planning en implementatie

☑️ Opstellen of herzien van de digitale strategie en digitalisering

☑️ Uitbreiding en optimalisatie van internationale verkoopprocessen

☑️ Wereldwijde en digitale B2B-handelsplatformen

☑️ Pionier in bedrijfsontwikkeling

Konrad Wolfenstein

Ik sta graag tot uw beschikking als uw persoonlijke adviseur.

U kunt contact met mij opnemen door onderstaand contactformulier in te vullen of mij te bellen op +49 7348 4088 965 .

Ik kijk uit naar ons gezamenlijke project.

Schrijf me

➡️ Verzoek om videogesprek 👩👱

Xpert.Digital - Konrad Wolfenstein

Xpert.Digital is een platform voor de industrie, gericht op digitalisering, werktuigbouwkunde, logistiek/intralogistiek en fotovoltaïsche energie.

Met onze 360°-oplossing voor bedrijfsontwikkeling ondersteunen we gerenommeerde bedrijven van acquisitie tot aftersales.

Marktinformatie, social media marketing, marketingautomatisering, contentontwikkeling, PR, mailcampagnes, gepersonaliseerde social media en lead nurturing behoren tot onze digitale tools.

Meer informatie vindt u op: www.xpert.digital - www.xpert.solar - www.xpert.plus

Blijf in contact

Helix: Het AI-systeem dat humanoïde robots naar een nieuw niveau tilt

Samenvatting: Visie, taal, beweging: Helix als mijlpaal in de robotica

Helix' vaardigheden

Technische details

Grootste concurrenten

Google DeepMind

Meta

Appel

OpenAI

🎯🎯🎯 Profiteer van de uitgebreide, vijfvoudige expertise van Xpert.Digital in één compleet servicepakket | Business Development, R&D, XR, PR & Optimalisatie van digitale zichtbaarheid

Helix: Onderscheidend vermogen ten opzichte van andere AI-systemen voor robots

Innovatief VLA-model: Helix combineert waarneming, taal en beweging

Unieke dual-systeemarchitectuur

Systeem 1 en Systeem 2: een complementaire intelligentie

Uitgebreide besturingsmogelijkheden

Controle over 35 vrijheidsgraden

Objectgeneralisatie en leren

Universele objectherkenning zonder specifieke training

Coördinatie van meerdere robots

Unieke samenwerkingsvaardigheden

Trainingsefficiëntie en implementatie

Minimale trainingseisen, maximale prestaties

ingebedde verwerking

Strategische differentiatie

Verticale integratie in plaats van generieke AI-modellen

Toepassingsoriëntatie

Focus op huishoudelijk gebruik

Coördinatie van meerdere robots: de sleutel tot de volgende generatie robotica

☑️ Ondersteuning van het MKB op het gebied van strategie, advies, planning en implementatie

☑️ Opstellen of herzien van de digitale strategie en digitalisering

☑️ Uitbreiding en optimalisatie van internationale verkoopprocessen

☑️ Wereldwijde en digitale B2B-handelsplatformen

☑️ Pionier in bedrijfsontwikkeling

Andere onderwerpen