Figur AI's robotteknologiske AI-system "Helix" til humanoide robotter – en Vision-Language-Action (VLA) model
Xpert-forhåndsudgivelse
Valg af sprog 📢
Udgivet den: 28. februar 2025 / Opdateret den: 28. februar 2025 – Forfatter: Konrad Wolfenstein

Figur AI's robotteknologiske AI-system "Helix" til humanoide robotter – en Vision-Language-Action (VLA) model – Billede: Xpert.Digital
Helix: AI-systemet, der tager menneskelignende robotter til et nyt niveau
Resumé: Syn, sprog, bevægelse: Helix som en milepæl inden for robotteknologi
Helix er et innovativt AI-system til humanoide robotter udviklet af Figure AI. Det er en Vision-Language-Action (VLA) model, der kombinerer visuel opfattelse, taleforståelse og præcis motorisk kontrol i et enkelt system. Helix markerer et betydeligt fremskridt i udviklingen af fleksible robotsystemer til ustrukturerede miljøer såsom hjem. Med sin evne til at udføre komplekse opgaver uden forudgående træning kan det revolutionere menneske-maskine-interaktionen.
Relateret til dette:
- Stemmestyrede robotter: Helix fra Figure AI ændrer alt! Industri, husholdning, fremtid – forstå, lær, udfør i realtid

Helix' evner
- Kontrol i realtid af hele overkroppen på humanoide robotter, inklusive 35 bevægelsesakser
- Behandling af taleinput og visuel information til udførelse af komplekse opgaver
- Genkendelse og håndtering af ukendte objekter uden specifik træning
- Samarbejde mellem flere robotter i udførelsen af opgaver
- Udførelse af huslige opgaver såsom at fylde et køleskab
Tekniske detaljer
Består af to hovedkomponenter:
- En multimodal sprogmodel med 7 milliarder parametre (7-9 Hz)
- En bevægelses-AI med 80 millioner parametre (200 Hz)
- Uddannet med kun 500 timers superviseret træning
- Kører på energieffektive indlejrede GPU'er
Største konkurrenter
- Google DeepMind: Udvikling af VLA-modeller svarende til RT-2
- Meta: Arbejder på avancerede menneskelignende robotter
- Apple: Også med i kapløbet om at udvikle avancerede AI-humanoider
- OpenAI: Tidligere partner af Figure AI, nu en konkurrent inden for AI-udvikling
Google DeepMind
Google DeepMind har afsløret RT-2 (Robotics Transformer 2), en banebrydende vision-language-action (VLA) model. RT-2 gør det muligt for robotter at udføre nye opgaver uden specifik træning ved at lære koncepter fra tekst- og billeddata på internettet og oversætte dem til robothandlinger. I tests viste RT-2 en betydeligt forbedret ydeevne på nye opgaver sammenlignet med sin forgænger, RT-1.
Relateret til dette:
- Google Project Mariner: Eksperimentel AI-agent som browserudvidelse – Autonom webnavigation med DeepMind-teknologi
Meta
Meta investerer kraftigt i udviklingen af AI-drevne humanoide robotter. Virksomheden har etableret et nyt team inden for sin Reality Labs-division, der fokuserer på forskning og udvikling af robotter til forbrugere. Meta planlægger at udvikle AI-systemer, sensorer og softwareplatforme, der også kan bruges af andre producenter.
Æble
Apple udforsker også både humanoide og ikke-humanoide robotdesigns. Virksomheden er dog stadig i en tidlig udviklingsfase. Analytiker Ming-Chi Kuo forudsiger, at masseproduktion tidligst er mulig i 2028. Apple fokuserer især på interaktion mellem menneske og robot.
Relateret til dette:
- Er Apple grebet af robotfeber? Jobopslag afslører Apples robotoffensiv: Angriber tech-giganten nu markedet for husholdningsapparater?
OpenAI
OpenAI, en tidligere partner i Figure AI, er ved at opbygge sin egen robotafdeling og fokuserer på robotter som selve legemliggørelsen af kunstig intelligens i den virkelige verden. Virksomheden konkurrerer nu direkte med Google DeepMind og andre inden for AI-udvikling til robotteknologi.
🎯🎯🎯 Drag fordel af Xpert.Digital's omfattende, femdobbelte ekspertise i én omfattende servicepakke | BD, R&D, XR, PR & optimering af digital synlighed

Drag fordel af Xpert.Digital's omfattende, femdobbelte ekspertise i en omfattende servicepakke | R&D, XR, PR & optimering af digital synlighed - Billede: Xpert.Digital
Xpert.Digital besidder dybdegående viden på tværs af forskellige brancher. Dette giver os mulighed for at udvikle skræddersyede strategier, der er præcist afstemt med kravene og udfordringerne i dit specifikke markedssegment. Ved løbende at analysere markedstendenser og overvåge brancheudviklingen kan vi handle proaktivt og tilbyde innovative løsninger. Kombinationen af erfaring og ekspertise skaber merværdi og giver vores kunder en afgørende konkurrencefordel.
Mere information her:
Helix: Differentiering sammenlignet med andre AI-systemer til robotter
Innovativ VLA-model: Helix kombinerer perception, sprog og bevægelse
Figure AI's nylige lancering af Helix markerer et betydeligt fremskridt inden for robotteknologi, AI. Denne innovative Vision-Language-Action (VLA)-model adskiller sig fra eksisterende systemer gennem flere banebrydende funktioner og sætter nye standarder for styring af humanoide robotter. Helix integrerer visuel opfattelse, taleforståelse og præcis bevægelseskontrol i et enkelt system, der er specielt designet til at imødegå udfordringerne ved fysisk robotteknologi.
Unik dobbeltsystemarkitektur
Den måske mest betydningsfulde forskel mellem Helix og andre AI-systemer til robotter ligger i dens innovative tokomponentarkitektur. Denne dobbelte systemstruktur løser et fundamentalt problem inden for robotteknologisk AI.
System 1 og System 2: En komplementær intelligens
I modsætning til konventionelle tilgange bruger Helix to komplementære systemer, der tilsammen opnår en unik balance mellem universalitet og hastighed. System 2 (S2) er en multimodal sprogmodel med 7 milliarder parametre, der opererer med en frekvens på 7-9 Hz, og fungerer som robottens analytiske "hjerne". Den behandler visuelle data og talekommandoer, fortolker omgivelserne og beslutter, hvilke handlinger der skal udføres.
Dette suppleres af System 1 (S1), en hurtig, reaktiv visuomotorisk styreenhed med 80 millioner parametre. Denne komponent oversætter den semantiske information leveret af S2 til præcise, kontinuerlige robothandlinger med en imponerende frekvens på 200 Hz. Figur AI forklarer, at tidligere tilgange mislykkedes på grund af enten manglende universalitet eller hastighed: "Brug af VLM (Visual Large Language Model) er universel, men ikke hurtig, og brug af visuelle bevægelsesstrategier til robotter er hurtig, men ikke universel." Helix overvinder denne dikotomi gennem sin dobbelte struktur.
Denne arkitektur adskiller sig fundamentalt fra andre kendte VLA-modeller som Google DeepMinds RT-2, der også kombinerer visuelle data og stemmekommandoer, men ikke har en sammenlignelig opdeling i to dele.
Relateret til dette:
- Googles Gemini-platform med Google AI Studio, Google Deep Research med Gemini Advanced og Google DeepMind
Omfattende kontrolfunktioner
Kontrol over 35 frihedsgrader
Et andet kendetegn ved Helix er dens evne til at koordinere 35 frihedsgrader samtidigt. Denne omfattende kontrol muliggør præcis og hurtig manipulation af hele den humanoide overkrop, inklusive håndled, torso, hoved og individuelle fingre. Denne kontrolfunktion overgår de fleste eksisterende systemer og muliggør komplekse manipulationsopgaver, der kræver en høj grad af finmotorik.
Objektgeneralisering og læring
Universel objektgenkendelse uden specifik træning
En central funktion ved Helix er dens evne til at genkende og håndtere stort set alle små husholdningsgenstande uden forudgående træning i dens specifikke egenskaber. Denne brede generaliserbarhed gør det muligt for systemet at håndtere tusindvis af genstande med varierende former, størrelser, farver og materialeegenskaber.
I modsætning til mange andre AI-robotsystemer, der skal omprogrammeres eller omtrænes til hver ny opgave eller objekttype, kan Helix tilpasse sig forskellige situationer og reagere på kommandoer i naturligt sprog. Dette repræsenterer et paradigmeskift, da systemet bruger et enkelt neuralt netværk til at lære al adfærd – såsom at samle genstande op og ned, bruge skuffer og køleskabe og interagere med andre robotter – uden opgavespecifik finjustering.
Koordinering med flere robotter
Unikke samarbejdsevner
Helix er den første VLA-model, der er i stand til at styre to robotter samtidigt og give dem mulighed for at samarbejde. Denne funktion gør det muligt for robotterne at løse komplekse opgaver i fællesskab, der involverer at passere objekter og koordinere deres bevægelser. Særligt bemærkelsesværdig er den næsten menneskelignende kommunikation mellem robotterne gennem hovednik og øjenkontakt.
Denne form for koordinering repræsenterer en betydelig forbedring i forhold til konventionelle systemer, hvor hver robot typisk styres individuelt eller kræver specifik træning til bestemte roller. Med Helix bruger begge robotter de samme modelvægte uden behov for individuelle justeringer.
Træningseffektivitet og implementering
Minimale træningskrav, maksimal ydeevne
En anden vigtig forskel ligger i den bemærkelsesværdige effektivitet af træningsprocessen. Helix blev udviklet ved hjælp af kun 500 timers fjernbetjent træningsdata af høj kvalitet, hvilket er betydeligt mindre end sammenlignelige metoder, der ofte kræver tusindvis af timers specifikke demonstrationer. Denne effektivitet understreger ikke kun systemets tekniske sofistikering, men også dets økonomiske levedygtighed til kommercielle anvendelser.
Indlejret processorkraft
I modsætning til mange robot-AI-systemer, der er afhængige af kraftfulde eksterne servere, kører Helix udelukkende på indlejrede, energieffektive GPU'er i robotterne. Denne indbyggede processering eliminerer behovet for en konstant forbindelse til eksterne computerressourcer, hvilket gør robotten mere autonom og fleksibel i forskellige miljøer.
Strategisk differentiering
Vertikal integration i stedet for generiske AI-modeller
Figure AI har strategisk differentieret sig fra andre virksomheder ved at afslutte sit samarbejde med OpenAI og forfølge en vertikalt integreret strategi, hvor både hardware og software udvikles internt. CEO Brett Adcock forklarede, at generiske AI-modeller er utilstrækkelige til at opfylde kravene til kropsliggjort AI – det vil sige AI i fysiske robotter. Denne beslutning understreger virksomhedens tilgang til at udvikle skræddersyede løsninger til de specifikke udfordringer inden for robotteknologi i stedet for at stole på generelle AI-modeller.
Applikationsorientering
Fokus på husholdningsbrug
Mens mange aktører i branchen i øjeblikket fokuserer på industrielle eller arbejdsplads-robotapplikationer, forfølger Figure AI en strategisk overraskende tilgang med Helix, der fokuserer på husholdningsrobotter. Robotternes evne til at udføre hverdagsopgaver såsom at sortere dagligvarer, fylde køleskabet eller håndtere en bred vifte af husholdningsartikler er rettet mod et marked, som andre aktører ofte anser for at være for komplekst at komme ind på.
Koordinering mellem flere robotter: Nøglen til den næste generation af robotteknologi
Helix skiller sig ud fra andre AI-robotsystemer på grund af sin dobbeltsystemarkitektur, omfattende kontrolfunktioner, bemærkelsesværdige generaliseringsevne og koordinering mellem flere robotter. Med sin effektive træningsproces, indlejrede processering og strategiske fokus på husholdningsapplikationer repræsenterer den et betydeligt fremskridt i udviklingen af humanoide robotter. Mens andre systemer, såsom Google DeepMinds RT-2, forfølger lignende tilgange til at kombinere visuelle data og stemmekommandoer, tilbyder Helix differentierende fordele gennem sin unikke arkitektur og integrerede udviklingstilgang, hvilket gør den til en pioner inden for den næste generation af AI-drevne robotter.
Vi er her for dig - Rådgivning - Planlægning - Implementering - Projektledelse
☑️ SMV-support inden for strategi, rådgivning, planlægning og implementering
☑️ Oprettelse eller omlægning af den digitale strategi og digitalisering
☑️ Udvidelse og optimering af internationale salgsprocesser
☑️ Globale og digitale B2B-handelsplatforme
☑️ Pioner inden for forretningsudvikling
Jeg vil med glæde fungere som din personlige rådgiver.
Du kan kontakte mig ved at udfylde kontaktformularen nedenfor eller blot ringe til mig på +49 89 89 674 804 (München) .
Jeg glæder mig til vores fælles projekt.
Xpert.Digital - Konrad Wolfenstein
Xpert.Digital er et knudepunkt for industrien med fokus på digitalisering, maskinteknik, logistik/intralogistik og solceller.
Med vores 360° forretningsudviklingsløsning understøtter vi anerkendte virksomheder fra nye forretninger til eftersalg.
Markedsinformation, smarketing, marketingautomatisering, indholdsudvikling, PR, postkampagner, personlige sociale medier og lead nurturing er en del af vores digitale værktøjer.
Du kan finde mere information på: www.xpert.digital - www.xpert.solar - www.xpert.plus



























