Figura Sistemul robotic de inteligență artificială „Helix” al inteligenței artificiale pentru roboți umanoizi – un model Viziune-Limbaj-Acțiune (VLA)

Pre-lansare Xpert

Selectarea limbii 📢

Publicat pe: 28 februarie 2025 / Actualizat pe: 28 februarie 2025 – Autor: Konrad Wolfenstein

Sistemul robotic de inteligență artificială „Helix” al AI pentru roboți umanoizi – un model Viziune-Limbaj-Acțiune (VLA) – Imagine: Xpert.Digital

Helix: Sistemul de inteligență artificială care duce roboții umanoizi la un nou nivel

Rezumat: Vedere, limbaj, mișcare: Helix ca piatră de hotar în robotică

Helix este un sistem inovator de inteligență artificială pentru roboți umanoizi, dezvoltat de Figure AI. Este un model Viziune-Limbaj-Acțiune (VLA) care combină percepția vizuală, înțelegerea vorbirii și controlul motor precis într-un singur sistem. Helix marchează un progres semnificativ în dezvoltarea sistemelor robotice flexibile pentru medii nestructurate, cum ar fi locuințele. Cu capacitatea sa de a îndeplini sarcini complexe fără instruire prealabilă, ar putea revoluționa interacțiunea om-mașină.

Legat de asta:

Roboți controlați vocal: Helix by Figure AI schimbă totul! Industrie, gospodărie, viitor – înțelegeți, învățați, executați în timp real

Abilitățile lui Helix

Control în timp real al întregului corp superior al roboților umanoizi, inclusiv 35 de axe de mișcare
Prelucrarea informațiilor vocale și vizuale pentru efectuarea de sarcini complexe
Recunoașterea și manipularea obiectelor necunoscute fără antrenament specific
Colaborarea între mai mulți roboți în executarea sarcinilor
Efectuarea de sarcini casnice, cum ar fi umplerea frigiderului

Detalii tehnice

Constă din două componente principale:

Un model de limbaj multimodal cu 7 miliarde de parametri (7-9 Hz)
O inteligență artificială cu mișcare și 80 de milioane de parametri (200 Hz)

Instruit cu doar 500 de ore de instruire supravegheată
Funcționează pe GPU-uri integrate eficiente din punct de vedere energetic

Cei mai mari concurenți

Google DeepMind: Dezvoltarea de modele VLA similare cu RT-2
Meta: Lucrând la roboți umanoizi avansați
Apple: De asemenea, în cursa pentru dezvoltarea de umanoizi avansați cu inteligență artificială
OpenAI: Fost partener al Figure AI, acum concurent în domeniul dezvoltării IA

Google DeepMind

Google DeepMind a lansat RT-2 (Robotics Transformer 2), un model revoluționar de tip viziune-limbaj-acțiune (VLA). RT-2 permite roboților să îndeplinească sarcini noi fără instruire specifică, învățând concepte din date text și imagini de pe internet și traducându-le în acțiuni robotice. În teste, RT-2 a demonstrat performanțe semnificativ îmbunătățite în sarcini noi în comparație cu predecesorul său, RT-1.

Legat de asta:

Google Project Mariner: Agent experimental de inteligență artificială ca extensie de browser – Navigare web autonomă cu tehnologia DeepMind

Măr

Apple explorează, de asemenea, atât designuri de roboți umanoizi, cât și non-umanoizi. Cu toate acestea, compania se află încă într-un stadiu incipient de dezvoltare. Analistul Ming-Chi Kuo prezice că producția de masă nu este posibilă cel mai devreme până în 2028. Apple se concentrează în special pe interacțiunea om-robot.

Legat de asta:

Este Apple cuprinsă de febra roboților? Anunțurile de angajare dezvăluie ofensiva Apple privind roboții: Gigantul tehnologic atacă acum piața electrocasnicelor?

OpenAI

OpenAI, un fost partener al Figure AI, își construiește propria divizie de robotică și se concentrează pe roboți ca întruchipare a inteligenței artificiale în lumea reală. Compania concurează acum direct cu Google DeepMind și alții în domeniul dezvoltării inteligenței artificiale pentru robotică.

🎯🎯🎯 Beneficiați de expertiza extinsă, în cinci domenii, a Xpert.Digital într-un pachet complet de servicii | BD, R&D, XR, PR și optimizare a vizibilității digitale

Beneficiați de expertiza extinsă, în cinci domenii, a Xpert.Digital într-un pachet complet de servicii | Cercetare și dezvoltare, XR, PR și optimizare a vizibilității digitale - Imagine: Xpert.Digital

Xpert.Digital deține cunoștințe aprofundate în diverse industrii. Acest lucru ne permite să dezvoltăm strategii personalizate, aliniate cu precizie cerințelor și provocărilor segmentului dumneavoastră specific de piață. Prin analiza continuă a tendințelor pieței și monitorizarea evoluțiilor din industrie, putem acționa proactiv și oferi soluții inovatoare. Combinația dintre experiență și expertiză generează valoare adăugată și oferă clienților noștri un avantaj competitiv decisiv.

Mai multe informații aici:

Beneficiați de cele 5 domenii de expertiză ale Xpert.Digital într-un singur pachet – începând de la doar 500 €/lună

Helix: Diferențiere față de alte sisteme de inteligență artificială pentru roboți

Model inovator VLA: Helix combină percepția, limbajul și mișcarea

Lansarea recentă a sistemului Helix de către Figure AI marchează un progres semnificativ în peisajul roboticii bazat pe inteligența artificială. Acest model inovator Viziune-Limbaj-Acțiune (VLA) se distinge de sistemele existente prin câteva caracteristici revoluționare, stabilind noi standarde pentru controlul roboților umanoizi. Helix integrează percepția vizuală, înțelegerea vorbirii și controlul precis al mișcării într-un singur sistem special conceput pentru a aborda provocările roboticii fizice.

Arhitectură unică cu sistem dual

Poate cea mai semnificativă diferență dintre Helix și alte sisteme de inteligență artificială pentru roboți constă în arhitectura sa inovatoare cu două componente. Această structură cu sistem dual rezolvă o problemă fundamentală în inteligența artificială în robotică.

Sistemul 1 și Sistemul 2: O inteligență complementară

Spre deosebire de abordările convenționale, Helix utilizează două sisteme complementare care împreună ating un echilibru unic între universalitate și viteză. Sistemul 2 (S2) este un model de limbaj multimodal cu 7 miliarde de parametri, care funcționează la o frecvență de 7-9 Hz și funcționează ca „creierul” analitic al robotului. Acesta procesează date vizuale și comenzi vocale, interpretează mediul și decide ce acțiuni să efectueze.

Completează aceasta Sistemul 1 (S1), o unitate de control vizuomotor rapidă și reactivă, cu 80 de milioane de parametri. Această componentă traduce informațiile semantice furnizate de S2 în acțiuni precise și continue ale robotului, la o frecvență impresionantă de 200 Hz. Figura AI explică faptul că abordările anterioare au eșuat fie din cauza lipsei de universalitate, fie din cauza vitezei: „Utilizarea VLM (Visual Large Language Model) este universală, dar nu rapidă, iar utilizarea strategiilor de mișcare vizuală pentru roboți este rapidă, dar nu universală.” Helix depășește această dihotomie prin structura sa duală.

Această arhitectură diferă fundamental de alte modele VLA bine-cunoscute, cum ar fi RT-2 de la Google DeepMind, care combină, de asemenea, date vizuale și comenzi vocale, dar nu are o împărțire comparabilă în două părți.

Legat de asta:

Platforma Gemini de la Google cu Google AI Studio, Google Deep Research cu Gemini Advanced și Google DeepMind

Capacități complete de control

Control peste 35 de grade de libertate

O altă caracteristică distinctivă a lui Helix este capacitatea sa de a coordona simultan 35 de grade de libertate. Acest control complet permite manipularea precisă și de mare viteză a întregului corp superior umanoid, inclusiv încheieturile mâinilor, trunchiul, capul și degetele individuale. Această capacitate de control depășește majoritatea sistemelor existente și permite sarcini complexe de manipulare care necesită un grad ridicat de abilități motorii fine.

Generalizarea și învățarea obiectelor

Recunoaștere universală a obiectelor fără antrenament specific

O caracteristică cheie a sistemului Helix este capacitatea sa de a recunoaște și manipula practic orice obiect mic din gospodărie, fără o instruire prealabilă cu privire la caracteristicile sale specifice. Această generalizabilitate largă permite sistemului să gestioneze mii de obiecte cu forme, dimensiuni, culori și proprietăți ale materialelor variate.

Spre deosebire de multe alte sisteme robotice bazate pe inteligență artificială, care trebuie reprogramate sau reantrenate pentru fiecare sarcină sau tip de obiect nou, Helix se poate adapta la diferite situații și poate răspunde la comenzi din limbaj natural. Aceasta reprezintă o schimbare de paradigmă, deoarece sistemul folosește o singură rețea neuronală pentru a învăța toate comportamentele - cum ar fi ridicarea și așezarea obiectelor, utilizarea sertarelor și frigiderelor și interacțiunea cu alți roboți - fără a fi nevoie de ajustări fine specifice sarcinii.

Coordonare multi-robotă

Abilități unice de colaborare

Helix este primul model VLA capabil să controleze simultan doi roboți și să le permită să colaboreze. Această capacitate permite roboților să rezolve împreună sarcini complexe care implică trecerea de obiecte și coordonarea mișcărilor lor. Deosebit de remarcabilă este comunicarea aproape umană dintre roboți prin înclinarea capului și contactul vizual.

Această formă de coordonare reprezintă un progres semnificativ față de sistemele convenționale, unde fiecare robot este de obicei controlat individual sau necesită instruire specifică pentru anumite roluri. Cu Helix, ambii roboți folosesc aceleași greutăți ale modelului fără a fi nevoie de ajustări individuale.

Eficiența și implementarea instruirii

Cerințe minime de antrenament, performanță maximă

O altă diferență cheie constă în eficiența remarcabilă a procesului de instruire. Helix a fost dezvoltat folosind doar 500 de ore de date de instruire de înaltă calitate, operate de la distanță, semnificativ mai puțin decât abordările comparabile care necesită adesea mii de ore de demonstrații specifice. Această eficiență nu numai că subliniază sofisticarea tehnică a sistemului, ci și viabilitatea sa economică pentru aplicații comerciale.

Procesare cu funcționalitate încorporată

Spre deosebire de multe sisteme robotice de inteligență artificială care se bazează pe servere externe puternice, Helix rulează în întregime pe GPU-uri integrate și eficiente din punct de vedere energetic în roboți. Această procesare integrată elimină necesitatea unei conexiuni constante la resurse de calcul externe, făcând robotul mai autonom și flexibil în diferite medii.

Diferențiere strategică

Integrare verticală în locul modelelor generice de inteligență artificială

Figure AI s-a diferențiat strategic de alte companii prin încheierea colaborării cu OpenAI și prin urmarea unei strategii integrate pe verticală, dezvoltând intern atât hardware, cât și software. CEO-ul Brett Adcock a explicat că modelele generice de IA sunt insuficiente pentru a îndeplini cerințele IA întruchipată - adică IA în roboți fizici. Această decizie subliniază abordarea companiei de a dezvolta soluții personalizate pentru provocările specifice ale roboticii, mai degrabă decât să se bazeze pe modele generale de IA.

Orientare către aplicație

Concentrare pe uzul casnic

În timp ce mulți jucători din industrie se concentrează în prezent pe aplicații robotice industriale sau la locul de muncă, Figure AI adoptă o abordare strategică surprinzătoare cu Helix, concentrându-se pe robotica de uz casnic. Capacitatea roboților de a îndeplini sarcini zilnice, cum ar fi sortarea alimentelor, umplerea frigiderului sau manipularea unei game largi de articole de uz casnic, vizează o piață pe care alți jucători o consideră adesea prea complexă pentru a intra.

Coordonarea multi-robotică: cheia următoarei generații de robotică

Helix se remarcă față de alte sisteme robotice bazate pe inteligență artificială datorită arhitecturii sale duale, capacităților de control cuprinzătoare, capacității remarcabile de generalizare și coordonării multi-roboți. Cu procesul său eficient de antrenament, procesarea integrată și concentrarea strategică pe aplicații casnice, acesta reprezintă un progres semnificativ în dezvoltarea roboților umanoizi. În timp ce alte sisteme, cum ar fi RT-2 de la Google DeepMind, urmăresc abordări similare de combinare a datelor vizuale și a comenzilor vocale, Helix oferă avantaje diferențiatoare prin arhitectura sa unică și abordarea integrată a dezvoltării, ceea ce îl face un pionier în următoarea generație de roboți bazați pe inteligență artificială.

Suntem aici pentru tine - Consultanță - Planificare - Implementare - Management de proiect

☑️ Suport pentru IMM-uri în strategie, consultanță, planificare și implementare

☑️ Crearea sau realinierea strategiei digitale și a digitalizării

☑️ Extinderea și optimizarea proceselor de vânzări internaționale

☑️ Platforme de tranzacționare B2B globale și digitale

☑️ Dezvoltare de afaceri pionieră

Konrad Wolfenstein

Aș fi bucuros să vă servesc drept consilier personal.

Mă puteți contacta completând formularul de contact de mai jos sau pur și simplu sunându-mă la +49 89 89 674 804 (München) .

Aștept cu nerăbdare proiectul nostru comun.

Scrie-mi

➡️ Cerere apel video 👩👱

Xpert.Digital - Konrad Wolfenstein

Xpert.Digital este un hub pentru industrie, axat pe digitalizare, inginerie mecanică, logistică/intralogistică și fotovoltaică.

Cu soluția noastră de Dezvoltare Afaceri 360°, sprijinim companii renumite, de la achiziții noi până la post-vânzare.

Inteligența de piață, smarketing-ul, automatizarea marketingului, dezvoltarea de conținut, PR-ul, campaniile de e-mail, social media personalizate și cultivarea lead-urilor fac parte din instrumentele noastre digitale.

Puteți găsi mai multe informații la: www.xpert.digital - www.xpert.solar - www.xpert.plus

Păstrăm legătura

Figura Sistemul robotic de inteligență artificială „Helix” al inteligenței artificiale pentru roboți umanoizi – un model Viziune-Limbaj-Acțiune (VLA)

Conectează-te cu mine:

CATEGORII

Helix: Sistemul de inteligență artificială care duce roboții umanoizi la un nou nivel

Rezumat: Vedere, limbaj, mișcare: Helix ca piatră de hotar în robotică

Abilitățile lui Helix

Detalii tehnice

Cei mai mari concurenți

Google DeepMind

Meta

Măr

OpenAI

🎯🎯🎯 Beneficiați de expertiza extinsă, în cinci domenii, a Xpert.Digital într-un pachet complet de servicii | BD, R&D, XR, PR și optimizare a vizibilității digitale

Helix: Diferențiere față de alte sisteme de inteligență artificială pentru roboți

Model inovator VLA: Helix combină percepția, limbajul și mișcarea

Arhitectură unică cu sistem dual

Sistemul 1 și Sistemul 2: O inteligență complementară

Capacități complete de control

Control peste 35 de grade de libertate

Generalizarea și învățarea obiectelor

Recunoaștere universală a obiectelor fără antrenament specific

Coordonare multi-robotă

Abilități unice de colaborare

Eficiența și implementarea instruirii

Cerințe minime de antrenament, performanță maximă

Procesare cu funcționalitate încorporată

Diferențiere strategică

Integrare verticală în locul modelelor generice de inteligență artificială

Orientare către aplicație

Concentrare pe uzul casnic

Coordonarea multi-robotică: cheia următoarei generații de robotică

☑️ Suport pentru IMM-uri în strategie, consultanță, planificare și implementare

☑️ Crearea sau realinierea strategiei digitale și a digitalizării

☑️ Extinderea și optimizarea proceselor de vânzări internaționale

☑️ Platforme de tranzacționare B2B globale și digitale

☑️ Dezvoltare de afaceri pionieră

Alte subiecte

Conectează-te cu mine:

CATEGORII