Il sistema di AI robotico "Helix" di Figure AI per il modello di azione del linguaggio della visione umanoide-a Vision (VLA)
Pre-release di Xpert
Selezione vocale 📢
Pubblicato il 28 febbraio 2025 / Aggiornamento dal: 28 febbraio 2025 - Autore: Konrad Wolfenstein
Il sistema di AI robotico "Helix" di Figura AI per il robot umanoide-A Vision-Language-Action (VLA) Image modello: Xpert.Digital
Helix: il sistema AI che porta i robot umanoidi a un nuovo livello
Versione breve: Visione, linguaggio, movimento: Helix come pietra miliare in robotica
Helix è un sistema di intelligenza artificiale innovativo per i robot umanoidi sviluppato dalla figura AI. È un modello di Vision Language-Action (VLA) che combina la percezione visiva, la comprensione del linguaggio e il controllo motorio preciso in un singolo sistema. Helix segna progressi significativi nello sviluppo di sistemi di robot flessibili per ambienti non strutturati come le famiglie. Con la sua capacità di svolgere compiti complessi senza un addestramento precedente, potrebbe rivoluzionare l'interazione tra uomo e macchina.
Adatto a:
- Language -Robot controllato: Helix dalla figura AI cambia tutto! Industria, famiglia, futuro - comprensione, apprendimento, esecuzione in tempo reale
Abilità eliche
- Controllo in tempo reale dell'intera parte superiore del corpo dei robot umanoidi, tra cui 35 assi di movimento
- Elaborazione dell'input vocale e informazioni visive sull'esecuzione di compiti complessi
- Rilevamento e gestione di oggetti sconosciuti senza addestramento specifico
- Cooperazione tra diversi robot nell'esecuzione di compiti
- Esecuzione di compiti domestici come la radura di un frigorifero
Dettagli tecnici
È composto da due componenti principali:
- Un modello di lingua multimodale con 7 miliardi di parametri (7-9 Hz)
- Un movimento AI con 80 milioni di parametri (200 Hz)
- Addestrato con solo 500 ore di allenamento monitorato
- Funziona su GPU incorporate efficienti dal punto di vista energetico
Il più grande concorrente
- Google DeepMind: modelli VLA sviluppati come RT-2
- Meta: lavorando su robot umanoidi avanzati
- Apple: anche nella corsa per lo sviluppo di umanoidi AI avanzati
- OpenAai: ex partner di Figure AI, ora concorrente nel campo dello sviluppo dell'IA
Google DeepMind
Con RT-2 (Robotics Transformer 2), Google DeepMind ha presentato un modello innovativo di Vision Language-Action (VLA). RT-2 consente ai robot di svolgere nuove attività senza una formazione specifica mediante concetti di apprendimento dai dati di testo e immagini di Internet e implementandoli in azioni robotiche. Nei test, RT-2 ha mostrato una prestazione significativamente migliorata in nuove attività rispetto al modello precedente RT-1.
Adatto a:
- Google Project Mariner: agente AI sperimentale come estensione del browser – Navigazione web autonoma con tecnologia DeepMind
Meta
Meta investe fortemente nello sviluppo di robot umanoidi controllati dall'intelligenza artificiale. La società ha fondato un nuovo team all'interno della sua divisione di Reality Labs, che si concentra sulla ricerca e lo sviluppo di robot per i consumatori. Meta prevede di sviluppare sistemi di intelligenza artificiale, sensori e piattaforme software che possono anche essere utilizzate da altri produttori.
Mela
Apple ricerca anche sia umanoidi che design di robot non umanoidi. Tuttavia, la società è ancora in una fase di sviluppo iniziale. L'analista Ming-Chi Kuo prevede una possibile produzione di massa al più presto per il 2028. Apple si concentra in particolare sull'interazione tra umani e robot.
Adatto a:
- Apple nella febbre robot? Gli annunci di lavoro rivelano l'offensiva robot di Apple: il gigante della tecnologia ora attacca il mercato delle famiglie?
OpenAI
Openaai, ex partner di Figure AI, crea il proprio dipartimento di robotica e si occupa di robot come incarnazione di intelligenza artificiale nel mondo reale. La società ora compete direttamente con Google DeepMind e altri nel campo dello sviluppo dell'IA per la robotica.
🎯🎯🎯 Approfittate della quintuplice competenza estesa di Xpert.Digital in un pacchetto di servizi completo | Ricerca e sviluppo, XR, PR e SEM
Macchina per il rendering 3D AI e XR: la quintuplice esperienza di Xpert.Digital in un pacchetto di servizi completo, R&D XR, PR e SEM - Immagine: Xpert.Digital
Xpert.Digital ha una conoscenza approfondita di vari settori. Questo ci consente di sviluppare strategie su misura che si adattano esattamente alle esigenze e alle sfide del vostro specifico segmento di mercato. Analizzando continuamente le tendenze del mercato e seguendo gli sviluppi del settore, possiamo agire con lungimiranza e offrire soluzioni innovative. Attraverso la combinazione di esperienza e conoscenza, generiamo valore aggiunto e diamo ai nostri clienti un vantaggio competitivo decisivo.
Maggiori informazioni qui:
Helix: differenziazione rispetto ad altri sistemi AI per i robot
Modello VLA innovativo: Helix combina percezione, linguaggio e movimento
L'introduzione più recente di Helix attraverso la figura AI segna un progresso significativo nel panorama da robotica a do-go. Questo modello innovativo di azioni a lungo termine (VLA) si distingue attraverso diverse proprietà innovative dei sistemi esistenti e stabilisce nuovi standard per il controllo dei robot umani. Helix combina la percezione visiva, la comprensione del linguaggio e il controllo preciso del movimento in un sistema integrato che è stato appositamente progettato per le sfide della robotica fisica.
Architettura unica a doppio sistema
La differenza più significativa tra Helix e altri sistemi AI per i robot risiede nella sua innovativa architettura a due componenti. Questa struttura a doppio sistema risolve un problema fondamentale dell'IA robotica.
Sistema 1 e sistema 2: intelligenza complementare
Contrariamente agli approcci convenzionali, Helix utilizza due sistemi complementari che insieme raggiungono un equilibrio unico tra universalità e velocità. Il sistema 2 (S2) è un modello di linguaggio multimodale con 7 miliardi di parametri che funzionano con una frequenza di 7-9 Hz e fungono da "cervello" analitico del robot. Elabora i dati visivi e i comandi vocali, interpreta l'ambiente e decide quali azioni dovrebbero essere eseguite.
System 1 (S1), un'unità di controllo Visuo-Motor reattivo veloce con 80 milioni di parametri. Questo componente traduce le informazioni semantiche fornite dall'S2 in azioni robot precise e continue con una frequenza impressionante di 200 Hz. Il robot è veloce, ma non universale ”. Helix supera questa dicotomia attraverso la sua doppia struttura.
Questa architettura differisce fondamentalmente da altri modelli VLA noti come Google DeepMinds RT-2, che combina anche i dati visivi e i comandi vocali, ma non ha una divisione comparabile di due.
Adatto a:
- La piattaforma Gemini di Google con Google AI Studio, Google Deep Research con Gemini Advanced e Google DeepMind
Capacità di controllo complete
Controllo oltre 35 gradi di libertà
Un'altra distinzione da Helix è la sua capacità di coordinare 35 gradi di libertà allo stesso tempo. Questo controllo completo consente un controllo preciso dell'intero corpo umanoide, tra cui polsi, busto, testa e dita individuali ad alta velocità. Questa capacità di controllo supera la maggior parte dei sistemi esistenti e consente compiti di manipolazione complessi che richiedono un alto grado di capacità motorie fine.
Generazione di oggetti e apprendimento
Riconoscimento di oggetti universali senza formazione specifica
Un'eccezionale qualità di Helix è la capacità di riconoscere e gestire praticamente ogni piccolo oggetto domestico senza essere stato addestrato sulle sue proprietà specifiche in anticipo. Questa capacità di generalizzazione di distanza consente al sistema di gestire migliaia di oggetti con forme, dimensioni, colori e proprietà materiali diverse.
Contrariamente a molti altri sistemi di robot AI che devono essere appena programmati o addestrati per ogni nuovo compito o nuovo tipo di oggetto, Helix può adattarsi a diverse situazioni e reagire ai comandi vocali naturali. Ciò rappresenta uno spostamento del paradigma, poiché il sistema utilizza una singola rete neuronale per imparare tutti i comportamenti - come raccogliere e prendere oggetti, usando cassetti e frigoriferi, nonché interazione cross -robot - senza compiti di sintonizzazione fine specifica.
Coordinamento multi -robot
Abilità di collaborazione uniche
Helix è il primo modello VLA in grado di controllare due robot allo stesso tempo e consentire loro di lavorare insieme. Questa capacità consente ai robot di risolvere compiti complessi insieme, in cui sono sufficienti e coordinano i loro movimenti. La comunicazione quasi umana tra i robot attraverso i cenni del NOD e il contatto visivo è particolarmente notevole.
Questa forma di coordinamento rappresenta progressi significativi rispetto ai sistemi convenzionali, in cui ogni robot è generalmente controllato individualmente o deve essere addestrato specificamente per determinati ruoli. Con Helix, entrambi i robot usano gli stessi pesi del modello senza la necessità di regolazioni individuali.
Efficienza e implementazione della formazione
Esigenze di allenamento minime, massime prestazioni
Un'altra differenza significativa sta nella notevole efficienza del processo di formazione. Con solo 500 ore di dati di addestramento operati con teleobiettivo di alta qualità, è stata sviluppata Helix, che è considerevolmente inferiore rispetto a approcci comparabili che spesso richiedono migliaia di ore di dimostrazioni specifiche. Questa efficienza non solo sottolinea la raffinatezza tecnica del sistema, ma anche la sua fattibilità economica per le applicazioni commerciali.
Elaborazione incorporata
A differenza di molti sistemi di intelligenza artificiale robotica che si basano su potenti server esterni, Helix corre interamente su GPU incorporate ed efficienti dal punto di vista energetico all'interno del robot. Questa elaborazione a bordo elimina la necessità di una connessione costante a risorse aritmetiche esterne e rende il robot più autonomo e flessibile in vari ambienti.
Differenziazione strategica
Integrazione verticale invece di modelli AI generici
La figura AI ha interrotto strategicamente da altre società ponendo fine alla cooperazione con Openi e perseguendo una strategia integrata verticalmente in cui sia hardware che software sono sviluppati internamente. Il CEO Brett Adcock ha affermato che i modelli di intelligenza artificiale generici non sono sufficienti per soddisfare i requisiti di "AI incorporato", vale a dire AI nei robot fisici. Questa decisione sottolinea l'approccio dello sviluppo di soluzioni su misura per le sfide specifiche della robotica invece di fare affidamento su modelli generali di intelligenza artificiale.
Orientamento dell'applicazione
Concentrati sull'uso familiare
Mentre molti attori del settore si stanno attualmente concentrando sulle applicazioni robot relative al lavoro industriale o sul posto di lavoro, la figura AI con Helix sta perseguendo un approccio strategicamente sorprendente con un focus sulla robotica domestica. La capacità del robot, attività quotidiane come l'ordinamento del cibo, la presa del frigorifero o la gestione di un'ampia varietà di articoli per la casa è rivolta a un mercato che è spesso considerato troppo complesso per l'ingresso da altri attori.
Coordinamento multi-robot: la chiave per la prossima generazione robotica
Con la sua architettura a doppio sistema, Helix si distingue chiaramente da altri sistemi di intelligenza artificiale per i robot attraverso altri sistemi di intelligenza artificiale per i robot. Con il suo processo di formazione efficiente, l'elaborazione incorporata e l'attenzione strategica sui trattamenti domestici, rappresenta progressi significativi nello sviluppo di robot umanoidi. Mentre altri sistemi come Google DeepMinds RT-2 perseguono approcci simili alla combinazione di dati visivi e comandi vocali, Helix offre vantaggi differenziati con la sua architettura unica e il suo approccio di sviluppo integrato, che lo rendono un pioniere nella prossima generazione di robot controllati dall'AI.
Siamo a vostra disposizione: consulenza, pianificazione, implementazione, gestione del progetto
☑️ Supporto alle PMI nella strategia, consulenza, pianificazione e implementazione
☑️ Creazione o riallineamento della strategia digitale e digitalizzazione
☑️ Espansione e ottimizzazione dei processi di vendita internazionali
☑️ Piattaforme di trading B2B globali e digitali
☑️ Sviluppo aziendale pionieristico
Sarei felice di fungere da tuo consulente personale.
Potete contattarmi compilando il modulo di contatto qui sotto o semplicemente chiamandomi al numero +49 89 89 674 804 (Monaco) .
Non vedo l'ora di iniziare il nostro progetto comune.
Xpert.Digital - Konrad Wolfenstein
Xpert.Digital è un hub per l'industria con focus su digitalizzazione, ingegneria meccanica, logistica/intralogistica e fotovoltaico.
Con la nostra soluzione di sviluppo aziendale a 360° supportiamo aziende rinomate dal nuovo business al post-vendita.
Market intelligence, smarketing, marketing automation, sviluppo di contenuti, PR, campagne email, social media personalizzati e lead nurturing fanno parte dei nostri strumenti digitali.
Potete saperne di più su: www.xpert.digital - www.xpert.solar - www.xpert.plus