Icona del sito Web Esperto.Digitale

Il sistema di AI robotico "Helix" di Figure AI per il modello di azione del linguaggio della visione umanoide-a Vision (VLA)

Il sistema di AI robotico "Helix" di Figure AI per il modello di Azione del linguaggio della visione umanoide-A (VLA)

Il sistema di AI robotico "Helix" di Figura AI per il robot umanoide-A Vision-Language-Action (VLA) Image modello: Xpert.Digital

Helix: il sistema AI che porta i robot umanoidi a un nuovo livello

Versione breve: Visione, linguaggio, movimento: Helix come pietra miliare in robotica

Helix è un sistema di intelligenza artificiale innovativo per i robot umanoidi sviluppato dalla figura AI. È un modello di Vision Language-Action (VLA) che combina la percezione visiva, la comprensione del linguaggio e il controllo motorio preciso in un singolo sistema. Helix segna progressi significativi nello sviluppo di sistemi di robot flessibili per ambienti non strutturati come le famiglie. Con la sua capacità di svolgere compiti complessi senza un addestramento precedente, potrebbe rivoluzionare l'interazione tra uomo e macchina.

Adatto a:

Abilità eliche

  • Controllo in tempo reale dell'intera parte superiore del corpo dei robot umanoidi, tra cui 35 assi di movimento
  • Elaborazione dell'input vocale e informazioni visive sull'esecuzione di compiti complessi
  • Rilevamento e gestione di oggetti sconosciuti senza addestramento specifico
  • Cooperazione tra diversi robot nell'esecuzione di compiti
  • Esecuzione di compiti domestici come la radura di un frigorifero

Dettagli tecnici

È composto da due componenti principali:

  1. Un modello di lingua multimodale con 7 miliardi di parametri (7-9 Hz)
  2. Un movimento AI con 80 milioni di parametri (200 Hz)
  • Addestrato con solo 500 ore di allenamento monitorato
  • Funziona su GPU incorporate efficienti dal punto di vista energetico

Il più grande concorrente

  1. Google DeepMind: modelli VLA sviluppati come RT-2
  2. Meta: lavorando su robot umanoidi avanzati
  3. Apple: anche nella corsa per lo sviluppo di umanoidi AI avanzati
  4. OpenAai: ex partner di Figure AI, ora concorrente nel campo dello sviluppo dell'IA
Google DeepMind

Con RT-2 (Robotics Transformer 2), Google DeepMind ha presentato un modello innovativo di Vision Language-Action (VLA). RT-2 consente ai robot di svolgere nuove attività senza una formazione specifica mediante concetti di apprendimento dai dati di testo e immagini di Internet e implementandoli in azioni robotiche. Nei test, RT-2 ha mostrato una prestazione significativamente migliorata in nuove attività rispetto al modello precedente RT-1.

Adatto a:

Meta

Meta investe fortemente nello sviluppo di robot umanoidi controllati dall'intelligenza artificiale. La società ha fondato un nuovo team all'interno della sua divisione di Reality Labs, che si concentra sulla ricerca e lo sviluppo di robot per i consumatori. Meta prevede di sviluppare sistemi di intelligenza artificiale, sensori e piattaforme software che possono anche essere utilizzate da altri produttori.

Mela

Apple ricerca anche sia umanoidi che design di robot non umanoidi. Tuttavia, la società è ancora in una fase di sviluppo iniziale. L'analista Ming-Chi Kuo prevede una possibile produzione di massa al più presto per il 2028. Apple si concentra in particolare sull'interazione tra umani e robot.

Adatto a:

OpenAI

Openaai, ex partner di Figure AI, crea il proprio dipartimento di robotica e si occupa di robot come incarnazione di intelligenza artificiale nel mondo reale. La società ora compete direttamente con Google DeepMind e altri nel campo dello sviluppo dell'IA per la robotica.

 

🎯🎯🎯 Approfittate della quintuplice competenza estesa di Xpert.Digital in un pacchetto di servizi completo | Ricerca e sviluppo, XR, PR e SEM

Macchina per il rendering 3D AI e XR: la quintuplice esperienza di Xpert.Digital in un pacchetto di servizi completo, R&D XR, PR e SEM - Immagine: Xpert.Digital

Xpert.Digital ha una conoscenza approfondita di vari settori. Questo ci consente di sviluppare strategie su misura che si adattano esattamente alle esigenze e alle sfide del vostro specifico segmento di mercato. Analizzando continuamente le tendenze del mercato e seguendo gli sviluppi del settore, possiamo agire con lungimiranza e offrire soluzioni innovative. Attraverso la combinazione di esperienza e conoscenza, generiamo valore aggiunto e diamo ai nostri clienti un vantaggio competitivo decisivo.

Maggiori informazioni qui:

 

Helix: differenziazione rispetto ad altri sistemi AI per i robot

Modello VLA innovativo: Helix combina percezione, linguaggio e movimento

L'introduzione più recente di Helix attraverso la figura AI segna un progresso significativo nel panorama da robotica a do-go. Questo modello innovativo di azioni a lungo termine (VLA) si distingue attraverso diverse proprietà innovative dei sistemi esistenti e stabilisce nuovi standard per il controllo dei robot umani. Helix combina la percezione visiva, la comprensione del linguaggio e il controllo preciso del movimento in un sistema integrato che è stato appositamente progettato per le sfide della robotica fisica.

Architettura unica a doppio sistema

La differenza più significativa tra Helix e altri sistemi AI per i robot risiede nella sua innovativa architettura a due componenti. Questa struttura a doppio sistema risolve un problema fondamentale dell'IA robotica.

Sistema 1 e sistema 2: intelligenza complementare

Contrariamente agli approcci convenzionali, Helix utilizza due sistemi complementari che insieme raggiungono un equilibrio unico tra universalità e velocità. Il sistema 2 (S2) è un modello di linguaggio multimodale con 7 miliardi di parametri che funzionano con una frequenza di 7-9 Hz e fungono da "cervello" analitico del robot. Elabora i dati visivi e i comandi vocali, interpreta l'ambiente e decide quali azioni dovrebbero essere eseguite.

System 1 (S1), un'unità di controllo Visuo-Motor reattivo veloce con 80 milioni di parametri. Questo componente traduce le informazioni semantiche fornite dall'S2 in azioni robot precise e continue con una frequenza impressionante di 200 Hz. Il robot è veloce, ma non universale ”. Helix supera questa dicotomia attraverso la sua doppia struttura.

Questa architettura differisce fondamentalmente da altri modelli VLA noti come Google DeepMinds RT-2, che combina anche i dati visivi e i comandi vocali, ma non ha una divisione comparabile di due.

Adatto a:

Capacità di controllo complete

Controllo oltre 35 gradi di libertà

Un'altra distinzione da Helix è la sua capacità di coordinare 35 gradi di libertà allo stesso tempo. Questo controllo completo consente un controllo preciso dell'intero corpo umanoide, tra cui polsi, busto, testa e dita individuali ad alta velocità. Questa capacità di controllo supera la maggior parte dei sistemi esistenti e consente compiti di manipolazione complessi che richiedono un alto grado di capacità motorie fine.

Generazione di oggetti e apprendimento

Riconoscimento di oggetti universali senza formazione specifica

Un'eccezionale qualità di Helix è la capacità di riconoscere e gestire praticamente ogni piccolo oggetto domestico senza essere stato addestrato sulle sue proprietà specifiche in anticipo. Questa capacità di generalizzazione di distanza consente al sistema di gestire migliaia di oggetti con forme, dimensioni, colori e proprietà materiali diverse.

Contrariamente a molti altri sistemi di robot AI che devono essere appena programmati o addestrati per ogni nuovo compito o nuovo tipo di oggetto, Helix può adattarsi a diverse situazioni e reagire ai comandi vocali naturali. Ciò rappresenta uno spostamento del paradigma, poiché il sistema utilizza una singola rete neuronale per imparare tutti i comportamenti - come raccogliere e prendere oggetti, usando cassetti e frigoriferi, nonché interazione cross -robot - senza compiti di sintonizzazione fine specifica.

Coordinamento multi -robot

Abilità di collaborazione uniche

Helix è il primo modello VLA in grado di controllare due robot allo stesso tempo e consentire loro di lavorare insieme. Questa capacità consente ai robot di risolvere compiti complessi insieme, in cui sono sufficienti e coordinano i loro movimenti. La comunicazione quasi umana tra i robot attraverso i cenni del NOD e il contatto visivo è particolarmente notevole.

Questa forma di coordinamento rappresenta progressi significativi rispetto ai sistemi convenzionali, in cui ogni robot è generalmente controllato individualmente o deve essere addestrato specificamente per determinati ruoli. Con Helix, entrambi i robot usano gli stessi pesi del modello senza la necessità di regolazioni individuali.

Efficienza e implementazione della formazione

Esigenze di allenamento minime, massime prestazioni

Un'altra differenza significativa sta nella notevole efficienza del processo di formazione. Con solo 500 ore di dati di addestramento operati con teleobiettivo di alta qualità, è stata sviluppata Helix, che è considerevolmente inferiore rispetto a approcci comparabili che spesso richiedono migliaia di ore di dimostrazioni specifiche. Questa efficienza non solo sottolinea la raffinatezza tecnica del sistema, ma anche la sua fattibilità economica per le applicazioni commerciali.

Elaborazione incorporata

A differenza di molti sistemi di intelligenza artificiale robotica che si basano su potenti server esterni, Helix corre interamente su GPU incorporate ed efficienti dal punto di vista energetico all'interno del robot. Questa elaborazione a bordo elimina la necessità di una connessione costante a risorse aritmetiche esterne e rende il robot più autonomo e flessibile in vari ambienti.

Differenziazione strategica

Integrazione verticale invece di modelli AI generici

La figura AI ha interrotto strategicamente da altre società ponendo fine alla cooperazione con Openi e perseguendo una strategia integrata verticalmente in cui sia hardware che software sono sviluppati internamente. Il CEO Brett Adcock ha affermato che i modelli di intelligenza artificiale generici non sono sufficienti per soddisfare i requisiti di "AI incorporato", vale a dire AI nei robot fisici. Questa decisione sottolinea l'approccio dello sviluppo di soluzioni su misura per le sfide specifiche della robotica invece di fare affidamento su modelli generali di intelligenza artificiale.

Orientamento dell'applicazione

Concentrati sull'uso familiare

Mentre molti attori del settore si stanno attualmente concentrando sulle applicazioni robot relative al lavoro industriale o sul posto di lavoro, la figura AI con Helix sta perseguendo un approccio strategicamente sorprendente con un focus sulla robotica domestica. La capacità del robot, attività quotidiane come l'ordinamento del cibo, la presa del frigorifero o la gestione di un'ampia varietà di articoli per la casa è rivolta a un mercato che è spesso considerato troppo complesso per l'ingresso da altri attori.

Coordinamento multi-robot: la chiave per la prossima generazione robotica

Con la sua architettura a doppio sistema, Helix si distingue chiaramente da altri sistemi di intelligenza artificiale per i robot attraverso altri sistemi di intelligenza artificiale per i robot. Con il suo processo di formazione efficiente, l'elaborazione incorporata e l'attenzione strategica sui trattamenti domestici, rappresenta progressi significativi nello sviluppo di robot umanoidi. Mentre altri sistemi come Google DeepMinds RT-2 perseguono approcci simili alla combinazione di dati visivi e comandi vocali, Helix offre vantaggi differenziati con la sua architettura unica e il suo approccio di sviluppo integrato, che lo rendono un pioniere nella prossima generazione di robot controllati dall'AI.

 

Siamo a vostra disposizione: consulenza, pianificazione, implementazione, gestione del progetto

☑️ Supporto alle PMI nella strategia, consulenza, pianificazione e implementazione

☑️ Creazione o riallineamento della strategia digitale e digitalizzazione

☑️ Espansione e ottimizzazione dei processi di vendita internazionali

☑️ Piattaforme di trading B2B globali e digitali

☑️ Sviluppo aziendale pionieristico

 

Konrad Wolfenstein

Sarei felice di fungere da tuo consulente personale.

Potete contattarmi compilando il modulo di contatto qui sotto o semplicemente chiamandomi al numero +49 89 89 674 804 (Monaco) .

Non vedo l'ora di iniziare il nostro progetto comune.

 

 

Scrivimi

 
Xpert.Digital - Konrad Wolfenstein

Xpert.Digital è un hub per l'industria con focus su digitalizzazione, ingegneria meccanica, logistica/intralogistica e fotovoltaico.

Con la nostra soluzione di sviluppo aziendale a 360° supportiamo aziende rinomate dal nuovo business al post-vendita.

Market intelligence, smarketing, marketing automation, sviluppo di contenuti, PR, campagne email, social media personalizzati e lead nurturing fanno parte dei nostri strumenti digitali.

Potete saperne di più su: www.xpert.digital - www.xpert.solar - www.xpert.plus

Rimaniamo in contatto

 

Esci dalla versione mobile