Ikona strony internetowej Xpert.Cyfrowy

System Robotics „Helis” „Helise” Figury AI dla modelu Humanoid Robot-A Vision Language Action (VLA)

System Robotics AI „Helise” według figury AI dla modelu humanoidalnego Robot-A Vish Language Action (VLA)

System robotyki AI „Helix” firmy Figure AI dla robotów humanoidalnych – model Vision-Language-Action (VLA) – Zdjęcie: Xpert.Digital

Helix: System sztucznej inteligencji, który przenosi roboty humanoidalne na nowy poziom

Streszczenie: Wizja, język, ruch: Helix jako kamień milowy w robotyce

Helix to innowacyjny system sztucznej inteligencji (AI) dla robotów humanoidalnych opracowany przez Figure AI. Jest to model Vision-Language-Action (VLA), który łączy percepcję wzrokową, rozumienie mowy i precyzyjną kontrolę motoryczną w jednym systemie. Helix stanowi znaczący postęp w rozwoju elastycznych systemów robotycznych przeznaczonych do środowisk niestrukturalnych, takich jak domy. Dzięki możliwości wykonywania złożonych zadań bez wcześniejszego szkolenia, może zrewolucjonizować interakcję człowiek-maszyna.

Nadaje się do:

Zdolności Helixa

  • Kontrola w czasie rzeczywistym górnej części ciała humanoidalnych robotów, obejmująca 35 osi ruchu.
  • Przetwarzanie danych głosowych i wizualnych w celu wykonywania złożonych zadań
  • Rozpoznawanie i obsługa nieznanych obiektów bez specjalistycznego przeszkolenia
  • Współpraca wielu robotów przy wykonywaniu zadań
  • Wykonywanie prac domowych, takich jak uzupełnianie zapasów w lodówce

Szczegóły techniczne

Składa się z dwóch głównych komponentów:

  1. Multimodalny model językowy z 7 miliardami parametrów (7-9 Hz)
  2. Sztuczna inteligencja ruchu z 80 milionami parametrów (200 Hz)
  • Przeszkolony w ramach zaledwie 500 godzin nadzorowanego szkolenia
  • Działa na energooszczędnych, wbudowanych procesorach graficznych

Najwięksi konkurenci

  1. Google DeepMind: Opracowywanie podobnych modeli VLA do RT-2
  2. Meta: Praca nad zaawansowanymi robotami humanoidalnymi
  3. Apple: Również w wyścigu o opracowanie zaawansowanych humanoidalnych AI
  4. OpenAI: Były partner Figure AI, obecnie konkurent w dziedzinie rozwoju sztucznej inteligencji
Google DeepMind

Google DeepMind zaprezentował RT-2 (Robotics Transformer 2), przełomowy model łączący wizję, język i działanie (VLA). RT-2 umożliwia robotom wykonywanie nowych zadań bez specjalistycznego szkolenia, ucząc się pojęć z danych tekstowych i graficznych z internetu i tłumacząc je na działania robota. W testach RT-2 wykazał znacząco lepszą wydajność w wykonywaniu nowych zadań w porównaniu z poprzednikiem, RT-1.

Nadaje się do:

Meta

Meta intensywnie inwestuje w rozwój humanoidalnych robotów wspomaganych sztuczną inteligencją. Firma utworzyła nowy zespół w ramach działu Reality Labs, który zajmuje się badaniami i rozwojem robotów dla konsumentów. Meta planuje rozwijać systemy sztucznej inteligencji, czujniki i platformy oprogramowania, które będą mogły być wykorzystywane również przez innych producentów.

Jabłko

Apple bada również projekty robotów humanoidalnych i niehumanoidalnych. Firma jest jednak wciąż na wczesnym etapie rozwoju. Analityk Ming-Chi Kuo przewiduje, że masowa produkcja nie będzie możliwa wcześniej niż w 2028 roku. Apple koncentruje się szczególnie na interakcji człowiek-robot.

Nadaje się do:

OpenAI

OpenAI, były partner Figure AI, buduje własny dział robotyki i koncentruje się na robotach jako ucieleśnieniu sztucznej inteligencji w świecie rzeczywistym. Firma konkuruje obecnie bezpośrednio z Google DeepMind i innymi firmami w dziedzinie rozwoju sztucznej inteligencji dla robotyki.

 

🎯🎯🎯 Skorzystaj z bogatej, pięciokrotnej wiedzy eksperckiej Xpert.Digital w ramach kompleksowego pakietu usług | BD, R&D, XR, PR i optymalizacja widoczności cyfrowej

Skorzystaj z bogatej, pięciokrotnej wiedzy specjalistycznej Xpert.Digital w ramach kompleksowego pakietu usług | Badania i rozwój, XR, PR i optymalizacja widoczności cyfrowej — Zdjęcie: Xpert.Digital

Xpert.Digital posiada dogłębną wiedzę na temat różnych branż. Dzięki temu możemy opracowywać strategie „szyte na miarę”, które są dokładnie dopasowane do wymagań i wyzwań konkretnego segmentu rynku. Dzięki ciągłej analizie trendów rynkowych i śledzeniu rozwoju branży możemy działać dalekowzrocznie i oferować innowacyjne rozwiązania. Dzięki połączeniu doświadczenia i wiedzy generujemy wartość dodaną i dajemy naszym klientom zdecydowaną przewagę konkurencyjną.

Więcej na ten temat tutaj:

 

Helix: Różnicowanie w porównaniu z innymi systemami AI dla robotów

Innowacyjny model VLA: Helix łączy percepcję, język i ruch

Niedawne wprowadzenie na rynek Helixa przez Figure AI oznacza znaczący postęp w dziedzinie sztucznej inteligencji w robotyce. Ten innowacyjny model Vision-Language-Action (VLA) wyróżnia się na tle istniejących systemów kilkoma przełomowymi funkcjami, wyznaczając nowe standardy w sterowaniu robotami humanoidalnymi. Helix integruje percepcję wizualną, rozumienie mowy i precyzyjne sterowanie ruchem w jednym systemie, zaprojektowanym specjalnie z myślą o wyzwaniach związanych z robotyką fizyczną.

Unikalna architektura dwusystemowa

Być może najważniejszą różnicą między Helixem a innymi systemami sztucznej inteligencji dla robotów jest jego innowacyjna, dwukomponentowa architektura. Ta dwusystemowa struktura rozwiązuje fundamentalny problem sztucznej inteligencji w robotyce.

System 1 i System 2: uzupełniająca się inteligencja

W przeciwieństwie do konwencjonalnych podejść, Helix wykorzystuje dwa uzupełniające się systemy, które razem osiągają unikalną równowagę między uniwersalnością a szybkością. System 2 (S2) to multimodalny model językowy z 7 miliardami parametrów, działający z częstotliwością 7-9 Hz i pełniący funkcję analitycznego „mózgu” robota. Przetwarza dane wizualne i polecenia głosowe, interpretuje otoczenie i decyduje, jakie działania wykonać.

Uzupełnieniem jest System 1 (S1), szybka, reaktywna jednostka sterująca wizualno-motorycznie z 80 milionami parametrów. Komponent ten tłumaczy informacje semantyczne dostarczane przez S2 na precyzyjne, ciągłe działania robota z imponującą częstotliwością 200 Hz. Rysunek AI wyjaśnia, że ​​poprzednie podejścia zawiodły z powodu braku uniwersalności lub szybkości: „Wykorzystanie VLM (Visual Large Language Model) jest uniwersalne, ale nie szybkie, a wykorzystanie strategii ruchu wizualnego dla robotów jest szybkie, ale nie uniwersalne”. Helix przezwycięża tę dychotomię dzięki swojej podwójnej strukturze.

Taka architektura różni się zasadniczo od innych znanych modeli VLA, takich jak RT-2 firmy Google DeepMind, który również łączy dane wizualne i polecenia głosowe, ale nie posiada porównywalnego podziału na dwie części.

Nadaje się do:

Kompleksowe możliwości sterowania

Kontrola ponad 35 stopni swobody

Kolejną wyróżniającą cechą Helixa jest możliwość jednoczesnej koordynacji 35 stopni swobody. Ta kompleksowa kontrola pozwala na precyzyjną i szybką manipulację całym humanoidalnym korpusem, w tym nadgarstkami, tułowiem, głową i poszczególnymi palcami. Ta możliwość sterowania przewyższa większość istniejących systemów i umożliwia wykonywanie złożonych zadań manipulacyjnych wymagających dużej sprawności motorycznej.

Uogólnianie i uczenie się obiektów

Uniwersalne rozpoznawanie obiektów bez specjalnego szkolenia

Kluczową cechą Helixa jest jego zdolność do rozpoznawania i obsługi praktycznie każdego małego przedmiotu gospodarstwa domowego bez wcześniejszego szkolenia w zakresie jego specyficznych cech. Ta szeroka generalizacja pozwala systemowi obsługiwać tysiące przedmiotów o różnych kształtach, rozmiarach, kolorach i właściwościach materiałowych.

W przeciwieństwie do wielu innych systemów robotycznych AI, które wymagają przeprogramowania lub przeszkolenia do każdego nowego zadania lub typu obiektu, Helix potrafi dostosowywać się do różnych sytuacji i reagować na polecenia w języku naturalnym. Stanowi to zmianę paradygmatu, ponieważ system wykorzystuje jedną sieć neuronową do nauki wszystkich zachowań – takich jak podnoszenie i odkładanie przedmiotów, korzystanie z szuflad i lodówek oraz interakcja z innymi robotami – bez konieczności precyzyjnego dostrajania pod kątem konkretnego zadania.

Koordynacja wielu robotów

Unikalne umiejętności współpracy

Helix to pierwszy model VLA zdolny do jednoczesnego sterowania dwoma robotami i umożliwienia im współpracy. Ta zdolność pozwala robotom wspólnie rozwiązywać złożone zadania, obejmujące przekazywanie sobie przedmiotów i koordynację ruchów. Na szczególną uwagę zasługuje niemal ludzka komunikacja między robotami poprzez kiwanie głową i kontakt wzrokowy.

Ta forma koordynacji stanowi znaczący postęp w porównaniu z konwencjonalnymi systemami, w których każdy robot jest zazwyczaj sterowany indywidualnie lub wymaga specjalnego szkolenia do wykonywania konkretnych zadań. W przypadku Helix oba roboty wykorzystują te same obciążenia modelu bez konieczności indywidualnej regulacji.

Efektywność i wdrażanie szkoleń

Minimalne wymagania szkoleniowe, maksymalna wydajność

Kolejną kluczową różnicą jest niezwykła wydajność procesu szkoleniowego. Helix został opracowany z wykorzystaniem zaledwie 500 godzin wysokiej jakości danych szkoleniowych, pozyskanych zdalnie, co stanowi znacznie mniej niż porównywalne metody, które często wymagają tysięcy godzin specjalistycznych demonstracji. Ta wydajność nie tylko podkreśla techniczne zaawansowanie systemu, ale także jego ekonomiczną opłacalność w zastosowaniach komercyjnych.

Przetwarzanie z możliwością osadzania

W przeciwieństwie do wielu systemów sztucznej inteligencji robotycznej, które opierają się na wydajnych serwerach zewnętrznych, Helix działa w całości na wbudowanych, energooszczędnych procesorach graficznych (GPU) wbudowanych w roboty. To wbudowane przetwarzanie eliminuje potrzebę stałego połączenia z zewnętrznymi zasobami obliczeniowymi, dzięki czemu robot jest bardziej autonomiczny i elastyczny w różnych środowiskach.

Strategiczne różnicowanie

Integracja pionowa zamiast ogólnych modeli AI

Figure AI strategicznie wyróżniło się na tle innych firm, kończąc współpracę z OpenAI i realizując strategię integracji pionowej, rozwijając zarówno sprzęt, jak i oprogramowanie we własnym zakresie. Prezes Brett Adcock wyjaśnił, że ogólne modele sztucznej inteligencji (AI) nie wystarczają do spełnienia wymagań sztucznej inteligencji ucieleśnionej – czyli sztucznej inteligencji w robotach fizycznych. Decyzja ta podkreśla podejście firmy do tworzenia rozwiązań dostosowanych do specyficznych wyzwań robotyki, zamiast polegania na ogólnych modelach AI.

Orientacja na aplikację

Skup się na użytkowaniu domowym

Podczas gdy wielu graczy branżowych koncentruje się obecnie na zastosowaniach robotów przemysłowych lub w miejscu pracy, Figure AI realizuje zaskakujące podejście strategiczne z Helix, koncentrując się na robotyce domowej. Zdolność robotów do wykonywania codziennych zadań, takich jak sortowanie artykułów spożywczych, zapełnianie lodówki czy obsługa szerokiej gamy artykułów gospodarstwa domowego, trafia na rynek, który inni gracze często uważają za zbyt złożony, by na niego wejść.

Koordynacja wielu robotów: klucz do kolejnej generacji robotyki

Helix wyróżnia się na tle innych systemów robotyki AI dzięki dwusystemowej architekturze, kompleksowym możliwościom sterowania, niezwykłej zdolności generalizacji oraz koordynacji z wieloma robotami. Dzięki wydajnemu procesowi szkolenia, wbudowanemu przetwarzaniu i strategicznemu ukierunkowaniu na zastosowania domowe, Helix stanowi znaczący postęp w rozwoju robotów humanoidalnych. Podczas gdy inne systemy, takie jak RT-2 firmy Google DeepMind, wykorzystują podobne podejście łączące dane wizualne z poleceniami głosowymi, Helix oferuje wyróżniające go zalety dzięki unikalnej architekturze i zintegrowanemu podejściu do rozwoju, co czyni go pionierem w kolejnej generacji robotów opartych na sztucznej inteligencji.

 

Jesteśmy do Twojej dyspozycji - doradztwo - planowanie - realizacja - zarządzanie projektami

☑️ Wsparcie MŚP w zakresie strategii, doradztwa, planowania i wdrażania

☑️ Stworzenie lub dostosowanie strategii cyfrowej i cyfryzacji

☑️Rozbudowa i optymalizacja procesów sprzedaży międzynarodowej

☑️ Globalne i cyfrowe platformy handlowe B2B

☑️ Pionierski rozwój biznesu

 

Konrad Wolfenstein

Chętnie będę Twoim osobistym doradcą.

Możesz się ze mną skontaktować wypełniając poniższy formularz kontaktowy lub po prostu dzwoniąc pod numer +49 89 89 674 804 (Monachium) .

Nie mogę się doczekać naszego wspólnego projektu.

 

 

Napisz do mnie

 
Xpert.Digital - Konrad Wolfenstein

Xpert.Digital to centrum przemysłu skupiające się na cyfryzacji, inżynierii mechanicznej, logistyce/intralogistyce i fotowoltaice.

Dzięki naszemu rozwiązaniu do rozwoju biznesu 360° wspieramy znane firmy od rozpoczęcia nowej działalności po sprzedaż posprzedażną.

Wywiad rynkowy, smarketing, automatyzacja marketingu, tworzenie treści, PR, kampanie pocztowe, spersonalizowane media społecznościowe i pielęgnacja leadów to część naszych narzędzi cyfrowych.

Więcej informacji znajdziesz na: www.xpert.digital - www.xpert.solar - www.xpert.plus

Pozostajemy w kontakcie

 

Wyjdź z wersji mobilnej