Gambar sistem AI robotika "Helix" dari Figure AI untuk robot humanoid – sebuah model Vision-Language-Action (VLA)

Konrad Wolfenstein

1 tahun yang lalu

Gambar sistem AI robotika "Helix" dari Figure AI untuk robot humanoid – sebuah model Vision-Language-Action (VLA) – Gambar: Xpert.Digital

Helix: Sistem AI yang membawa robot humanoid ke level baru

Ringkasan: Penglihatan, bahasa, gerakan: Helix sebagai tonggak sejarah dalam robotika

Helix adalah sistem AI inovatif untuk robot humanoid yang dikembangkan oleh Figure AI. Ini adalah model Vision-Language-Action (VLA) yang menggabungkan persepsi visual, pemahaman ucapan, dan kontrol motorik yang presisi dalam satu sistem. Helix menandai kemajuan signifikan dalam pengembangan sistem robotik fleksibel untuk lingkungan yang tidak terstruktur seperti rumah. Dengan kemampuannya untuk melakukan tugas-tugas kompleks tanpa pelatihan sebelumnya, ia dapat merevolusi interaksi manusia-mesin.

Berkaitan dengan ini:

Robot yang dikendalikan suara: Helix dari Figure AI mengubah segalanya! Industri, rumah tangga, masa depan – pahami, pelajari, dan laksanakan secara real time

Kemampuan Helix

Kontrol waktu nyata atas seluruh bagian atas tubuh robot humanoid, termasuk 35 sumbu pergerakan
Pengolahan masukan suara dan informasi visual untuk melakukan tugas-tugas kompleks
Pengenalan dan penanganan objek yang tidak dikenal tanpa pelatihan khusus
Kolaborasi antara beberapa robot dalam pelaksanaan tugas
Melakukan pekerjaan rumah tangga seperti mengisi kulkas

Detail teknis

Terdiri dari dua komponen utama:

Model bahasa multimodal dengan 7 miliar parameter (7-9 Hz)
AI gerak dengan 80 juta parameter (200 Hz)

Dilatih hanya dengan 500 jam pelatihan yang diawasi
Berjalan pada GPU tertanam yang hemat energi

Pesaing terbesar

Google DeepMind: Mengembangkan model VLA serupa dengan RT-2
Meta: Mengerjakan robot humanoid canggih
Apple: Juga ikut serta dalam perlombaan mengembangkan humanoid AI canggih
OpenAI: Mantan mitra Figure AI, kini menjadi pesaing di bidang pengembangan AI

Google DeepMind

Google DeepMind telah meluncurkan RT-2 (Robotics Transformer 2), sebuah model visi-bahasa-aksi (VLA) yang inovatif. RT-2 memungkinkan robot untuk melakukan tugas-tugas baru tanpa pelatihan khusus dengan mempelajari konsep dari data teks dan gambar di internet dan menerjemahkannya ke dalam tindakan robot. Dalam pengujian, RT-2 menunjukkan peningkatan kinerja yang signifikan pada tugas-tugas baru dibandingkan dengan pendahulunya, RT-1.

Berkaitan dengan ini:

Google Project Mariner: Agen AI eksperimental sebagai ekstensi peramban – Navigasi web otonom dengan teknologi DeepMind

Apel

Apple juga sedang menjajaki desain robot humanoid dan non-humanoid. Namun, perusahaan ini masih dalam tahap pengembangan awal. Analis Ming-Chi Kuo memperkirakan produksi massal tidak akan mungkin dilakukan paling cepat hingga tahun 2028. Apple khususnya berfokus pada interaksi manusia-robot.

Berkaitan dengan ini:

Apakah Apple dilanda demam robot? Lowongan pekerjaan mengungkap serangan robot Apple: Apakah raksasa teknologi ini sekarang menyerang pasar peralatan rumah tangga?

OpenAI

OpenAI, mantan mitra Figure AI, sedang membangun divisi robotika sendiri dan berfokus pada robot sebagai perwujudan kecerdasan buatan di dunia nyata. Perusahaan ini sekarang bersaing langsung dengan Google DeepMind dan perusahaan lain di bidang pengembangan AI untuk robotika.

🎯🎯🎯 Manfaatkan keahlian Xpert.Digital yang luas dan mencakup lima bidang dalam satu paket layanan komprehensif | Pengembangan Bisnis, Penelitian & Pengembangan, XR, Humas & Optimalisasi Visibilitas Digital

Manfaatkan keahlian Xpert.Digital yang luas dan mencakup lima bidang dalam paket layanan komprehensif | Litbang, XR, PR & Optimalisasi Visibilitas Digital - Gambar: Xpert.Digital

Xpert.Digital memiliki pengetahuan mendalam di berbagai industri. Hal ini memungkinkan kami untuk mengembangkan strategi yang disesuaikan secara tepat dan selaras dengan kebutuhan serta tantangan segmen pasar spesifik Anda. Dengan terus menganalisis tren pasar dan memantau perkembangan industri, kami dapat bertindak proaktif dan menawarkan solusi inovatif. Kombinasi pengalaman dan keahlian menghasilkan nilai tambah dan memberikan keunggulan kompetitif yang menentukan bagi klien kami.

Informasi selengkapnya di sini:

Dapatkan manfaat dari 5 bidang keahlian Xpert.Digital dalam satu paket – mulai dari hanya €500/bulan

Helix: Perbedaan dibandingkan dengan sistem AI lainnya untuk robot

Model VLA inovatif: Helix menggabungkan persepsi, bahasa, dan gerakan

Peluncuran Helix baru-baru ini oleh Figure AI menandai kemajuan signifikan dalam lanskap AI robotika. Model Vision-Language-Action (VLA) yang inovatif ini membedakan dirinya dari sistem yang ada melalui beberapa fitur terobosan, menetapkan standar baru untuk mengendalikan robot humanoid. Helix mengintegrasikan persepsi visual, pemahaman ucapan, dan kontrol gerak yang presisi ke dalam satu sistem yang dirancang khusus untuk mengatasi tantangan robotika fisik.

Arsitektur sistem ganda yang unik

Mungkin perbedaan paling signifikan antara Helix dan sistem AI lainnya untuk robot terletak pada arsitektur dua komponennya yang inovatif. Struktur sistem ganda ini memecahkan masalah mendasar dalam AI robotika.

Sistem 1 dan Sistem 2: Kecerdasan yang saling melengkapi

Berbeda dengan pendekatan konvensional, Helix menggunakan dua sistem komplementer yang bersama-sama mencapai keseimbangan unik antara universalitas dan kecepatan. Sistem 2 (S2) adalah model bahasa multimodal dengan 7 miliar parameter, beroperasi pada frekuensi 7-9 Hz, dan berfungsi sebagai "otak" analitis robot. Sistem ini memproses data visual dan perintah suara, menafsirkan lingkungan, dan memutuskan tindakan apa yang harus dilakukan.

Melengkapi hal ini adalah Sistem 1 (S1), unit kontrol visuomotor yang cepat dan reaktif dengan 80 juta parameter. Komponen ini menerjemahkan informasi semantik yang diberikan oleh S2 menjadi tindakan robot yang tepat dan berkelanjutan dengan frekuensi yang mengesankan yaitu 200 Hz. Figure AI menjelaskan bahwa pendekatan sebelumnya gagal karena kurangnya universalitas atau kecepatan: "Menggunakan VLM (Visual Large Language Model) bersifat universal tetapi tidak cepat, dan menggunakan strategi gerakan visual untuk robot cepat tetapi tidak universal." Helix mengatasi dikotomi ini melalui struktur gandanya.

Arsitektur ini berbeda secara mendasar dari model VLA terkenal lainnya seperti RT-2 milik Google DeepMind, yang juga menggabungkan data visual dan perintah suara, tetapi tidak memiliki pembagian menjadi dua bagian yang sebanding.

Berkaitan dengan ini:

Platform Gemini Google dengan Google AI Studio, Google Deep Research dengan Gemini Advanced, dan Google DeepMind

Kemampuan kontrol yang komprehensif

Kontrol atas 35 derajat kebebasan

Fitur pembeda lain dari Helix adalah kemampuannya untuk mengkoordinasikan 35 derajat kebebasan secara simultan. Kontrol komprehensif ini memungkinkan manipulasi yang presisi dan berkecepatan tinggi pada seluruh bagian atas tubuh humanoid, termasuk pergelangan tangan, batang tubuh, kepala, dan masing-masing jari. Kemampuan kontrol ini melampaui sebagian besar sistem yang ada dan memungkinkan tugas manipulasi kompleks yang membutuhkan keterampilan motorik halus tingkat tinggi.

Generalisasi dan pembelajaran objek

Pengenalan objek universal tanpa pelatihan khusus

Salah satu fitur utama Helix adalah kemampuannya untuk mengenali dan menangani hampir semua benda kecil rumah tangga tanpa pelatihan sebelumnya mengenai karakteristik spesifiknya. Kemampuan generalisasi yang luas ini memungkinkan sistem untuk menangani ribuan objek dengan berbagai bentuk, ukuran, warna, dan sifat material.

Berbeda dengan banyak sistem robot AI lainnya yang perlu diprogram ulang atau dilatih ulang untuk setiap tugas atau jenis objek baru, Helix dapat beradaptasi dengan berbagai situasi dan merespons perintah bahasa alami. Ini merupakan pergeseran paradigma, karena sistem ini menggunakan satu jaringan saraf untuk mempelajari semua perilaku—seperti mengambil dan meletakkan objek, menggunakan laci dan lemari es, serta berinteraksi dengan robot lain—tanpa perlu penyesuaian khusus untuk setiap tugas.

Koordinasi multi-robot

Keterampilan kolaborasi yang unik

Helix adalah model VLA pertama yang mampu mengendalikan dua robot secara bersamaan dan memungkinkan mereka untuk berkolaborasi. Kemampuan ini memungkinkan robot untuk bersama-sama menyelesaikan tugas-tugas kompleks yang melibatkan pemindahan objek dan koordinasi gerakan mereka. Yang patut diperhatikan adalah komunikasi yang hampir seperti manusia antara robot melalui anggukan kepala dan kontak mata.

Bentuk koordinasi ini merupakan kemajuan signifikan dibandingkan sistem konvensional, di mana setiap robot biasanya dikendalikan secara individual atau memerlukan pelatihan khusus untuk peran tertentu. Dengan Helix, kedua robot menggunakan bobot model yang sama tanpa perlu penyesuaian individual.

Efisiensi dan implementasi pelatihan

Persyaratan pelatihan minimal, kinerja maksimal

Perbedaan kunci lainnya terletak pada efisiensi luar biasa dari proses pelatihan. Helix dikembangkan hanya menggunakan 500 jam data pelatihan berkualitas tinggi yang dioperasikan dari jarak jauh, jauh lebih sedikit daripada pendekatan serupa yang seringkali membutuhkan ribuan jam demonstrasi spesifik. Efisiensi ini tidak hanya menggarisbawahi kecanggihan teknis sistem tetapi juga kelayakan ekonominya untuk aplikasi komersial.

Pemrosesan berkemampuan tertanam

Berbeda dengan banyak sistem AI robotika yang bergantung pada server eksternal yang canggih, Helix sepenuhnya berjalan pada GPU tertanam yang hemat energi di dalam robot. Pemrosesan internal ini menghilangkan kebutuhan akan koneksi konstan ke sumber daya komputasi eksternal, sehingga membuat robot lebih otonom dan fleksibel di berbagai lingkungan.

Diferensiasi strategis

Integrasi vertikal sebagai pengganti model AI generik

Figure AI secara strategis membedakan dirinya dari perusahaan lain dengan mengakhiri kolaborasinya dengan OpenAI dan mengejar strategi terintegrasi vertikal, mengembangkan perangkat keras dan perangkat lunak secara internal. CEO Brett Adcock menjelaskan bahwa model AI generik tidak cukup untuk memenuhi persyaratan AI yang terwujud—yaitu, AI dalam robot fisik. Keputusan ini menggarisbawahi pendekatan perusahaan dalam mengembangkan solusi yang disesuaikan untuk tantangan spesifik robotika, daripada bergantung pada model AI umum.

Orientasi aplikasi

Fokus pada penggunaan rumah tangga

Sementara banyak pelaku industri saat ini berfokus pada aplikasi robot industri atau tempat kerja, Figure AI mengejar pendekatan strategis yang mengejutkan dengan Helix, yang berfokus pada robot rumah tangga. Kemampuan robot untuk melakukan tugas sehari-hari seperti memilah bahan makanan, mengisi lemari es, atau menangani berbagai macam barang rumah tangga menargetkan pasar yang sering dianggap terlalu kompleks untuk dimasuki oleh pemain lain.

Koordinasi multi-robot: Kunci menuju generasi robotika selanjutnya

Helix menonjol dari sistem robotika AI lainnya karena arsitektur sistem ganda, kemampuan kontrol yang komprehensif, kemampuan generalisasi yang luar biasa, dan koordinasi multi-robot. Dengan proses pelatihan yang efisien, pemrosesan terintegrasi, dan fokus strategis pada aplikasi rumah tangga, Helix mewakili kemajuan signifikan dalam pengembangan robot humanoid. Sementara sistem lain, seperti RT-2 dari Google DeepMind, mengejar pendekatan serupa dengan menggabungkan data visual dan perintah suara, Helix menawarkan keunggulan yang berbeda melalui arsitektur unik dan pendekatan pengembangan terintegrasi, menjadikannya pelopor dalam generasi robot bertenaga AI berikutnya.

Kami hadir untuk Anda - Konsultasi - Perencanaan - Implementasi - Manajemen Proyek

☑️ Dukungan UKM dalam strategi, konsultasi, perencanaan, dan implementasi

☑️ Pembuatan atau penyesuaian kembali strategi digital dan digitalisasi

☑️ Perluasan dan optimalisasi proses penjualan internasional

☑️ Platform perdagangan B2B global & digital

☑️ Pengembangan Bisnis Perintis

Konrad Wolfenstein

Saya akan dengan senang hati menjadi penasihat pribadi Anda.

Anda dapat menghubungi saya dengan mengisi formulir kontak di bawah ini atau cukup hubungi saya di +49 7348 4088 965 .

Saya sangat menantikan proyek bersama kita.

Tulis surat kepadaku

➡️ Permintaan panggilan video 👩👱

Xpert.Digital - Konrad Wolfenstein

Xpert.Digital adalah pusat bagi industri yang berfokus pada digitalisasi, teknik mesin, logistik/intralogistik, dan fotovoltaik.

Dengan solusi Pengembangan Bisnis 360° kami, kami mendukung perusahaan-perusahaan ternama mulai dari bisnis baru hingga layanan purna jual.

Intelijen pasar, smarketing, otomatisasi pemasaran, pengembangan konten, PR, kampanye email, media sosial yang dipersonalisasi, dan pembinaan prospek adalah bagian dari alat digital kami.

Anda dapat menemukan informasi lebih lanjut di: www.xpert.digital - www.xpert.solar - www.xpert.plus

Tetaplah berhubungan

Helix: Sistem AI yang membawa robot humanoid ke level baru

Ringkasan: Penglihatan, bahasa, gerakan: Helix sebagai tonggak sejarah dalam robotika

Kemampuan Helix

Detail teknis

Pesaing terbesar

Google DeepMind

Meta

Apel

OpenAI

🎯🎯🎯 Manfaatkan keahlian Xpert.Digital yang luas dan mencakup lima bidang dalam satu paket layanan komprehensif | Pengembangan Bisnis, Penelitian & Pengembangan, XR, Humas & Optimalisasi Visibilitas Digital

Helix: Perbedaan dibandingkan dengan sistem AI lainnya untuk robot

Model VLA inovatif: Helix menggabungkan persepsi, bahasa, dan gerakan

Arsitektur sistem ganda yang unik

Sistem 1 dan Sistem 2: Kecerdasan yang saling melengkapi

Kemampuan kontrol yang komprehensif

Kontrol atas 35 derajat kebebasan

Generalisasi dan pembelajaran objek

Pengenalan objek universal tanpa pelatihan khusus

Koordinasi multi-robot

Keterampilan kolaborasi yang unik

Efisiensi dan implementasi pelatihan

Persyaratan pelatihan minimal, kinerja maksimal

Pemrosesan berkemampuan tertanam

Diferensiasi strategis

Integrasi vertikal sebagai pengganti model AI generik

Orientasi aplikasi

Fokus pada penggunaan rumah tangga

Koordinasi multi-robot: Kunci menuju generasi robotika selanjutnya

☑️ Dukungan UKM dalam strategi, konsultasi, perencanaan, dan implementasi

☑️ Pembuatan atau penyesuaian kembali strategi digital dan digitalisasi

☑️ Perluasan dan optimalisasi proses penjualan internasional

☑️ Platform perdagangan B2B global & digital

☑️ Pengembangan Bisnis Perintis

Topik lainnya