
Figure AI'nin insansı robotlar için geliştirdiği yapay zeka sistemi "Helix" – Görsel-Dil-Eylem (VLA) modeli – Resim: Xpert.Digital
Helix: İnsansı robotları yeni bir seviyeye taşıyan yapay zeka sistemi
Özet: Görme, dil, hareket: Robotikte bir dönüm noktası olarak Helix
Helix, Figure AI tarafından geliştirilen insansı robotlar için yenilikçi bir yapay zeka sistemidir. Görsel algılama, konuşma anlama ve hassas motor kontrolünü tek bir sistemde birleştiren bir Görsel-Dil-Eylem (VLA) modelidir. Helix, evler gibi yapılandırılmamış ortamlar için esnek robotik sistemlerin geliştirilmesinde önemli bir ilerlemeyi temsil etmektedir. Önceden eğitim almadan karmaşık görevleri yerine getirme yeteneğiyle, insan-makine etkileşiminde devrim yaratabilir.
İçin uygun:
- Sesle kontrol edilen robotlar: Figure AI'nin Helix'i her şeyi değiştiriyor! Endüstri, ev, gelecek – gerçek zamanlı olarak anlayın, öğrenin, uygulayın.
Helix'in yetenekleri
- İnsan benzeri robotların üst gövdesinin tamamının, 35 hareket ekseni de dahil olmak üzere, gerçek zamanlı kontrolü.
- Karmaşık görevleri gerçekleştirmek için konuşma girdisinin ve görsel bilgilerin işlenmesi.
- Özel bir eğitim almadan bilinmeyen nesneleri tanıma ve işleme
- Görevlerin yerine getirilmesinde birden fazla robot arasında işbirliği
- Buzdolabını doldurmak gibi ev işlerini yapmak
Teknik detaylar
İki ana bileşenden oluşmaktadır:
- 7 milyar parametreli (7-9 Hz) çok modlu bir dil modeli
- 80 milyon parametreye sahip (200 Hz) hareket yapay zekası
- Sadece 500 saatlik gözetimli eğitimle yetiştirildi.
- Enerji tasarruflu gömülü GPU'lar üzerinde çalışır.
En büyük rakipler
- Google DeepMind: RT-2'ye benzer VLA modelleri geliştiriyor
- Meta: Gelişmiş insansı robotlar üzerinde çalışıyoruz.
- Apple: Gelişmiş yapay zekâ insansı robotlar geliştirme yarışında o da yer alıyor.
- OpenAI: Figure AI'nin eski ortağı, şimdi yapay zeka geliştirme alanında bir rakip.
Google DeepMind
Google DeepMind, çığır açan bir görme-dil-eylem (VLA) modeli olan RT-2'yi (Robotik Dönüştürücü 2) tanıttı. RT-2, internetteki metin ve görüntü verilerinden kavramlar öğrenerek ve bunları robotik eylemlere dönüştürerek robotların özel bir eğitime ihtiyaç duymadan yeni görevler gerçekleştirmesini sağlıyor. Testlerde, RT-2, selefi RT-1'e kıyasla yeni görevlerde önemli ölçüde daha iyi performans gösterdi.
İçin uygun:
- Google Project Mariner: Tarayıcı uzantısı olarak deneysel yapay zeka aracısı – DeepMind teknolojisiyle otonom web navigasyonu
Meta
Meta, yapay zekâ destekli insansı robotların geliştirilmesine büyük yatırımlar yapıyor. Şirket, Reality Labs bölümü bünyesinde, tüketicilere yönelik robotların araştırma ve geliştirilmesine odaklanan yeni bir ekip kurdu. Meta, diğer üreticiler tarafından da kullanılabilecek yapay zekâ sistemleri, sensörler ve yazılım platformları geliştirmeyi planlıyor.
Elma
Apple, hem insansı hem de insansı olmayan robot tasarımlarını da araştırıyor. Ancak şirket, geliştirme sürecinin henüz başlarında. Analist Ming-Chi Kuo, seri üretimin en erken 2028 yılına kadar mümkün olmayacağını öngörüyor. Apple özellikle insan-robot etkileşimine odaklanıyor.
İçin uygun:
- Apple'ı robot çılgınlığı mı sardı? İş ilanları Apple'ın robot atağını ortaya koyuyor: Teknoloji devi şimdi de ev aletleri pazarına mı saldırıyor?
OpenAI
Figure AI'nin eski ortağı OpenAI, kendi robotik bölümünü kuruyor ve gerçek dünyada yapay zekanın somutlaşmış hali olarak robotlara odaklanıyor. Şirket artık robotik alanında yapay zeka geliştirme konusunda Google DeepMind ve diğerleriyle doğrudan rekabet ediyor.
🎯🎯🎯 Xpert.Digital'in kapsamlı bir hizmet paketinde sunduğu beş katlı uzmanlığın avantajlarından yararlanın | İş Geliştirme, Ar-Ge, XR, Halkla İlişkiler ve Dijital Görünürlük Optimizasyonu
Xpert.Digital'in kapsamlı bir hizmet paketinde sunduğu beş katlı uzmanlığından yararlanın | Ar-Ge, XR, PR ve Dijital Görünürlük Optimizasyonu - Görsel: Xpert.Digital
Xpert.Digital, çeşitli endüstriler hakkında derinlemesine bilgiye sahiptir. Bu, spesifik pazar segmentinizin gereksinimlerine ve zorluklarına tam olarak uyarlanmış, kişiye özel stratejiler geliştirmemize olanak tanır. Pazar trendlerini sürekli analiz ederek ve sektördeki gelişmeleri takip ederek öngörüyle hareket edebilir ve yenilikçi çözümler sunabiliriz. Deneyim ve bilginin birleşimi sayesinde katma değer üretiyor ve müşterilerimize belirleyici bir rekabet avantajı sağlıyoruz.
Bununla ilgili daha fazla bilgiyi burada bulabilirsiniz:
Helix: Robotlar için diğer yapay zeka sistemlerine kıyasla farklılıkları
Yenilikçi VLA modeli: Helix algıyı, dili ve hareketi birleştiriyor.
Figure AI'nin yakın zamanda piyasaya sürdüğü Helix, robotik yapay zeka alanında önemli bir ilerlemeyi işaret ediyor. Bu yenilikçi Görsel-Dil-Eylem (VLA) modeli, çığır açan birçok özelliğiyle mevcut sistemlerden ayrışarak insansı robotların kontrolü için yeni standartlar belirliyor. Helix, görsel algılama, konuşma anlama ve hassas hareket kontrolünü, fiziksel robotik alanındaki zorlukların üstesinden gelmek için özel olarak tasarlanmış tek bir sisteme entegre ediyor.
Benzersiz çift sistem mimarisi
Helix ile diğer robot yapay zekâ sistemleri arasındaki belki de en önemli fark, yenilikçi iki bileşenli mimarisinde yatmaktadır. Bu çift sistemli yapı, robotik yapay zekâsında temel bir sorunu çözmektedir.
Sistem 1 ve Sistem 2: Tamamlayıcı bir zekâ
Geleneksel yaklaşımların aksine, Helix, evrensellik ve hız arasında benzersiz bir denge sağlayan iki tamamlayıcı sistem kullanır. Sistem 2 (S2), 7-9 Hz frekansında çalışan ve robotun analitik "beyni" olarak işlev gören, 7 milyar parametreye sahip çok modlu bir dil modelidir. Görsel verileri ve konuşma komutlarını işler, çevreyi yorumlar ve hangi eylemlerin gerçekleştirileceğine karar verir.
Bunu tamamlayan, 80 milyon parametreye sahip hızlı ve tepkisel bir görsel-motor kontrol ünitesi olan Sistem 1 (S1)'dir. Bu bileşen, S2 tarafından sağlanan anlamsal bilgiyi, etkileyici bir frekans olan 200 Hz'de hassas ve sürekli robot hareketlerine dönüştürür. Şekil AI, önceki yaklaşımların evrensellik veya hız eksikliği nedeniyle başarısız olduğunu açıklıyor: “Görsel Büyük Dil Modeli (VLM) kullanmak evrenseldir ancak hızlı değildir ve robotlar için görsel hareket stratejileri kullanmak hızlıdır ancak evrensel değildir.” Helix, ikili yapısı sayesinde bu ikiliği aşmaktadır.
Bu mimari, görsel verileri ve sesli komutları birleştiren ancak benzer şekilde iki parçaya ayrılmamış olan Google DeepMind'ın RT-2'si gibi diğer bilinen VLA modellerinden temel olarak farklıdır.
İçin uygun:
- Google AI Studio ile Google'ın Gemini platformu, Gemini Advanced ve Google DeepMind ile Google Deep Research
Kapsamlı kontrol yetenekleri
35 serbestlik derecesi üzerinde kontrol
Helix'in bir diğer ayırt edici özelliği, 35 serbestlik derecesini aynı anda koordine edebilme yeteneğidir. Bu kapsamlı kontrol, bilekler, gövde, kafa ve tek tek parmaklar da dahil olmak üzere tüm insansı üst vücudun hassas ve yüksek hızlı manipülasyonuna olanak tanır. Bu kontrol yeteneği, mevcut sistemlerin çoğunu geride bırakır ve yüksek düzeyde ince motor becerileri gerektiren karmaşık manipülasyon görevlerini mümkün kılar.
Nesne genellemesi ve öğrenme
Özel eğitim gerektirmeyen evrensel nesne tanıma
Helix'in en önemli özelliklerinden biri, belirli özelliklerine dair önceden eğitim almadan neredeyse her türlü küçük ev eşyasını tanıyıp işleyebilmesidir. Bu geniş genelleştirilebilirlik, sistemin farklı şekil, boyut, renk ve malzeme özelliklerine sahip binlerce nesneyi işleyebilmesini sağlar.
Diğer birçok yapay zekâ robot sisteminin aksine, her yeni görev veya nesne türü için yeniden programlanması veya eğitilmesi gerekmeyen Helix, farklı durumlara uyum sağlayabilir ve doğal dil komutlarına yanıt verebilir. Bu, bir paradigma değişimini temsil eder, çünkü sistem, göreve özgü ince ayar yapmadan, nesneleri alıp bırakmak, çekmeceleri ve buzdolaplarını kullanmak ve diğer robotlarla etkileşim kurmak gibi tüm davranışları öğrenmek için tek bir sinir ağı kullanır.
Çoklu robot koordinasyonu
Eşsiz iş birliği becerileri
Helix, aynı anda iki robotu kontrol edebilen ve iş birliği yapmalarını sağlayan ilk VLA modelidir. Bu özellik, robotların nesneleri geçirme ve hareketlerini koordine etme gibi karmaşık görevleri birlikte çözmelerini sağlar. Özellikle dikkat çekici olan, robotlar arasında baş sallama ve göz teması yoluyla gerçekleşen neredeyse insan benzeri iletişimdir.
Bu koordinasyon biçimi, her robotun genellikle ayrı ayrı kontrol edildiği veya belirli roller için özel eğitim gerektirdiği geleneksel sistemlere göre önemli bir ilerlemeyi temsil eder. Helix ile her iki robot da bireysel ayarlamalara gerek kalmadan aynı model ağırlıklarını kullanır.
Eğitim verimliliği ve uygulaması
Minimum eğitim gereksinimleri, maksimum performans
Bir diğer önemli fark, eğitim sürecinin olağanüstü verimliliğinde yatmaktadır. Helix, yalnızca 500 saatlik yüksek kaliteli, uzaktan kumandalı eğitim verisi kullanılarak geliştirilmiştir; bu, genellikle binlerce saatlik özel gösterim gerektiren benzer yaklaşımlara kıyasla önemli ölçüde daha azdır. Bu verimlilik, sistemin teknik gelişmişliğini vurgulamakla kalmaz, aynı zamanda ticari uygulamalar için ekonomik uygulanabilirliğini de ortaya koymaktadır.
Gömülü sistem işleme yeteneğine sahip
Güçlü harici sunuculara dayanan birçok robotik yapay zeka sisteminin aksine, Helix tamamen robotların içindeki yerleşik, enerji verimli GPU'lar üzerinde çalışır. Bu yerleşik işlem, harici bilgi işlem kaynaklarına sürekli bağlantı ihtiyacını ortadan kaldırarak robotu farklı ortamlarda daha otonom ve esnek hale getirir.
Stratejik farklılaşma
Genel yapay zeka modelleri yerine dikey entegrasyon
Figure AI, OpenAI ile olan iş birliğini sonlandırarak ve hem donanım hem de yazılımı şirket içinde geliştirerek dikey entegre bir strateji izleyerek diğer şirketlerden stratejik olarak farklılaştı. CEO Brett Adcock, genel yapay zeka modellerinin, somutlaştırılmış yapay zeka yani fiziksel robotlardaki yapay zekanın gereksinimlerini karşılamak için yetersiz olduğunu açıkladı. Bu karar, şirketin genel yapay zeka modellerine güvenmek yerine, robotik alanındaki özel zorluklara yönelik özel çözümler geliştirme yaklaşımının altını çiziyor.
Başvuru odaklılık
Ev kullanımına odaklanın
Birçok sektör oyuncusu şu anda endüstriyel veya iş yeri robot uygulamalarına odaklanırken, Figure AI, Helix ile stratejik olarak şaşırtıcı bir yaklaşım izleyerek ev robotlarına odaklanıyor. Robotların market alışverişini sıralamak, buzdolabını doldurmak veya çok çeşitli ev eşyalarını taşımak gibi günlük görevleri yerine getirme yeteneği, diğer oyuncuların girmeyi çok karmaşık bulduğu bir pazarı hedefliyor.
Çoklu robot koordinasyonu: Yeni nesil robotik teknolojisinin anahtarı
Helix, çift sistem mimarisi, kapsamlı kontrol yetenekleri, olağanüstü genelleme kabiliyeti ve çoklu robot koordinasyonu sayesinde diğer yapay zekâ robot sistemlerinden öne çıkıyor. Verimli eğitim süreci, gömülü işlemcisi ve ev uygulamalarına stratejik odaklanmasıyla, insansı robotların geliştirilmesinde önemli bir ilerlemeyi temsil ediyor. Google DeepMind'ın RT-2'si gibi diğer sistemler görsel verileri ve sesli komutları birleştirme konusunda benzer yaklaşımlar izlerken, Helix benzersiz mimarisi ve entegre geliştirme yaklaşımıyla farklılaştırıcı avantajlar sunarak, yeni nesil yapay zekâ destekli robotlarda öncü bir rol üstleniyor.
Sizin için oradayız - tavsiye - planlama - uygulama - proje yönetimi
☑️ Strateji, danışmanlık, planlama ve uygulama konularında KOBİ desteği
☑️ Dijital stratejinin ve dijitalleşmenin oluşturulması veya yeniden düzenlenmesi
☑️ Uluslararası satış süreçlerinin genişletilmesi ve optimizasyonu
☑️ Küresel ve Dijital B2B ticaret platformları
☑️ Öncü İş Geliştirme
Kişisel danışmanınız olarak hizmet etmekten mutluluk duyarım.
Aşağıdaki iletişim formunu doldurarak benimle iletişime geçebilir veya +49 89 89 674 804 (Münih) .
Ortak projemizi sabırsızlıkla bekliyorum.
Xpert.Digital - Konrad Wolfenstein
Xpert.Digital, dijitalleşme, makine mühendisliği, lojistik/intralojistik ve fotovoltaik konularına odaklanan bir endüstri merkezidir.
360° iş geliştirme çözümümüzle, tanınmış firmalara yeni işlerden satış sonrasına kadar destek veriyoruz.
Pazar istihbaratı, pazarlama, pazarlama otomasyonu, içerik geliştirme, halkla ilişkiler, posta kampanyaları, kişiselleştirilmiş sosyal medya ve öncü yetiştirme dijital araçlarımızın bir parçasıdır.
Daha fazla bilgiyi şu adreste bulabilirsiniz: www.xpert.digital - www.xpert.solar - www.xpert.plus

