Рисунок Робототехніка на основі штучного інтелекту Система штучного інтелекту "Helix" для гуманоїдних роботів – модель зору-мовлення-дії (VLA)

Konrad Wolfenstein

1 рік тому

Рисунок Робототехніка на основі штучного інтелекту Система штучного інтелекту "Helix" для гуманоїдних роботів – модель Vision-Language-Action (VLA) – Зображення: Xpert.Digital

Helix: Система штучного інтелекту, яка виводить людиноподібних роботів на новий рівень

Короткий зміст: Зір, мова, рух: Helix як віха в робототехніці

Helix — це інноваційна система штучного інтелекту для гуманоїдних роботів, розроблена компанією Figure AI. Це модель «Зір-Мова-Дія» (VLA), яка поєднує візуальне сприйняття, розуміння мовлення та точне керування двигуном в одній системі. Helix знаменує собою значний прогрес у розробці гнучких роботизованих систем для неструктурованих середовищ, таких як будинки. Завдяки своїй здатності виконувати складні завдання без попереднього навчання, вона може революціонізувати взаємодію людини з машиною.

Пов'язано з цим:

Голосове керування роботами: Helix від Figure. Штучний інтелект змінює все! Промисловість, домогосподарство, майбутнє – розумійте, навчайтеся, виконуйте в режимі реального часу

Здібності Хелікса

Керування всією верхньою частиною тіла гуманоїдних роботів у режимі реального часу, включаючи 35 осей руху
Обробка мовленнєвого вводу та візуальної інформації для виконання складних завдань
Розпізнавання та поводження з невідомими об'єктами без спеціальної підготовки
Співпраця між кількома роботами під час виконання завдань
Виконання домашніх справ, таких як заповнення холодильника

Технічні деталі

Складається з двох основних компонентів:

Мультимодальна мовна модель із 7 мільярдами параметрів (7-9 Гц)
Штучний інтелект руху з 80 мільйонами параметрів (200 Гц)

Пройшов лише 500 годин навчання під наглядом
Працює на енергоефективних вбудованих графічних процесорах

Найбільші конкуренти

Google DeepMind: Розробка моделей VLA, подібних до RT-2
Мета: Робота над передовими гуманоїдними роботами
Apple: Також у гонці за розробку передових гуманоїдів зі штучним інтелектом
OpenAI: Колишній партнер Figure AI, тепер конкурент у сфері розробки штучного інтелекту

Google DeepMind

Компанія Google DeepMind представила RT-2 (Robotics Transformer 2) – новаторську модель зорово-мовно-дієвої системи (VLA). RT-2 дозволяє роботам виконувати нові завдання без спеціального навчання, вивчаючи концепції з текстових та графічних даних в Інтернеті та перетворюючи їх на роботизовані дії. У тестах RT-2 продемонстрував значно покращену продуктивність у виконанні нових завдань порівняно зі своїм попередником, RT-1.

Пов'язано з цим:

Google Project Mariner: Експериментальний агент штучного інтелекту як розширення для браузера – Автономна веб-навігація з технологією DeepMind

Мета

Meta значно інвестує в розробку людиноподібних роботів на базі штучного інтелекту. Компанія створила нову команду у своєму підрозділі Reality Labs, яка зосереджується на дослідженні та розробці роботів для споживачів. Meta планує розробляти системи, датчики та програмні платформи зі штучним інтелектом, які також можуть використовувати інші виробники.

Яблуко

Apple також досліджує можливості розробки як гуманоїдних, так і негуманоїдних роботів. Однак компанія все ще перебуває на ранній стадії розробки. Аналітик Мін-Чі Куо прогнозує, що масове виробництво буде можливим не раніше 2028 року. Apple зосереджується, зокрема, на взаємодії людини та робота.

Пов'язано з цим:

Чи охопила Apple лихоманка роботів? Оголошення про вакансії розкривають наступ роботів Apple: Чи атакує технологічний гігант зараз ринок побутової техніки?

OpenAI

OpenAI, колишній партнер Figure AI, створює власний підрозділ робототехніки та зосереджується на роботах як втіленні штучного інтелекту в реальному світі. Зараз компанія безпосередньо конкурує з Google DeepMind та іншими у сфері розробки штучного інтелекту для робототехніки.

🎯🎯🎯 Скористайтеся перевагами великого, п'ятикратного досвіду Xpert.Digital в одному комплексному пакеті послуг | Розробка бізнес-аналітики, дослідження та розробки, XR, зв'язки з громадськістю та оптимізація цифрової видимості

Скористайтеся перевагами великого, п'ятикратного досвіду Xpert.Digital у комплексному пакеті послуг | Дослідження та розробки, XR, PR та оптимізація цифрової видимості - Зображення: Xpert.Digital

Xpert.Digital має глибокі знання в різних галузях. Це дозволяє нам розробляти індивідуальні стратегії, точно узгоджені з вимогами та викликами вашого конкретного сегмента ринку. Завдяки постійному аналізу ринкових тенденцій та моніторингу розвитку галузі ми можемо діяти проактивно та пропонувати інноваційні рішення. Поєднання досвіду та знань створює додаткову цінність та надає нашим клієнтам вирішальну конкурентну перевагу.

Більше інформації тут:

Скористайтеся перевагами 5 галузей експертизи Xpert.Digital в одному пакеті – від €500/місяць

Helix: Відмінність від інших систем штучного інтелекту для роботів

Інноваційна модель VLA: Helix поєднує сприйняття, мову та рух

Нещодавній запуск Helix компанією Figure AI знаменує собою значний прогрес у сфері штучного інтелекту для робототехніки. Ця інноваційна модель Vision-Language-Action (VLA) відрізняється від існуючих систем кількома новаторськими функціями, встановлюючи нові стандарти для керування гуманоїдними роботами. Helix інтегрує візуальне сприйняття, розуміння мовлення та точне керування рухами в єдину систему, спеціально розроблену для вирішення проблем фізичної робототехніки.

Унікальна двосистемна архітектура

Мабуть, найважливіша відмінність Helix від інших систем штучного інтелекту для роботів полягає в його інноваційній двокомпонентній архітектурі. Ця двосистемна структура вирішує фундаментальну проблему штучного інтелекту в робототехніці.

Система 1 та Система 2: Доповнюючий інтелект

На відміну від традиційних підходів, Helix використовує дві взаємодоповнюючі системи, які разом досягають унікального балансу між універсальністю та швидкістю. Система 2 (S2) — це мультимодальна мовна модель із 7 мільярдами параметрів, що працює на частоті 7-9 Гц і функціонує як аналітичний «мозок» робота. Вона обробляє візуальні дані та голосові команди, інтерпретує середовище та вирішує, які дії виконувати.

Доповнює це Система 1 (S1) – швидкий, реактивний візуально-моторний блок керування з 80 мільйонами параметрів. Цей компонент перетворює семантичну інформацію, що надається S2, на точні, безперервні дії робота з вражаючою частотою 200 Гц. На рисунку AI пояснюється, що попередні підходи зазнали невдачі через брак універсальності або швидкості: «Використання VLM (візуальної великої мовної моделі) є універсальним, але не швидким, а використання візуальних стратегій руху для роботів є швидким, але не універсальним». Helix долає цю дихотомію завдяки своїй подвійній структурі.

Ця архітектура принципово відрізняється від інших відомих моделей VLA, таких як RT-2 від Google DeepMind, яка також поєднує візуальні дані та голосові команди, але не має порівнянного поділу на дві частини.

Пов'язано з цим:

Платформа Google Gemini з Google AI Studio, Google Deep Research з Gemini Advanced та Google DeepMind

Комплексні можливості керування

Контроль над 35 ступенями свободи

Ще однією відмінною рисою Helix є його здатність координувати 35 ступенів свободи одночасно. Таке комплексне керування дозволяє точно та високошвидкісно маніпулювати всією верхньою частиною тіла гуманоїда, включаючи зап'ястя, тулуб, голову та окремі пальці. Ця здатність керування перевершує більшість існуючих систем і дозволяє виконувати складні маніпуляційні завдання, що вимагають високого ступеня дрібної моторики.

Узагальнення та навчання об'єктів

Універсальне розпізнавання об'єктів без спеціального навчання

Ключовою особливістю Helix є її здатність розпізнавати та обробляти практично будь-який невеликий побутовий предмет без попереднього навчання його специфічним характеристикам. Ця широка узагальнюваність дозволяє системі обробляти тисячі об'єктів різних форм, розмірів, кольорів та властивостей матеріалів.

На відміну від багатьох інших робототехнічних систем зі штучним інтелектом, які потрібно перепрограмовувати або перенавчати для кожного нового завдання чи типу об'єкта, Helix може адаптуватися до різних ситуацій та реагувати на команди природною мовою. Це являє собою зміну парадигми, оскільки система використовує єдину нейронну мережу для вивчення всіх моделей поведінки, таких як піднімання та опускання предметів, використання шухляд і холодильників, а також взаємодія з іншими роботами, без точного налаштування для кожного конкретного завдання.

Координація роботи кількох роботів

Унікальні навички співпраці

Helix — це перша модель VLA, здатна одночасно керувати двома роботами та забезпечувати їм співпрацю. Ця здатність дозволяє роботам спільно вирішувати складні завдання, пов'язані з передачею об'єктів та координацією їхніх рухів. Особливої уваги заслуговує майже людська комунікація між роботами за допомогою кивання головою та зорового контакту.

Така форма координації являє собою значний прогрес у порівнянні з традиційними системами, де кожен робот зазвичай керується індивідуально або потребує спеціального навчання для виконання певних ролей. З Helix обидва роботи використовують однакові модельні ваги без необхідності індивідуального налаштування.

Ефективність та впровадження навчання

Мінімальні вимоги до навчання, максимальна продуктивність

Ще одна ключова відмінність полягає у вражаючій ефективності навчального процесу. Helix було розроблено з використанням лише 500 годин високоякісних даних для дистанційного навчання, що значно менше, ніж у порівнянних підходах, які часто вимагають тисяч годин спеціальних демонстрацій. Така ефективність не лише підкреслює технічну досконалість системи, але й її економічну життєздатність для комерційного застосування.

Вбудована обробка

На відміну від багатьох робототехнічних систем зі штучним інтелектом, які залежать від потужних зовнішніх серверів, Helix працює повністю на вбудованих енергоефективних графічних процесорах у роботах. Така вбудована обробка усуває необхідність постійного підключення до зовнішніх обчислювальних ресурсів, роблячи робота більш автономним та гнучким у різних середовищах.

Стратегічна диференціація

Вертикальна інтеграція замість універсальних моделей штучного інтелекту

Компанія Figure AI стратегічно відмежувалася від інших компаній, припинивши співпрацю з OpenAI та перейшовши на вертикально інтегровану стратегію, розробляючи як апаратне, так і програмне забезпечення власними силами. Генеральний директор Бретт Адкок пояснив, що загальних моделей ШІ недостатньо для задоволення вимог втіленого ШІ, тобто ШІ у фізичних роботах. Це рішення підкреслює підхід компанії до розробки індивідуальних рішень для конкретних завдань робототехніки, а не до покладання на загальні моделі ШІ.

Орієнтація на застосування

Зосередьтеся на побутовому використанні

Хоча багато гравців галузі зараз зосереджуються на застосуванні роботів у промисловості або на робочих місцях, Figure AI застосовує стратегічно несподіваний підхід із Helix, зосереджуючись на побутовій робототехніці. Здатність роботів виконувати повсякденні завдання, такі як сортування продуктів, заповнення холодильника або робота з широким спектром предметів домашнього вжитку, спрямована на ринок, який інші гравці часто вважають занадто складним для виходу.

Координація роботи кількох роботів: ключ до наступного покоління робототехніки

Helix виділяється серед інших робототехнічних систем на базі штучного інтелекту завдяки своїй двосистемній архітектурі, комплексним можливостям керування, чудовій здатності до узагальнення та координації роботи кількох роботів. Завдяки ефективному процесу навчання, вбудованій обробці даних та стратегічній спрямованості на побутові застосування, вона є значним кроком у розвитку гуманоїдних роботів. У той час як інші системи, такі як RT-2 від Google DeepMind, використовують аналогічні підходи до поєднання візуальних даних та голосових команд, Helix пропонує відмінні переваги завдяки своїй унікальній архітектурі та інтегрованому підходу до розробки, що робить її піонером у наступному поколінні роботів на базі штучного інтелекту.

Ми тут для вас - Консалтинг - Планування - Впровадження - Управління проектами

☑️ Підтримка МСП у стратегії, консалтингу, плануванні та впровадженні

☑️ Створення або переорієнтація цифрової стратегії та діджиталізації

☑️ Розширення та оптимізація процесів міжнародних продажів

☑️ Глобальні та цифрові торгові платформи B2B

☑️ Розвиток бізнесу Pioneer

Konrad Wolfenstein

Я буду радий служити вашим особистим консультантом.

Ви можете зв'язатися зі мною, заповнивши контактну форму нижче, або просто зателефонувавши мені за номером +49 7348 4088 965 .

Я з нетерпінням чекаю нашого спільного проєкту.

Напиши мені

➡️ Запит на відеодзвінок 👩👱

Xpert.Digital - Konrad Wolfenstein

Xpert.Digital – це галузевий центр, що спеціалізується на цифровізації, машинобудуванні, логістиці/інтралогістиці та фотоелектричній енергетиці.

Завдяки нашому комплексному рішенню для розвитку бізнесу на 360° ми підтримуємо відомі компанії, починаючи від нового бізнесу і закінчуючи післяпродажним обслуговуванням.

Ринкова аналітика, маркетинг, автоматизація маркетингу, розробка контенту, PR, поштові кампанії, персоналізовані соціальні мережі та підтримка лідів – це частина наших цифрових інструментів.

Більше інформації можна знайти за адресами: www.xpert.digital - www.xpert.solar - www.xpert.plus

Залишайтеся на зв'язку

Helix: Система штучного інтелекту, яка виводить людиноподібних роботів на новий рівень

Короткий зміст: Зір, мова, рух: Helix як віха в робототехніці

Здібності Хелікса

Технічні деталі

Найбільші конкуренти

Google DeepMind

Мета

Яблуко

OpenAI

Helix: Відмінність від інших систем штучного інтелекту для роботів

Інноваційна модель VLA: Helix поєднує сприйняття, мову та рух

Унікальна двосистемна архітектура

Система 1 та Система 2: Доповнюючий інтелект

Комплексні можливості керування

Контроль над 35 ступенями свободи

Узагальнення та навчання об'єктів

Універсальне розпізнавання об'єктів без спеціального навчання

Координація роботи кількох роботів

Унікальні навички співпраці

Ефективність та впровадження навчання

Мінімальні вимоги до навчання, максимальна продуктивність

Вбудована обробка

Стратегічна диференціація

Вертикальна інтеграція замість універсальних моделей штучного інтелекту

Орієнтація на застосування

Зосередьтеся на побутовому використанні

Координація роботи кількох роботів: ключ до наступного покоління робототехніки

☑️ Підтримка МСП у стратегії, консалтингу, плануванні та впровадженні

☑️ Створення або переорієнтація цифрової стратегії та діджиталізації

☑️ Розширення та оптимізація процесів міжнародних продажів

☑️ Глобальні та цифрові торгові платформи B2B

☑️ Розвиток бізнесу Pioneer

Інші теми