Вибір голосу 📢


Гуманоїдський стоячий контроль: Навчіться вставати з «господарями» гуманоїдів-прорив для роботів у повсякденному житті

Опубліковано: 18 березня 2025 р. / Оновлення з: 18 березня 2025 р. - Автор: Конрад Вольфенштейн

Гуманоїдне стоячий контроль: Навчіться вставати з господарями-гуманоїдами-прорив для роботів у повсякденному житті

Гуманоїдне стоячий контроль: Навчання вставати з господарями-прорив для роботів у повсякденному житті: гуманоїд-standup.github.io

Більше, ніж просто вставати: хост прокладає шлях для автономних та універсальних гуманоїдних роботів

Від моделювання до реальності: як господар -гуманоїдні роботи вчать самостійного

У захоплюючому світі гуманоїдної робототехніки, в якій машини імітують все більше і більше людських здібностей, очевидно, проста, але принципово важлива майстерність - це центральна роль: вставання. Це, звичайно, для нас, люди, несвідомий рух, який ми проводимо незліченну кількість разів щодня. Але для гуманоїдного робота вставання - це складний виклик, який вимагає взаємодії складного контролю, точних датчиків та інтелектуальних алгоритмів. Однак ця здатність є не лише вражаючою демонстрацією інженерного мистецтва, але й важливою необхідною умовою для гуманоїдних роботів знаходить своє місце в нашому повсякденному житті і може підтримувати нас у різних сферах відповідальності.

Вставати з різних позицій - це набагато більше, ніж просто приємна додаткова функція. Це основа для самостійності та універсальності гуманоїдних роботів. Уявіть, що робот повинен допомогти вам у домогосподарстві, допомогти в догляді чи роботі в небезпечних умовах. У всіх цих сценаріях здатність налаштувати незалежно з різних місць має вирішальне значення. Робот, який працює лише в ідеальних вихідних позиціях і залишається безпорадним при падінні, просто непридатний у реальному світі. Тому розвиток стратегій надійної та універсальної стратегій є ключовим кроком для вивезення гуманоїдних роботів з дослідницької лабораторії до реального світу.

Попередні підходи до вирішення цієї проблеми часто досягали своїх меж. Багато хто базувався на наполегливо попередньо запрограмованих рухах, які працювали в контрольованих умовах, але швидко досягли своїх меж у непередбачуваній реальності. Ці жорсткі системи були негнучкими, не могли адаптуватися до змінних умов і нещасно провалюються, коли робот приземлився в несподіване положення або був на нерівних поверхнях. Інші підходи покладаються на складні середовища моделювання, результати яких часто було важко перенести на реальних роботів. Стрибок від моделювання до реальності, так званий "SIM-TEREAL TARNEAL", виявився спотиканням багатьох перспективних дослідницьких підходів.

У цьому контексті інноваційна рамка входить на етап, яка могла б принципово змінити те, як ми думаємо про те, щоб встати на гуманоїдних роботів: господар, короткий для управління людьми. Хорт - це більше, ніж просто інший метод; Це зміна парадигми. Розроблений консорціумом відомих університетів в Азії , включаючи Шанхайський університет Цзяо Тонг, Університет Гонконгу, Університет Чжецзян та Китайський університет Гонконгу, господарські перерви з традиційними підходами та приймає абсолютно новий спосіб викладання гуманоїдних роботів - таким чином, що дивовижно вірно, надійне та реалістичне.

Підходить для цього:

Ведучий: Рамка, яка вчиться на помилках

Ядром інновацій господаря полягає у використанні підкріплення навчання (RL), методу машинного навчання, який натхненний тим, як люди та тварини навчаються. Уявіть, що ви навчите дитину їзди на велосипеді. Вони не дають йому детальних вказівок для кожного руху м’язів, а просто дозволяють йому спробувати. Якщо дитина падає туди, це виправляє його рухи в наступній спробі. Через спробу та помилки дитина поступово вчиться освоїти велосипед через позитивні та негативні відгуки. Навчання підкріплення працює відповідно до подібного принципу.

У випадку з господарем гуманоїдний робот розміщується в модельованому середовищі і стикається з завданням встати з різних позицій. Робот виступає "агентом" у цій галузі. Це виконує дії, в даному випадку рухи суглобів та тіла. Для кожної кампанії він отримує "винагороду" або "покарання", залежно від того, наскільки це було успішним. Якщо він встане, він отримує позитивну винагороду. Якщо він падає або робить небажані рухи, він отримує негативну винагороду. Через незліченну кількість спроб набути досвіду та оптимізації його стратегій, робот поступово вчиться розробити найкращу стратегію стендів.

Вирішальна відмінність попередніх підходів на основі RL полягає в тому, що хост навчається з нуля. Ніяких попередньо запрограмованих рухів, людських демонстрацій чи інших попередніх знань не використовуються. Робот починається з "порожнього аркуша" і повністю розробляє свої стратегії вгору. Це є основним прогресом, оскільки це дає змогу системі знаходити рішення, які можуть вийти далеко за рамки того, що могли придумати інженери. Крім того, система робить її надзвичайно пристосованою, оскільки вона не покладається на жорсткі припущення або упередженість людини.

Магія багатоквалітичної архітектури

Ще одне серце інновацій господаря-це багатократна архітектура. Щоб зрозуміти це, ми повинні коротко розібратися з функціонуванням підкріплення. У типових системах RL є два центральні компоненти: привід та критик. Так би мовляв, мозок робота, який вибирає дії, тобто вирішує, які рухи слід здійснювати. Критик оцінює дії приводу та дає йому відгук. Він розповідає приводу, чи були його дії хорошими чи поганими, і як їх можна вдосконалити. У традиційних підходах RL зазвичай існує лише один критик.

Ведучий розривається з цією конвенцією і натомість покладається на декілька спеціалізованих критиків. Уявіть, що існують різні аспекти під час вставання, які є важливими: утримувати рівновагу, візьміть правильну поставу, координувати суглоби, контролювати обертовий імпульс. Кожен з цих аспектів може бути оцінений власним «експертом». Це саме те, що робить багатократну архітектуру. HOST використовує кілька критиків, кожна з яких спеціалізується на певному аспекті стартового процесу. Наприклад, один критик міг оцінити баланс, іншу спільну координацію та третю сторону до ротаційного імпульсу.

Цей поділ на спеціалізовані критики виявився надзвичайно ефективним. Він вирішує проблему, яка часто виникає в традиційних системах RL: негативне втручання. Якщо один критик намагається одночасно оцінити всі аспекти складного завдання, можуть виникнути конфлікти та плутанина. Різні цілі навчання можуть перешкоджати один одному і уповільнити процес навчання або навіть змусити його провалюватися. Багатократна архітектура обходить цю проблему, розбираючи навчальне завдання на менші, чіткіші підзадачі та використовуючи спеціалізований критик для кожного часткового завдання. Потім привід отримує відгук від усіх критиків та вчиться оптимально поєднувати різні аспекти вставання.

Ця багатократна архітектура особливо актуальна для складного завдання встати. Вставання вимагає різноманітних тонких моторних навичок та точного контролю обертового імпульсу, щоб зберегти рівновагу і не переживати. Завдяки спеціалізованим критикам, хост може спеціально тренувати та оптимізувати ці різні аспекти вставання, що призводить до значно кращих результатів, ніж звичайні підходи з одним критиком. У своїх дослідженнях дослідники показали, що мультикритична архітектура дозволяє значний стрибок у виконанні та дозволила хост розробляти стратегії стенд-ап, які були б недоступними за допомогою звичайних методів.

Навчання навчальних програм: від простого до комплексу

Ще одним ключем для успіху господаря є навчання на основі навчальних програм. Цей метод заснований на процесі навчання людини, в якому ми поступово вчимося складними навичками, починаючи з простих основ, а потім повільно працюючи з нами. Подумайте про приклад їзди на велосипеді. Перед тим, як дитина навчиться їздити на двох колесах, вона може навчитися тримати баланс на робочомульстві або їздити з підтримкою велосипедів. Ці підготовчі вправи полегшують пізніший процес навчання та забезпечують швидший та успішний прогрес.

Хост реалізував аналогічний принцип. Робот не стикається з найскладнішим завданням з самого початку, а саме, а саме вставати на будь -яку поверхню з будь -якого положення. Натомість він піддається ступінчастому навчальній програмі, в якій завдання поступово стають складнішими. Тренування починається з простих сценаріїв, наприклад, встаючи з лежачого положення на плоскій підлозі. Як тільки робот добре освоїв це завдання, умови поступово стають складніше. Є нові вихідні позиції, як встати з сидячого положення або з лежачи на стіні. Поверхня також різноманітна, від рівня ґрунту до дещо нерівних поверхонь до більш вимогливої ​​місцевості.

Цей навчальний план, заснований на навчальних програмах, має кілька переваг. З одного боку, це дозволяє більш ефективно вивчити простір рішення. Спочатку робот зосереджується на основних аспектах вставання та вчиться оволодіти їх у простих сценаріях. Це прискорює процес навчання, і робот швидше досягає хорошого рівня продуктивності. З іншого боку, навчальна програма покращує узагальнення моделі. Поступово стикаючись з роботом з більш різноманітними та складними завданнями, він вчиться адаптуватися до різних ситуацій та розробляти надійні стратегії -доп., Які працюють не лише в ідеалах, але і в реальних умовах. Різноманітність умов тренувань має вирішальне значення для надійності системи в реальному світі, де непередбачувані поверхні та вихідні позиції є правилом, а не винятком.

Підходить для цього:

Реальність через обмеження руху

Ще одним важливим аспектом хоста є врахування реального застосування. Моделювання є потужним інструментом для навчання роботів, але реальний світ є неоднаковим складнішим і непередбачуваним. Щоб успішно освоїти стрибок від моделювання до реальності, хост реалізує два значні обмеження на рух, які забезпечують, щоб засвоєні стратегії також можуть бути реалізовані на реальному обладнанні та не пошкодити робота.

Перше обмеження - це регуляризація плавності. Це спрямоване на зменшення коливальних рухів. У моделюванні роботи можуть здійснювати рухи, які були б проблематичними в реальності. Наприклад, вони могли зробити ривкові, тремтячі рухи, які можуть бути шкідливими для фізичного обладнання або призвести до нестабільної поведінки. Регуляризація плавності гарантує, що вивчені рухи є більш гладкими та рідиною, що є не лише ніжним для обладнання, але й призводить до більш природної та стабільної поведінки.

Друге обмеження - це неявна межа швидкості руху. Це запобігає занадто швидким або різким рухам. Тут теж моделювання часто представляють ідеалізовані умови, в яких роботи могли виконувати рухи з нереальними високими швидкостями. Однак у реальному світі такі різкі рухи можуть призвести до пошкодження робота, наприклад, для перевантаження двигунів або пошкодження суглобів. Обмеження швидкості руху гарантує, що засвоєні рухи залишаються у фізичних межах справжнього обладнання і не загрожують робота.

Ці обмеження на рух мають вирішальне значення для перенесення SIM-до реального. Вони гарантують, що стратегії, засвоєні в моделюванні, не тільки теоретично працюють, але й можуть бути практично реалізовані на реальних роботах, не перевантажуючи або пошкоджуючи обладнання. Вони є важливим кроком для подолання розриву між моделюванням та реальністю та підготувати гуманоїдних роботів для використання в реальному світі.

Практичний тест: хост на Unitree G1

Справжнім тестом для кожного методу управління роботами є практична реалізація реального обладнання. Для того, щоб продемонструвати ефективність господаря, дослідники передали стратегії контролю, вивчені в моделюванні, до Humanoid Robot Unitere G1. Untree G1 - це вдосконалена гуманоїдна платформа, яка характеризується її спритністю, надійністю та реалістичною конструкцією. Це ідеальне тестове ліжко для оцінки навичок господаря в реальному світі.

Результати практичних тестів були вражаючими та підтвердили ефективність підходу господаря. Робот Untree G1, контрольований господарем, показав неабиякі можливості впливу з найрізноманітніших позицій. Він зміг успішно встати з лежачого положення, з сидячого положення, з колін і навіть з положень, в яких він притулився до предметів або був на нерівній поверхні. Передача модельованих навичок у реальний світ була майже плавною, що підкреслює високу якість передачі SIM-до реального від господаря.

Особливо примітною є надійність розладів, які продемонстрував підконтрольний господар Unitree G1. В експериментальних тестах робот зіткнувся із зовнішніми силами, наприклад, ударом або ударом. Він зіткнувся з перешкодами, які заблокували його вгору. Він навіть був завантажений великими навантаженнями (до 12 кг) для перевірки його стійкості та вантажопідйомності. У всіх цих ситуаціях робот виявив неабиякий опір і зміг успішно налаштовуватися, не втрачаючи або не скинувши рівновагу.

У вражаючому демонстраційному відео надійність господаря стала особливо зрозумілою. Там ви могли побачити, як людина натрапила на робот Unitree G1 під час початкового процесу. Незважаючи на ці масивні розлади, робота не вдалося зняти. Він виправив свої рухи в режимі реального часу, адаптував несподівані ефекти і, нарешті, вставав безпечно та стабільно. Ця демонстрація вражаюче ілюструє практичну застосовність та надійність приймаючої системи в реальних, непередбачуваних умовах.

Підходить для цього:

Дослідження абляції: взаємодія компонентів

Для того, щоб точніше вивчити важливість окремих компонентів господарів, дослідники провели великі дослідження абляції. У цих дослідженнях окремі елементи господарських рамок були вилучені або змінені, щоб проаналізувати їх вплив на загальну ефективність. Результати цих досліджень дали цінну інформацію про функціонування господарів та підтвердили важливість центральних інновацій.

Центральним результатом досліджень абляції був підтвердження рішучої ролі багатокролітової архітектури. Коли дослідники модифікували систему таким чином, що вона використовувала лише один критик, система не вдалося жалібно. Це вже не вдалося вивчити успішні ризики, і робот залишався безпорадним у більшості випадків. Цей результат підкреслює центральне значення багатокротичної архітектури для виконання господаря та підтверджує, що спеціалізовані критики насправді роблять вагомий внесок у успіх у навчанні.

Навчання, засноване на навчальних програмах, також виявилося важливим фактором успіху в дослідженнях абляції. Коли дослідники замінили навчальну програму на випадкове навчання без поступового збільшення труднощів, продуктивність системи погіршилася. Робот навчився повільніше, досяг нижчого рівня продуктивності і був менш надійним порівняно з різними вихідними положеннями та субстратами. Це підтверджує припущення, що навчання на основі навчальних програм підвищує ефективність процесу навчання та збільшує узагальнення моделі.

Реалізовані обмеження руху також значно сприяли загальному випуску, особливо щодо практичної застосовності. Коли дослідники видалили регуляризацію плавності та обмеження швидкості руху, робот все ще навчився в моделюванні, але насправді вони були менш стабільними і частіше приводили до падіння або призводять до небажаних, ривкових рухів. Це свідчить про те, що обмеження руху трохи обмежують гнучкість системи в моделюванні, але є важливими в реальному світі, щоб забезпечити надійну, безпечну та обладнану поведінку.

Ведучий: плацдарм для універсальних гуманоїдних роботів

Здатність вставати з різних позицій може здатися тривіальною на перший погляд, але насправді є фундаментальною частиною головоломки для розвитку дійсно універсальних та автономних гуманоїдних роботів. Це основа для інтеграції в більш складні системи руху та маніпулювання та відкриває різноманітні нові програми. Уявіть, що робот може не тільки встати, але й безперешкодно рухатися між різними завданнями - встати з дивана, перейти до столу, захопити предмети, уникайте перешкод і вставайте, коли він спотикається. Цей тип безшовної взаємодії з навколишнім середовищем, що, звичайно, для нас, це, звичайно, є метою гуманоїдної робототехніки, і господар наближає нас до вирішення цієї мети.

Ведуча може використовуватися з господарем у різних сферах, в яких їхня людська форма та їх здатність взаємодіяти з людським середовищем є вигідними. У сестринській справі вони могли підтримувати старших або хворих людей, допомогти їм встати і сісти, достатньо предметів або допомагати в домогосподарстві. У зоні обслуговування їх можна використовувати в готелях, ресторанах чи магазинах для роботи з клієнтами, транспортування товарів або надання інформації. У небезпечних умовах, таких як допомога у стихійних лихах або на промислових установах, вони можуть приймати завдання, які є занадто ризикованими або занадто виснажливими для людей.

Крім того, можливість вставати також є важливим для впертого виробництва. Падіння є поширеною проблемою з гуманоїдними роботами, особливо в нерівномірних або динамічних умовах. Робот, який не може встати самостійно після падіння, швидко буде безпорадним у таких умовах. Хост пропонує тут рішення, оскільки він дозволяє робота знову з’явитися з несподіваних місць та продовжити своє завдання. Це підвищує надійність та безпеку гуманоїдних роботів і робить їх більш надійними та більш практичними інструментами.

Ведучий прокладає шлях для нового покоління гуманоїдних роботів

Ведучий - це більше, ніж просто подальша розробка існуючих методів; Це суттєвий прорив у контролі гуманоїдних роботів. Завдяки інноваційному використанню підкріпленого навчання за допомогою багатокритичної архітектури та навчання на основі навчальних програм, воно долає обмеження попередніх підходів та дозволяє роботам стояти з неабиякої різноманітності позицій та на найрізноманітніших поверхнях. Успішна передача від моделювання до реального робота демонструє UniteR G1 та вражаюча надійність розладів підкреслюють величезний потенціал цього методу для практичних застосувань.

Ведучий - це важливий крок на шляху до гуманоїдних роботів, які не тільки вражають у лабораторії, але й можуть запропонувати реальну додаткову цінність у реальному світі. Це наближає нас до бачення майбутнього, в якому гуманоїдні роботи безперешкодно інтегруються в наше повсякденне життя, підтримують нас у різноманітних завданнях і роблять наше життя більш комфортним, комфортним та ефективним. З такими технологіями, як господар, колись футуристична ідея гуманоїдних роботів, які супроводжують нас у нашому повсякденному житті, стає все більш відчутною реальністю.

Підходить для цього:

 

Ваш глобальний партнер з маркетингу та розвитку бізнесу

☑ Наша ділова мова - англійська чи німецька

☑ Нове: листування на вашій національній мові!

 

Цифровий піонер - Конрад Вольфенштейн

Конрад Вольфенштейн

Я радий бути доступним вам та моїй команді як особистого консультанта.

Ви можете зв’язатися зі мною, заповнивши тут контактну форму або просто зателефонуйте мені за номером +49 89 674 804 (Мюнхен) . Моя електронна адреса: Вольфенштейн xpert.digital

Я з нетерпінням чекаю нашого спільного проекту.

 

 

☑ Підтримка МСП у стратегії, порадах, плануванні та впровадженні

☑ Створення або перестановка цифрової стратегії та оцифрування

☑ Розширення та оптимізація міжнародних процесів продажів

☑ Глобальні та цифрові торгові платформи B2B

☑ Піонерський розвиток бізнесу / маркетинг / PR / Мір


робототехніка/робототехнікаxpaper