Контрол на изправянето на хуманоиди 🤖⬆️ С "HoST" хуманоидите се учат да се изправят

Публикувано на: 18 март 2025 г. / Актуализирано на: 18 март 2025 г. – Автор: Konrad Wolfenstein

Контрол на изправянето на хуманоиди: С HoST хуманоидите се учат да се изправят – Пробивът за роботите в ежедневието – Изображение: humanoid-standingup.github.io

Повече от просто ставане: HoST проправя пътя за автономни и многофункционални хуманоидни роботи

От симулация към реалност: Как HoST учи хуманоидни роботи да се изправят самостоятелно

В завладяващия свят на хуманоидната роботика, където машините все повече имитират човешките способности, едно привидно просто, но фундаментално важно умение играе централна роля: изправянето. За нас, хората, това е втора природа, несъзнателно движение, което извършваме безброй пъти всеки ден. Но за един хуманоиден робот изправянето е сложно предизвикателство, изискващо сложни системи за управление, прецизни сензори и интелигентни алгоритми. Тази способност е не само впечатляваща демонстрация на инженерни умения, но и съществена предпоставка хуманоидните роботи да намерят своето място в ежедневието ни и да ни подкрепят в широк спектър от задачи.

Способността за изправяне от различни позиции е много повече от просто приятна допълнителна функция. Тя е основата за автономността и гъвкавостта на хуманоидните роботи. Представете си робот, който ви помага вкъщи, помага в грижите за близки или работи в опасна среда. Във всички тези сценарии способността за самостоятелно изправяне от различни позиции е от решаващо значение. Робот, който функционира само в идеални начални позиции и е оставен безпомощен след падане, е просто безполезен в реалния свят. Следователно разработването на стабилни и гъвкави стратегии за изправяне е ключова стъпка в пренасянето на хуманоидните роботи от изследователската лаборатория в реалния свят.

Предишните подходи за решаване на този проблем често достигаха своите граници. Много от тях разчитаха на старателно предварително програмирани последователности от движения, които функционираха в контролирани среди, но бързо достигаха своите граници в непредсказуема реалност. Тези твърди системи бяха негъвкави, неспособни да се адаптират към променящите се условия и се проваляха с гръм и трясък, когато роботът се приземи в неочаквана позиция или на неравен терен. Други подходи използваха сложни симулационни среди, но резултатите от тях често бяха трудни за пренасяне върху реални роботи. Скокът от симулация към реалност, така нареченият „трансфер от симулация към реалност“, се оказа препъни камък за много обещаващи изследователски подходи.

В този контекст се появява иновативна рамка, която би могла коренно да промени начина, по който мислим за хуманоидните роботи, които се изправят: HoST, съкращение от Humanoid Standing-up Control (Контрол на изправяне на хуманоид). HoST е повече от просто още един метод; това е промяна на парадигмата. Разработен от консорциум от известни университети в Азия , включително Шанхайския университет Джиао Тонг, Университета в Хонконг, Университета Джъдзян и Китайския университет в Хонконг, HoST разчупва традиционните подходи и проправя изцяло нов път за обучение на хуманоидни роботи да се изправят – по начин, който е удивително гъвкав, надежден и реалистичен.

Свързано с това:

Хуманоидните, индустриалните и сервизните роботи са във възход – хуманоидните роботи вече не са научна фантастика

HoST: Рамка, която се учи от грешки

В основата на иновацията на HoST се крие прилагането на обучение с подсилване (RL), метод за машинно обучение, вдъхновен от начина, по който учат хората и животните. Представете си, че учите дете да кара колело. Не му давате подробни инструкции за всяко мускулно движение; вместо това го оставяте просто да опита. Ако детето падне, то коригира движенията си при следващия опит. Чрез проба и грешка, чрез положителна и отрицателна обратна връзка, детето постепенно се научава да овладява колелото. Обучението с подсилване работи на подобен принцип.

В проекта HoST хуманоиден робот се поставя в симулирана среда и му се възлага задачата да се изправя от различни позиции. Роботът действа като „агент“ в тази среда, извършвайки действия, в този случай движения на ставите и тялото си. За всяко действие той получава „награда“ или „наказание“, в зависимост от успеха си. Изправянето води до положителна награда, докато падането или извършването на нежелани движения води до отрицателна награда. Чрез безброй опити, натрупване на опит и оптимизиране на стратегията, роботът постепенно се научава да развива най-добрата възможна стратегия за изправяне.

Ключовата разлика от предишните подходи, базирани на RL, е, че HoST се учи от нулата. Той не използва предварително програмирани траектории на движение, човешки демонстрации или други предварителни знания. Роботът започва с празен лист и разработва своите стратегии за изправяне напълно независимо. Това е фундаментално подобрение, защото позволява на системата да намира решения, които могат да надхвърлят това, което човешките инженери биха могли да си представят. Освен това, това прави системата изключително адаптивна, тъй като не разчита на твърди предположения или човешки пристрастия.

Магията на мултикритичната архитектура

Друг ключов елемент от иновацията HoST е архитектурата с множество критики. За да разберем това, трябва накратко да разгледаме как работи обучението с подсилване. В типичните RL системи има два централни компонента: актьорът и критикът. Актьорът е, така да се каже, мозъкът на робота, който избира действия и решава кои движения трябва да бъдат изпълнени. Критикът оценява действията на актьора и предоставя обратна връзка. Той казва на актьора дали действията му са били добри или лоши и как могат да бъдат подобрени. В традиционните RL подходи обикновено има само един критик.

HoST нарушава тази конвенция и вместо това разчита на множество специализирани критици. Представете си, че ставането включва няколко важни аспекта: поддържане на баланс, заемане на правилната стойка, координиране на ставите и контролиране на ротационния импулс. Всеки от тези аспекти може да бъде оценен от свой собствен „експерт“. Точно това прави многокритичната архитектура. HoST използва множество мрежи от критики, всяка от които е специализирана в специфичен аспект на процеса на стоене. Например, един критик може да оцени баланса, друг - координацията на ставите, а трети - ротационния импулс.

Това разделение на специализирани критици се е доказало като изключително ефективно. То решава проблем, който често възниква в традиционните системи за управление на обучението: негативна интерференция. Когато един критик се опита да оцени всички аспекти на сложна задача едновременно, могат да възникнат конфликти и объркване. Различните учебни цели могат да си пречат взаимно, забавяйки или дори причинявайки неуспех на учебния процес. Многокритичната архитектура заобикаля този проблем, като разделя учебната задача на по-малки, по-лесно управляеми подзадачи и назначава специализиран критик на всяка подзадача. След това участникът получава обратна връзка от всички критици и се научава да комбинира оптимално различните аспекти на обучението.

Тази многокритична архитектура е особено подходяща за сложната задача на изправяне. Изправянето изисква разнообразни фини двигателни умения и прецизен контрол на ротационния импулс, за да се поддържа баланс и да се избегне падане. Чрез своите специализирани критици, HoST може целенасочено да тренира и оптимизира тези различни аспекти на изправянето, което води до значително по-добри резултати от конвенционалните подходи, използващи един-единствен критичен метод. В своите изследвания изследователите са демонстрирали, че многокритичната архитектура позволява значително подобрение на производителността и позволява на HoST да разработва стратегии за изправяне, които биха били непостижими с конвенционалните методи.

Учене по учебна програма: от просто към сложно

Друг ключ към успеха на HoST е обучението, базирано на учебна програма. Този метод се основава на човешкия процес на учене, при който ние придобиваме сложни умения стъпка по стъпка, започвайки с прости основи и постепенно преминавайки към по-трудни задачи. Помислете отново за примера с карането на велосипед. Преди едно дете да се научи да кара на две колела, то може първо да се научи да балансира на балансиращ велосипед или да използва помощни колела. Тези подготвителни упражнения улесняват по-късния процес на обучение и осигуряват по-бърз и по-успешен напредък.

HoST прилага подобен принцип. Роботът не е изправен пред най-трудната задача от самото начало, а именно, изправяне от всяка позиция на каквато и да е повърхност. Вместо това, той преминава през многостепенна учебна програма, в която задачите постепенно стават по-сложни. Обучението започва с прости сценарии, като например изправяне от легнало положение на равен под. След като роботът овладее тази задача, условията стават прогресивно по-предизвикателни. Добавят се нови начални позиции, като например изправяне от седнало положение или от легнало положение и облягане на стена. Повърхността също е разнообразна, от равен под до леко неравни повърхности и накрая до по-взискателен терен.

Това обучение, базирано на учебна програма, предлага няколко предимства. Първо, то позволява по-ефективно изследване на пространството на решенията. Роботът първоначално се фокусира върху основните аспекти на изправянето и се научава да ги овладява в прости сценарии. Това ускорява процеса на обучение, позволявайки на робота да достигне добро ниво на производителност по-бързо. Второ, учебната програма подобрява обобщаемостта на модела. Чрез постепенно излагане на робота на по-разнообразни и сложни задачи, той се научава да се адаптира към различни ситуации и да развива стабилни стратегии за изправяне, които функционират не само в идеални, но и в реални среди. Разнообразието от условия на обучение е от решаващо значение за устойчивостта на системата в реалния свят, където непредсказуемите повърхности и начални позиции са правило, а не изключение.

Свързано с това:

Хуманоидният робот Navigator Alpha α и Центърът за иновации в хуманоидни роботи Zhejiang на SUPCON (Китай)

Реализъм чрез ограничения на движението

Друг важен аспект на HoST е отчитането на приложимостта в реалния свят. Макар че симулациите са мощен инструмент за обучение на роботи, реалният свят е далеч по-сложен и непредсказуем. За да преодолее успешно разликата между симулацията и реалността, HoST внедрява две основни ограничения за движение, които гарантират, че научените стратегии могат да бъдат приложени към реалния хардуер, без да се повреди роботът.

Първото ограничение е регуляризацията на плавността. Целта е да се намалят осцилаторните движения. В симулации роботите могат да извършват движения, които биха били проблематични в действителност. Например, те биха могли да правят резки, треперещи движения, които биха могли да повредят физическия хардуер или да доведат до нестабилно поведение. Регуляризацията на плавността гарантира, че научените движения са по-плавни и по-плавни, което не само е по-щадящо за хардуера, но и води до по-естествено и стабилно поведение при изправяне.

Второто ограничение е имплицитното ограничение на скоростта. Това предотвратява прекомерно бързи или резки движения. Отново, симулациите често представляват идеализирани условия, при които роботите биха могли да извършват движения с нереалистично високи скорости. В реалния свят обаче такива резки движения могат да повредят робота, например чрез претоварване на двигателите или увреждане на ставите. Ограничението на скоростта гарантира, че научените движения остават в рамките на физическите граници на реалния хардуер и не застрашават робота.

Тези ограничения на движението са от решаващо значение за трансфера на знания от симулацията към реалния свят. Те гарантират, че стратегиите, научени по време на симулация, не само работят теоретично, но и могат да бъдат приложени на практика върху реални роботи, без да се претоварва или поврежда хардуерът. Те са важна стъпка в преодоляването на разликата между симулацията и реалността и в подготовката на хуманоидните роботи за употреба в реалния свят.

Практическият тест: HoST на Unitree G1

Истинският тест за всеки метод за управление на робот е практическото му приложение върху реален хардуер. За да демонстрират възможностите на HoST, изследователите прехвърлиха стратегиите за управление, научени по време на симулацията, към хуманоидния робот Unitree G1. Unitree G1 е усъвършенствана хуманоидна платформа, характеризираща се със своята гъвкавост, здравина и реалистичен дизайн. Тя е идеална тестова платформа за оценка на възможностите на HoST в реалния свят.

Резултатите от практическите тестове бяха впечатляващи и потвърдиха ефективността на подхода HoST. Роботът Unitree G1, управляван от HoST, демонстрира забележителни възможности за изправяне от голямо разнообразие от позиции. Той успешно се изправи от легнало, седнало, коленичещо положение и дори от позиции, в които се е облягал на предмети или на неравен терен. Пренасянето на симулираните възможности в реалния свят беше почти безпроблемно, което подчертава високото качество на HoST-овия трансфер от симулатор към реалност.

От особено значение е устойчивостта на смущения, демонстрирана от HoST-контролирания Unitree G1. В експериментални тестове роботът е бил подложен на външни сили, като например удари и подутини. Той е бил изправен пред препятствия, които са блокирали способността му да се изправи. Дори е бил натоварен с тежки товари (до 12 кг), за да се тества неговата стабилност и товароносимост. Във всички тези ситуации роботът е проявил забележителна устойчивост и успешно се е изправил, без да загуби равновесие или да падне.

Впечатляващо демонстрационно видео ясно илюстрира здравината на HoST. То показва човек, който бута и рита робота Unitree G1, докато той се изправя. Въпреки тези значителни смущения, роботът остава невъзмутим. Той коригира движенията си в реално време, адаптира се към неочакваните удари и в крайна сметка се изправя безопасно и стабилно. Тази демонстрация впечатляващо илюстрира практическата приложимост и надеждността на системата HoST в реални, непредсказуеми среди.

Свързано с това:

Хуманоидният робот Unitree G1: Революционен кунг-фу робот с впечатляващи възможности

Аблационни изследвания: Взаимодействие на компонентите

За да проучат по-подробно значението на отделните компоненти на HoST, изследователите проведоха обширни аблационни изследвания. В тези изследвания отделни елементи от рамката на HoST бяха премахнати или модифицирани, за да се анализира тяхното въздействие върху цялостната производителност. Резултатите от тези изследвания предоставиха ценна информация за функционалността на HoST и потвърдиха важността на основните му иновации.

Ключов извод от изследванията на аблацията беше потвърждението на решаващата роля на многокритичната архитектура. Когато изследователите модифицираха системата, за да използва само един критик, тя се провали с гръм и трясък. Тя вече не беше в състояние да научи успешни модели на стоене и в повечето случаи роботът оставаше безпомощно в легнало положение. Този резултат подчертава централното значение на многокритичната архитектура за работата на HoST и потвърждава, че специализираните критици наистина допринасят значително за успеха на обучението.

Обучението, базирано на учебната програма, също се оказа ключов фактор за успех в проучванията за аблация. Когато изследователите замениха учебната програма с рандомизирано обучение без постепенно увеличаване на трудността, производителността на системата се влоши значително. Роботът се учеше по-бавно, постигна по-ниско ниво на производителност и беше по-малко устойчив на различни начални позиции и повърхности. Това потвърждава предположението, че обучението, базирано на учебната програма, подобрява ефективността на учебния процес и увеличава обобщаемостта на модела.

Въведените ограничения за движение също допринесоха значително за цялостната производителност, особено по отношение на практическата приложимост. Когато изследователите премахнаха регуларизацията на плавността и ограничението на скоростта на движение, роботът все още научаваше стратегии за възстановяване в симулацията, но те бяха по-малко стабилни в действителност и по-често водеха до падания или нежелани, резки движения. Това показва, че макар ограниченията за движение леко да ограничават гъвкавостта на системата в симулацията, те са от съществено значение в реалния свят, за да се осигури стабилно, безопасно и съвместимо с хардуера поведение.

HoST: Трамплин за многофункционални хуманоидни роботи

Способността за изправяне от различни позиции може да изглежда тривиална на пръв поглед, но всъщност е фундаментално парче от пъзела за разработването на наистина гъвкави и автономни хуманоидни роботи. Тя формира основата за интеграция в по-сложни системи за придвижване и манипулация и отваря множество нови възможности за приложение. Представете си робот, който може не само да се изправя, но и да се движи безпроблемно между различни задачи – да става от дивана, да ходи до масата, да хваща предмети, да избягва препятствия и да се изправя, ако се спъне. Този вид безпроблемно взаимодействие с околната среда, което е втора природа за нас, хората, е целта на хуманоидната роботика, а HoST ни доближава с една решаваща стъпка към постигането ѝ.

С HoST, хуманоидните роботи биха могли да бъдат използвани в различни области в бъдеще, където човешката им форма и способността им да взаимодействат с човешката среда са предимство. В грижите за възрастни хора те биха могли да подкрепят възрастни или болни хора, като им помагат да стават и да сядат, да им подават предмети или да им помагат с домакинските задачи. В сектора на услугите те биха могли да се използват в хотели, ресторанти или магазини, за да обслужват клиенти, да транспортират стоки или да предоставят информация. В опасни среди, като например оказване на помощ при бедствия или промишлени предприятия, те биха могли да поемат задачи, които са твърде рисковани или напрегнати за хората.

Освен това, способността за изправяне е от съществено значение за възстановяването след падане. Паданията са често срещан проблем за хуманоидните роботи, особено в неравни или динамични среди. Робот, който не може да се изправи сам след падане, бързо става безпомощен в такива среди. HoST предлага решение тук, тъй като позволява на робота да се изправя дори от неочаквани позиции и да продължи задачата си. Това повишава надеждността и безопасността на хуманоидните роботи, правейки ги по-здрави и практични инструменти.

HoST проправя пътя за ново поколение хуманоидни роботи

HoST е нещо повече от еволюция на съществуващи методи; той представлява значителен пробив в контрола на хуманоидни роботи. Чрез иновативното използване на обучение с подсилване с многокритична архитектура и обучение, базирано на учебна програма, той преодолява ограниченията на предишни подходи, позволявайки на роботите да се изправят от забележително разнообразие от позиции и върху разнообразни повърхности. Успешният трансфер от симулация към реални роботи, демонстриран на Unitree G1, и впечатляващата му устойчивост срещу смущения подчертават огромния потенциал на този метод за практически приложения.

HoST е важна стъпка към хуманоидни роботи, които не само впечатляват в лабораторията, но могат да предложат и реална добавена стойност в реалния свят. Той ни доближава до визията за бъдеще, в което хуманоидните роботи са безпроблемно интегрирани в ежедневието ни, подпомагайки ни в различни задачи и правейки живота ни по-безопасен, по-комфортен и по-ефективен. С технологии като HoST, някога футуристичната идея за хуманоидни роботи, които ни съпътстват в ежедневието ни, става все по-осезаема.

Свързано с това:

Вашият глобален партньор по маркетинг и бизнес развитие

☑️ Нашият бизнес език е английски или немски

☑️ НОВО: Кореспонденция на родния ви език!

Konrad Wolfenstein

Аз и моят екип с удоволствие ще бъдем на ваше разположение като ваш личен съветник.

Можете да се свържете с мен, като попълните формата за контакт тук или просто ми се обадите на +49 89 89 674 804 ( Мюнхен) . Моят имейл адрес е: [email protected]

Очаквам с нетърпение нашия съвместен проект.

Управление на хуманоидно изправяне: С „HoST“ хуманоидите се учат да се изправят – пробивът за роботите в ежедневието

Повече от просто ставане: HoST проправя пътя за автономни и многофункционални хуманоидни роботи

От симулация към реалност: Как HoST учи хуманоидни роботи да се изправят самостоятелно

HoST: Рамка, която се учи от грешки

Магията на мултикритичната архитектура

Учене по учебна програма: от просто към сложно

Реализъм чрез ограничения на движението

Практическият тест: HoST на Unitree G1

Аблационни изследвания: Взаимодействие на компонентите

HoST: Трамплин за многофункционални хуманоидни роботи

HoST проправя пътя за ново поколение хуманоидни роботи

Вашият глобален партньор по маркетинг и бизнес развитие

☑️ Нашият бизнес език е английски или немски

☑️ НОВО: Кореспонденция на родния ви език!

☑️ Подкрепа за МСП в стратегията, консултирането, планирането и внедряването

☑️ Създаване или пренасочване на дигиталната стратегия и дигитализация

☑️ Разширяване и оптимизиране на международните процеси на продажби

☑️ Глобални и дигитални B2B търговски платформи

☑️ Pioneer Развитие на бизнеса / Маркетинг / PR / Търговски панаири