Објављено: 18. марта 2025. / Ажурирано: 18. марта 2025. – Аутор: Konrad Wolfenstein

Контрола устајања хуманоида: Са HoST-ом, хуманоиди уче да устају – пробој за роботе у свакодневном животу – Слика: humanoid-standingup.github.io
Више од самог устајања: HoST отвара пут аутономним и свестраним хуманоидним роботима
Од симулације до стварности: Како HoST учи хуманоидне роботе да самостално устану
У фасцинантном свету хуманоидне роботике, где машине све више имитирају људске способности, једна наизглед једноставна, али фундаментално важна вештина игра централну улогу: устајање. За нас људе, то је друга природа, несвесни покрет који изводимо безброј пута сваког дана. Али за хуманоидног робота, устајање је сложен изазов који захтева софистициране системе управљања, прецизне сензоре и интелигентне алгоритме. Ова способност није само импресивна демонстрација инжењерске вештине, већ и суштински предуслов да хуманоидни роботи пронађу своје место у нашем свакодневном животу и подрже нас у широком спектру задатака.
Способност устајања из различитих положаја је много више од само лепе додатне карактеристике. То је основа за аутономију и свестраност хуманоидних робота. Замислите робота који вам помаже по кући, помаже у неговању или ради у опасним окружењима. У свим овим сценаријима, способност самосталног устајања из различитих положаја је кључна. Робот који функционише само у идеалним почетним положајима и остаје беспомоћан након пада једноставно је бескористан у стварном свету. Развој робусних и свестраних стратегија стајања је стога кључни корак у преношењу хуманоидних робота из истраживачке лабораторије у стварни свет.
Претходни приступи решавању овог проблема често су достизали своје границе. Многи су се ослањали на пажљиво унапред програмиране секвенце покрета које су функционисале у контролисаним окружењима, али су брзо достизале своје границе у непредвидивој стварности. Ови крути системи су били нефлексибилни, неспособни да се прилагоде променљивим условима и несрећно су заказавали када би робот слетео у неочекивани положај или на неравно тло. Други приступи су користили сложена симулациона окружења, али је њихове резултате често било тешко пренети на стварне роботе. Скок из симулације у стварност, такозвани „трансфер из симулације у стварност“, показао се као камен спотицања за многе обећавајуће истраживачке приступе.
У овом контексту, појављује се иновативни оквир који би могао фундаментално да промени начин на који размишљамо о хуманоидним роботима који устају: HoST, скраћеница од Humanoid Standing-up Control (Контрол устајања хуманоида). HoST је више од само још једне методе; то је промена парадигме. Развијен од стране конзорцијума реномираних универзитета у Азији , укључујући Шангајски универзитет Ђао Тонг, Универзитет у Хонг Конгу, Универзитет Џеђанг и Кинески универзитет у Хонг Конгу, HoST прекида традиционалне приступе и отвара потпуно нови пут ка подучавању хуманоидних робота да устају – на начин који је запањујуће свестран, робустан и реалистичан.
У вези са овим:
- Хуманоидни, индустријски и услужни роботи су у порасту – хуманоидни роботи више нису научна фантастика
HoST: Оквир који учи из грешака
Суштина HoST-ове иновације лежи у примени учења са појачањем (RL), методе машинског учења инспирисане начином на који људи и животиње уче. Замислите да учите дете да вози бицикл. Не дајете му детаљна упутства за сваки покрет мишића; уместо тога, дозвољавате му да једноставно покуша. Ако дете падне, оно исправља своје покрете у следећем покушају. Кроз покушаје и грешке, кроз позитивне и негативне повратне информације, дете постепено учи да савлада бицикл. Учење са појачањем функционише на сличном принципу.
У пројекту HoST, хуманоидни робот се ставља у симулирано окружење и задужује га да устане из различитих положаја. Робот делује као „агент“ унутар овог окружења, изводећи радње, у овом случају, покрете зглобова и тела. За сваку радњу добија „награду“ или „казну“, у зависности од свог успеха. Устајање резултира позитивном наградом, док падање или прављење непожељних покрета резултира негативном наградом. Кроз безброј покушаја, стицање искуства и оптимизацију стратегије, робот постепено учи да развије најбољу могућу стратегију стајања.
Кључна разлика у односу на претходне приступе засноване на учењу у раду (RL) јесте то што HoST учи од нуле. Не користи унапред програмиране путање кретања, људске демонстрације или друга предзнања. Робот почиње са празним листом и развија своје стратегије стајања потпуно самостално. Ово је фундаментални напредак јер омогућава систему да пронађе решења која могу далеко превазићи оно што су људски инжењери могли да замисле. Штавише, чини систем изузетно прилагодљивим, јер се не ослања на круте претпоставке или људске предрасуде.
Магија мултикритичне архитектуре
Још један кључни елемент HoST иновације је архитектура вишеструких критичара. Да бисмо ово разумели, потребно је укратко испитати како функционише учење појачањем. У типичним RL системима постоје две централне компоненте: актер и критичар. Актер је, такорећи, мозак робота, који бира радње и одлучује које покрете треба извести. Критичар процењује радње актера и даје повратне информације. Он говори актеру да ли су његове радње биле добре или лоше и како се могу побољшати. У традиционалним RL приступима, обично постоји само један критичар.
HoST раскида са овом конвенцијом и уместо тога се ослања на више специјализованих критичара. Замислите да устајање укључује неколико важних аспеката: одржавање равнотеже, заузимање исправног држања, координацију зглобова и контролу ротационог момента. Сваки од ових аспеката могао би да процени његов сопствени „стручњак“. Управо то ради архитектура са више критичара. HoST користи више критичких мрежа, од којих је свака специјализована за одређени аспект процеса стајања. На пример, један критичар би могао да процени равнотежу, други координацију зглобова, а трећи ротациони моментум.
Ова подела на специјализоване критичаре показала се изузетно ефикасном. Она решава проблем који се често јавља у традиционалним системима управљања учењем: негативно ометање. Када један критичар покуша да истовремено процени све аспекте сложеног задатка, могу се јавити сукоби и забуна. Различити циљеви учења могу се међусобно ометати, успоравајући или чак узрокујући неуспех процеса учења. Архитектура вишеструких критичара заобилази овај проблем тако што задатак учења разбија на мање, лакше управљиве подзадатке и додељује специјализованог критичара сваком подзадатку. Актер затим добија повратне информације од свих критичара и учи да оптимално комбинује различите аспекте учења.
Ова вишекритична архитектура је посебно релевантна за сложен задатак устајања. Стајање захтева разне фине моторичке вештине и прецизну контролу ротационог момента како би се одржала равнотежа и избегло падање. Захваљујући својим специјализованим критичарима, HoST може посебно да тренира и оптимизује ове различите аспекте устајања, што доводи до знатно бољих резултата него конвенционални приступи који користе само једног критичара. Истраживачи су у својим студијама показали да вишекритична архитектура омогућава значајно побољшање перформанси и дозвољава HoST-у да развије стратегије стајања које би биле недостижне конвенционалним методама.
Учење кроз наставни план и програм: од једноставног до сложеног
Још један кључ успеха HoST-а је обука заснована на наставном плану и програму. Ова метода се заснива на људском процесу учења, у којем корак по корак стичемо сложене вештине, почевши од једноставних основа, а затим постепено прелазећи на теже задатке. Размислите поново о примеру вожње бицикла. Пре него што дете научи да вози на два точка, може прво научити да балансира на бициклу за балансирање или да користи помоћне точкове. Ове припремне вежбе олакшавају каснији процес учења и осигуравају бржи и успешнији напредак.
HoST примењује сличан принцип. Робот се од самог почетка не суочава са најтежим задатком – наиме, устајањем из било које позиције на било којој површини. Уместо тога, пролази кроз вишеслојни наставни план и програм у којем задаци постепено постају сложенији. Обука почиње једноставним сценаријима, као што је устајање из лежећег положаја на равном поду. Када робот савлада овај задатак, услови постају прогресивно изазовнији. Додају се нови почетни положаји, као што је устајање из седећег положаја или из лежећег положаја и наслон на зид. Површина је такође разнолика, од равног пода до благо неравних површина и коначно до захтевнијег терена.
Ова обука заснована на курикулуму нуди неколико предности. Прво, омогућава ефикасније истраживање простора решења. Робот се у почетку фокусира на основне аспекте стајања и учи да их савлада у једноставним сценаријима. Ово убрзава процес учења, омогућавајући роботу да брже достигне добар ниво перформанси. Друго, курикулум побољшава генерализацију модела. Постепеним излагањем робота разноврснијим и сложенијим задацима, он учи да се прилагођава различитим ситуацијама и развија робусне стратегије стајања које функционишу не само у идеалним већ и у реалним окружењима. Разноврсност услова обуке је кључна за робусност система у стварном свету, где су непредвидиве површине и почетне позиције правило, а не изузетак.
У вези са овим:
- Хуманоидни робот Навигатор Алфа α и Центар за иновације хуманоидних робота Џеђанг компаније SUPCON (Кина)
Реализам кроз ограничења кретања
Још један важан аспект HoST-а је његово разматрање применљивости у стварном свету. Иако су симулације моћан алат за обуку робота, стварни свет је далеко сложенији и непредвидивији. Да би успешно премостио јаз између симулације и стварности, HoST имплементира два основна ограничења кретања која осигуравају да се научене стратегије могу применити на стварни хардвер без оштећења робота.
Прво ограничење је регуларизација глаткоће. Циљ је смањење осцилаторних покрета. У симулацијама, роботи могу да изводе покрете који би у стварности били проблематични. На пример, могли би да праве трзаве, дрхтаве покрете који би могли да оштете физички хардвер или доведу до нестабилног понашања. Регуларизација глаткоће осигурава да су научени покрети глаткији и флуиднији, што је не само нежније за хардвер, већ резултира и природнијим и стабилнијим понашањем у усправном положају.
Друго ограничење је имплицитно ограничење брзине. Ово спречава претерано брзе или нагле покрете. Поново, симулације често представљају идеализоване услове у којима роботи могу да изводе покрете нереално великим брзинама. Међутим, у стварном свету такви нагли покрети могу оштетити робота, на пример, преоптерећењем мотора или оштећењем зглобова. Ограничење брзине осигурава да научени покрети остану у оквиру физичких ограничења стварног хардвера и да не угрожавају робота.
Ова ограничења кретања су кључна за пренос знања из симулације у стварни свет. Она осигуравају да стратегије научене у симулацији не само да функционишу теоретски, већ се могу и практично применити на стварним роботима без преоптерећења или оштећења хардвера. Она су важан корак у премошћавању јаза између симулације и стварности и припреми хуманоидних робота за употребу у стварном свету.
Практични тест: HoST на Unitree G1
Прави тест било које методе управљања роботом је њена практична имплементација на стварном хардверу. Да би демонстрирали могућности HoST-а, истраживачи су пренели стратегије управљања научене у симулацији на хуманоидног робота Unitree G1. Unitree G1 је напредна хуманоидна платформа коју карактеришу агилност, робусност и реалистичан дизајн. То је идеално тестно окружење за процену могућности HoST-а у стварном свету.
Резултати практичних тестова били су импресивни и потврдили су ефикасност HoST приступа. Робот Unitree G1, којим управља HoST, показао је изванредне могућности стајања из широког спектра положаја. Успешно је устао из лежећег положаја, седећег положаја, положаја клечања, па чак и из положаја где се наслањао на предмете или на неравно тло. Пренос симулираних могућности у стварни свет био је готово беспрекоран, што истиче висок квалитет HoST-овог преноса из симулације у стварни свет.
Посебно је вредна пажње отпорност на поремећаје коју је показао Unitree G1 контролисан HoST-ом. У експерименталним тестовима, робот је био изложен спољним силама, као што су ударци и неравнине. Суочио се са препрекама које су му спречавале да устане. Чак је био оптерећен тешким теретима (до 12 кг) како би се тестирала његова стабилност и носивост. У свим овим ситуацијама, робот је показао изузетну отпорност и успешно се исправио без губитка равнотеже или пада.
Импресиван демонстрациони видео јасно је илустровао робусност HoST-а. Приказао је особу како гура и шутира робота Unitree G1 док се овај усправљао. Упркос овим значајним поремећајима, робот је остао непоколебљив. Кориговао је своје покрете у реалном времену, прилагођавао се неочекиваним ударима и на крају се безбедно и стабилно усправио. Ова демонстрација импресивно илуструје практичну применљивост и поузданост HoST система у реалним, непредвидивим окружењима.
У вези са овим:
Студије аблације: Међусобно дејство компоненти
Да би детаљније испитали значај појединачних компоненти HoST-а, истраживачи су спровели опсежне студије аблације. У овим студијама, појединачни елементи HoST оквира су уклоњени или модификовани како би се анализирао њихов утицај на укупне перформансе. Резултати ових студија пружили су драгоцене увиде у функционалност HoST-а и потврдили важност његових основних иновација.
Кључни налаз студија аблације била је потврда кључне улоге вишекритичне архитектуре. Када су истраживачи модификовали систем да користи само једног критичара, систем је несрећно заказао. Више није био у стању да учи успешне обрасце стајања, а робот је у већини случајева беспомоћно остајао да лежи. Овај резултат подвлачи централни значај вишекритичне архитектуре за перформансе HoST-а и потврђује да специјализовани критичари заиста значајно доприносе успеху учења.
Обука заснована на курикулуму такође се показала као кључни фактор успеха у студијама аблације. Када су истраживачи заменили курикулум рандомизованом обуком без постепеног повећања тежине, перформансе система су се значајно погоршале. Робот је учио спорије, постигао нижи ниво перформанси и био је мање отпоран на различите почетне позиције и површине. Ово потврђује претпоставку да обука заснована на курикулуму побољшава ефикасност процеса учења и повећава генерализацију модела.
Имплементирана ограничења кретања такође су значајно допринела укупним перформансама, посебно у погледу практичне применљивости. Када су истраживачи уклонили регуларизацију глаткоће и ограничење брзине кретања, робот је и даље учио стратегије опоравка у симулацији, али су оне биле мање стабилне у стварности и чешће су резултирале падовима или нежељеним, трзавим покретима. Ово показује да, иако ограничења кретања мало ограничавају флексибилност система у симулацији, она су неопходна у стварном свету како би се осигурало робусно, безбедно и хардверски прилагођено понашање.
HoST: Одскочна даска за свестране хуманоидне роботе
Способност устајања из различитих положаја може на први поглед деловати тривијално, али је у стварности фундаментални део слагалице за развој истински свестраних и аутономних хуманоидних робота. Она чини основу за интеграцију у сложеније системе за кретање и манипулацију и отвара мноштво нових могућности примене. Замислите робота који не само да може да устане, већ се и да се беспрекорно креће између различитих задатака – устајање са софе, ходање до стола, хватање предмета, избегавање препрека и поновно устајање ако се спотакне. Ова врста беспрекорне интеракције са околином, која је нама људима друга природа, је циљ хуманоидне роботике, а HoST нас доводи кључни корак ближе његовом постизању.
Са HoST-ом, хуманоидни роботи би се могли користити у разним областима у будућности где су њихов људски облик и способност интеракције са људским окружењем предности. У бризи о другима, могли би да подржавају старије или болесне особе, помажући им да устану и седну, додајући им предмете или помажући у кућним пословима. У сектору услуга, могли би се користити у хотелима, ресторанима или продавницама за услуживање купаца, превоз робе или пружање информација. У опасним окружењима, као што су помоћ у катастрофама или индустријски погони, могли би да преузму задатке који су превише ризични или напорни за људе.
Штавише, способност устајања је неопходна за опоравак од пада. Падови су чест проблем за хуманоидне роботе, посебно у неравним или динамичним окружењима. Робот који не може сам да устане након пада брзо постаје беспомоћан у таквим окружењима. HoST нуди решење овде, јер омогућава роботу да се исправи чак и из неочекиваних положаја и настави свој задатак. Ово повећава поузданост и безбедност хуманоидних робота, чинећи их робуснијим и практичнијим алатима.
HoST отвара пут новој генерацији хуманоидних робота
HoST је више од пуке еволуције постојећих метода; он представља значајан пробој у контроли хуманоидних робота. Кроз иновативну употребу учења са појачањем са вишекритичном архитектуром и обуком заснованом на наставном плану и програму, превазилази ограничења претходних приступа, омогућавајући роботима да устану из изузетно различитих положаја и на различитим површинама. Успешан пренос са симулације на праве роботе, демонстриран на Unitree G1, и његова импресивна робусност на поремећаје подвлаче огроман потенцијал ове методе за практичну примену.
HoST је важан корак ка хуманоидним роботима који не само да импресионирају у лабораторији, већ могу понудити и праву додатну вредност у стварном свету. Приближава нас визији будућности у којој су хуманоидни роботи беспрекорно интегрисани у наш свакодневни живот, подржавајући нас у разним задацима и чинећи наше животе безбеднијим, удобнијим и ефикаснијим. Са технологијама попут HoST-а, некада футуристичка идеја о хуманоидним роботима који нас прате у свакодневном животу постаје све опипљивија.
У вези са овим:
Ваш глобални партнер за маркетинг и развој пословања
☑️ Наш пословни језик је енглески или немачки
☑️ НОВО: Преписка на вашем матерњем језику!
Ја и мој тим смо срећни што вам можемо бити на располагању као ваш лични саветник.
Можете ме контактирати попуњавањем контакт форме овде или једноставно позовите на +49 89 89 674 804 ( Минхен) . Моја имејл адреса је: [email protected]
Радујем се нашем заједничком пројекту.














