Publicat pe: 18 martie 2025 / Actualizat pe: 18 martie 2025 – Autor: Konrad Wolfenstein

Controlul ridicării în picioare de către umanoizi: Cu HoST, umanoizii învață să se ridice în picioare – Descoperirea pentru roboți în viața de zi cu zi – Imagine: humanoid-standingup.github.io
Mai mult decât simpla ridicare: HoST deschide calea pentru roboți umanoizi autonomi și versatili
De la simulare la realitate: Cum îi învață HoST pe roboții umanoizi să se ridice independent
În lumea fascinantă a roboticii umanoide, unde mașinile imită din ce în ce mai mult abilitățile umane, o abilitate aparent simplă, dar fundamental importantă, joacă un rol central: ridicarea în picioare. Pentru noi, oamenii, este o a doua natură, o mișcare inconștientă pe care o efectuăm de nenumărate ori în fiecare zi. Dar pentru un robot umanoid, ridicarea în picioare este o provocare complexă care necesită sisteme de control sofisticate, senzori preciși și algoritmi inteligenți. Această abilitate nu este doar o demonstrație impresionantă de pricepere inginerească, ci și o condiție prealabilă esențială pentru ca roboții umanoizi să își găsească locul în viața noastră de zi cu zi și să ne sprijine într-o gamă largă de sarcini.
Capacitatea de a se ridica din diferite poziții este mult mai mult decât o simplă caracteristică suplimentară plăcută. Este fundamentul autonomiei și versatilității roboților umanoizi. Imaginați-vă un robot care vă ajută prin casă, vă oferă asistență la îngrijire sau lucrează în medii periculoase. În toate aceste scenarii, capacitatea de a se ridica independent din diferite poziții este crucială. Un robot care funcționează doar în poziții de pornire ideale și este lăsat neajutorat după o cădere este pur și simplu inutil în lumea reală. Prin urmare, dezvoltarea unor strategii robuste și versatile de ridicare în picioare este un pas cheie în aducerea roboților umanoizi din laboratorul de cercetare în lumea reală.
Abordările anterioare de rezolvare a acestei probleme și-au atins adesea limitele. Multe se bazau pe secvențe de mișcare preprogramate cu meticulozitate, care funcționau în medii controlate, dar își atingeau rapid limitele în realitatea imprevizibilă. Aceste sisteme rigide erau inflexibile, incapabile să se adapteze la condițiile schimbătoare și eșuau lamentabil atunci când robotul ateriza într-o poziție neașteptată sau pe un teren denivelat. Alte abordări foloseau medii de simulare complexe, dar rezultatele lor erau adesea dificil de transferat la roboți reali. Saltul de la simulare la realitate, așa-numitul „transfer de la simulare la realitate”, s-a dovedit a fi un obstacol pentru multe abordări de cercetare promițătoare.
În acest context, apare un cadru inovator care ar putea schimba fundamental modul în care percepem roboții umanoizi cum să stea în picioare: HoST, prescurtare de la Humanoid Standing-up Control (Controlul Stabilității Umanoide). HoST este mai mult decât o simplă metodă; este o schimbare de paradigmă. Dezvoltată de un consorțiu de universități renumite din Asia , inclusiv Universitatea Jiao Tong din Shanghai, Universitatea din Hong Kong, Universitatea Zhejiang și Universitatea Chineză din Hong Kong, HoST rupe abordările tradiționale și deschide o cale complet nouă pentru a învăța roboții umanoizi să stea în picioare - într-un mod uimitor de versatil, robust și realist.
Legat de asta:
- Roboții umanoizi, industriali și de servicii sunt în creștere – roboții umanoizi nu mai sunt science fiction
HoST: Un framework care învață din greșeli
Nucleul inovației HoST constă în aplicarea învățării prin consolidare (RL), o metodă de învățare automată inspirată de modul în care învață oamenii și animalele. Imaginați-vă că învățați un copil să meargă pe bicicletă. Nu îi oferiți instrucțiuni detaliate pentru fiecare mișcare musculară; în schimb, îl lăsați pur și simplu să încerce. Dacă copilul cade, își corectează mișcările la următoarea încercare. Prin încercări și erori, prin feedback pozitiv și negativ, copilul învață treptat să stăpânească bicicleta. Învățarea prin consolidare funcționează pe un principiu similar.
În cadrul proiectului HoST, un robot umanoid este plasat într-un mediu simulat și i se atribuie sarcina de a se ridica din diferite poziții. Robotul acționează ca un „agent” în cadrul acestui mediu, efectuând acțiuni, în acest caz, mișcări ale articulațiilor și corpului său. Pentru fiecare acțiune, primește o „recompensă” sau o „pedeapsă”, în funcție de succesul său. Ridicarea în picioare are ca rezultat o recompensă pozitivă, în timp ce căderea sau efectuarea de mișcări nedorite are ca rezultat o recompensă negativă. Prin nenumărate încercări, acumularea de experiență și optimizarea strategiei, robotul învață treptat să dezvolte cea mai bună strategie posibilă de ridicare în picioare.
Diferența crucială față de abordările anterioare bazate pe RL este că HoST învață de la zero. Nu folosește traiectorii de mișcare preprogramate, demonstrații umane sau alte cunoștințe anterioare. Robotul pornește de la zero și își dezvoltă strategiile de ridicare în picioare complet independent. Acesta este un progres fundamental, deoarece permite sistemului să găsească soluții care pot depăși cu mult ceea ce inginerii umani ar fi putut concepe. În plus, face ca sistemul să fie extrem de adaptabil, deoarece nu se bazează pe presupuneri rigide sau prejudecăți umane.
Magia arhitecturii multicritice
Un alt element cheie al inovației HoST este arhitectura multi-critică. Pentru a înțelege acest lucru, trebuie să examinăm pe scurt cum funcționează învățarea prin consolidare. În sistemele RL tipice, există două componente centrale: actorul și criticul. Actorul este, ca să spunem așa, creierul robotului, care selectează acțiunile și decide ce mișcări ar trebui efectuate. Criticul evaluează acțiunile actorului și oferă feedback. Acesta îi spune actorului dacă acțiunile sale au fost bune sau rele și cum pot fi îmbunătățite. În abordările RL tradiționale, există de obicei un singur critic.
HoST încalcă această convenție și se bazează în schimb pe mai mulți critici specializați. Imaginați-vă că ridicarea implică mai multe aspecte importante: menținerea echilibrului, adoptarea posturii corecte, coordonarea articulațiilor și controlul impulsului de rotație. Fiecare dintre aceste aspecte ar putea fi evaluat de propriul „expert”. Exact asta face arhitectura multi-critică. HoST utilizează mai multe rețele de critici, fiecare specializată într-un aspect specific al procesului de ridicare în picioare. De exemplu, un critic ar putea evalua echilibrul, un altul coordonarea articulațiilor și un al treilea impulsul de rotație.
Această împărțire în critici specializați s-a dovedit a fi extrem de eficientă. Rezolvă o problemă care apare adesea în sistemele tradiționale de management al învățării: interferența negativă. Atunci când un singur critic încearcă să evalueze simultan toate aspectele unei sarcini complexe, pot apărea conflicte și confuzii. Diversele obiective de învățare se pot împiedica reciproc, încetinind sau chiar provocând eșecul procesului de învățare. Arhitectura multi-critică ocolește această problemă prin împărțirea sarcinii de învățare în subsarcini mai mici și mai ușor de gestionat și prin atribuirea unui critic specializat fiecărei subsarcini. Actorul primește apoi feedback de la toți criticii și învață să combine optim diferitele aspecte ale ridicării în funcție.
Această arhitectură multi-critică este deosebit de relevantă pentru sarcina complexă de ridicare în picioare. Ridicarea în picioare necesită o varietate de abilități motorii fine și un control precis al impulsului de rotație pentru a menține echilibrul și a evita căderile. Prin intermediul criticilor săi specializați, HoST poate antrena și optimiza în mod specific aceste aspecte diferite ale ridicării în picioare, ducând la rezultate semnificativ mai bune decât abordările convenționale care utilizează un singur critic. Cercetătorii au demonstrat în studiile lor că arhitectura multi-critică permite o îmbunătățire semnificativă a performanței și permite HoST să dezvolte strategii de ridicare în picioare care ar fi imposibil de atins cu metodele convenționale.
Învățarea curriculară: de la simplu la complex
O altă cheie a succesului HoST este instruirea bazată pe curriculum. Această metodă se bazează pe procesul uman de învățare, în care dobândim abilități complexe pas cu pas, începând cu elemente de bază simple și apoi trecând treptat la sarcini mai dificile. Gândiți-vă din nou la exemplul mersului pe bicicletă. Înainte ca un copil să învețe să meargă pe două roți, ar putea învăța mai întâi să se echilibreze pe o bicicletă de echilibru sau să folosească roți de antrenament. Aceste exerciții pregătitoare facilitează procesul de învățare ulterior și asigură un progres mai rapid și mai reușit.
HoST implementează un principiu similar. Robotul nu se confruntă de la bun început cu cea mai dificilă sarcină - și anume, ridicarea din orice poziție pe orice suprafață. În schimb, acesta parcurge un curriculum pe etape, în care sarcinile devin treptat mai complexe. Antrenamentul începe cu scenarii simple, cum ar fi ridicarea din poziția culcat pe o podea plană. Odată ce robotul a stăpânit această sarcină, condițiile devin progresiv mai dificile. Se adaugă noi poziții de pornire, cum ar fi ridicarea din poziția așezat sau din poziția culcat și sprijinirea de un perete. Suprafața este, de asemenea, variată, de la podea plană la suprafețe ușor neuniforme și, în final, la terenuri mai solicitante.
Această instruire bazată pe curriculum oferă mai multe avantaje. În primul rând, permite o explorare mai eficientă a spațiului soluțiilor. Robotul se concentrează inițial pe aspectele fundamentale ale ridicării în picioare și învață să le stăpânească în scenarii simple. Acest lucru accelerează procesul de învățare, permițând robotului să atingă mai rapid un nivel bun de performanță. În al doilea rând, curriculumul îmbunătățește generalizabilitatea modelului. Prin expunerea treptată a robotului la sarcini mai diverse și mai complexe, acesta învață să se adapteze la diferite situații și să dezvolte strategii robuste de ridicare în picioare care funcționează nu numai în medii ideale, ci și în medii reale. Varietatea condițiilor de antrenament este crucială pentru robustețea sistemului în lumea reală, unde suprafețele imprevizibile și pozițiile de pornire sunt regula, nu excepția.
Legat de asta:
- Robotul umanoid Navigator Alpha α și Centrul de Inovație pentru Roboți Umanoizi Zhejiang al SUPCON (China)
Realism prin restricții de mișcare
Un alt aspect important al HoST este luarea în considerare a aplicabilității în lumea reală. Deși simulările sunt un instrument puternic pentru antrenamentul roboților, lumea reală este mult mai complexă și imprevizibilă. Pentru a reduce cu succes decalajul dintre simulare și realitate, HoST implementează două constrângeri esențiale de mișcare care asigură că strategiile învățate pot fi aplicate hardware-ului real fără a deteriora robotul.
Prima constrângere este regularizarea netezimii. Aceasta își propune să reducă mișcările oscilatorii. În simulări, roboții pot efectua mișcări care ar fi problematice în realitate. De exemplu, ar putea face mișcări sacadate și tremurânde care ar putea deteriora hardware-ul fizic sau ar putea duce la un comportament instabil. Regularizarea netezimii asigură că mișcările învățate sunt mai line și mai fluide, ceea ce nu este doar mai blând cu hardware-ul, ci are ca rezultat și un comportament în picioare mai natural și mai stabil.
A doua limitare este limita implicită de viteză. Aceasta previne mișcările excesiv de rapide sau bruște. Din nou, simulările reprezintă adesea condiții idealizate în care roboții ar putea efectua mișcări la viteze nerealist de mari. În lumea reală, însă, astfel de mișcări bruște pot deteriora robotul, de exemplu, prin supraîncărcarea motoarelor sau deteriorarea articulațiilor. Limita de viteză asigură că mișcările învățate rămân în limitele fizice ale hardware-ului real și nu pun în pericol robotul.
Aceste restricții de mișcare sunt cruciale pentru transferul cunoștințelor din simulare în lumea reală. Ele asigură că strategiile învățate în simulare nu numai că funcționează teoretic, ci pot fi implementate și practic pe roboți reali, fără a supraîncărca sau deteriora hardware-ul. Ele reprezintă un pas important în reducerea decalajului dintre simulare și realitate și în pregătirea roboților umanoizi pentru utilizarea în lumea reală.
Testul practic: HoST pe Unitree G1
Adevăratul test al oricărei metode de control al robotului este implementarea sa practică pe hardware real. Pentru a demonstra capacitățile HoST, cercetătorii au transferat strategiile de control învățate în simulare pe robotul umanoid Unitree G1. Unitree G1 este o platformă umanoidă avansată, caracterizată prin agilitate, robustețe și design realist. Este un platformă de testare ideală pentru evaluarea capacităților HoST în lumea reală.
Rezultatele testelor practice au fost impresionante și au confirmat eficacitatea abordării HoST. Robotul Unitree G1, controlat de HoST, a demonstrat capacități remarcabile de a sta în picioare dintr-o gamă largă de poziții. S-a ridicat cu succes din poziția culcat, din poziția așezat, din poziția în genunchi și chiar din poziții în care se sprijinea de obiecte sau pe teren denivelat. Transferul capabilităților simulate în lumea reală a fost aproape perfect, subliniind calitatea înaltă a transferului de la simulare la realitate al HoST.
De remarcat în mod special este robustețea la perturbații demonstrată de Unitree G1 controlat de HoST. În testele experimentale, robotul a fost supus unor forțe externe, cum ar fi lovituri și impacturi. S-a confruntat cu obstacole care i-au blocat capacitatea de a se ridica. A fost chiar încărcat cu sarcini grele (până la 12 kg) pentru a-i testa stabilitatea și capacitatea portantă. În toate aceste situații, robotul a demonstrat o rezistență remarcabilă și s-a redresat cu succes fără a-și pierde echilibrul sau a cădea.
Un videoclip demonstrativ impresionant a ilustrat clar robustețea sistemului HoST. Acesta a arătat o persoană împingând și lovind robotul Unitree G1 în timp ce acesta se ridica în picioare. În ciuda acestor perturbări semnificative, robotul a rămas neperturbat. Și-a corectat mișcările în timp real, s-a adaptat la impacturile neașteptate și, în cele din urmă, s-a ridicat în siguranță și stabil. Această demonstrație ilustrează în mod impresionant aplicabilitatea practică și fiabilitatea sistemului HoST în medii reale, imprevizibile.
Legat de asta:
Studii de ablație: Interacțiunea componentelor
Pentru a examina mai îndeaproape semnificația componentelor individuale ale HoST, cercetătorii au efectuat studii ample de ablație. În aceste studii, elemente individuale ale cadrului HoST au fost eliminate sau modificate pentru a analiza impactul lor asupra performanței generale. Rezultatele acestor studii au oferit informații valoroase despre funcționalitatea HoST și au confirmat importanța inovațiilor sale principale.
O constatare cheie a studiilor de ablație a fost confirmarea rolului crucial al arhitecturii multi-critice. Când cercetătorii au modificat sistemul pentru a utiliza un singur critic, sistemul a eșuat lamentabil. Nu a mai fost capabil să învețe modele de stat în picioare, iar robotul a rămas neajutorat întins în majoritatea cazurilor. Acest rezultat subliniază importanța centrală a arhitecturii multi-critice pentru performanța HoST și confirmă faptul că criticii specializați aduc într-adevăr o contribuție semnificativă la succesul învățării.
Antrenamentul bazat pe curriculum s-a dovedit, de asemenea, a fi un factor cheie de succes în studiile de ablație. Atunci când cercetătorii au înlocuit programa cu antrenament randomizat, fără o creștere treptată a dificultății, performanța sistemului s-a deteriorat semnificativ. Robotul a învățat mai lent, a atins un nivel de performanță mai scăzut și a fost mai puțin robust la diferite poziții de pornire și suprafețe. Acest lucru confirmă presupunerea că antrenamentul bazat pe curriculum îmbunătățește eficiența procesului de învățare și crește generalizabilitatea modelului.
Constrângerile de mișcare implementate au contribuit semnificativ și la performanța generală, în special în ceea ce privește aplicabilitatea practică. Chiar și atunci când cercetătorii au eliminat regularizarea netezimii și limita de viteză de mișcare, robotul a învățat în continuare strategii de recuperare în simulare, dar acestea au fost mai puțin stabile în realitate și au dus mai frecvent la căderi sau mișcări sacadate nedorite. Acest lucru demonstrează că, deși constrângerile de mișcare limitează ușor flexibilitatea sistemului în simulare, ele sunt esențiale în lumea reală pentru a asigura un comportament robust, sigur și prietenos cu hardware-ul.
HoST: O rampă de lansare pentru roboți umanoizi versatili
Abilitatea de a se ridica din diferite poziții poate părea banală la prima vedere, dar în realitate este o piesă fundamentală a puzzle-ului pentru dezvoltarea de roboți umanoizi cu adevărat versatili și autonomi. Aceasta formează baza integrării în sisteme de locomoție și manipulare mai complexe și deschide o multitudine de noi posibilități de aplicare. Imaginați-vă un robot care nu numai că se poate ridica în picioare, dar se poate și deplasa fără probleme între diferite sarcini - ridicarea de pe canapea, mersul la masă, apucarea obiectelor, evitarea obstacolelor și ridicarea înapoi dacă se împiedică. Acest tip de interacțiune perfectă cu mediul, care este o a doua natură pentru noi, oamenii, este scopul roboticii umanoide, iar HoST ne aduce cu un pas crucial mai aproape de atingerea acestuia.
Cu HoST, roboții umanoizi ar putea fi utilizați în viitor într-o varietate de domenii, unde forma lor umană și capacitatea de a interacționa cu mediul uman sunt avantajoase. În îngrijire, ar putea sprijini persoanele în vârstă sau bolnave, ajutându-le să se ridice și să se așeze, dându-le obiecte sau ajutându-le cu treburile casnice. În sectorul serviciilor, ar putea fi utilizați în hoteluri, restaurante sau magazine pentru a servi clienții, a transporta mărfuri sau a oferi informații. În medii periculoase, cum ar fi ajutorul în caz de dezastru sau fabricile industriale, ar putea prelua sarcini care sunt prea riscante sau obositoare pentru oameni.
În plus, capacitatea de a se ridica este esențială pentru recuperarea după căderi. Căderile sunt o problemă frecventă pentru roboții umanoizi, în special în medii denivelate sau dinamice. Un robot care nu se poate ridica singur după o cădere devine rapid neajutorat în astfel de medii. HoST oferă o soluție în acest sens, deoarece permite robotului să se redreseze chiar și din poziții neașteptate și să își continue sarcina. Acest lucru crește fiabilitatea și siguranța roboților umanoizi, făcându-i instrumente mai robuste și mai practice.
HoST deschide calea pentru o nouă generație de roboți umanoizi
HoST este mai mult decât o simplă evoluție a metodelor existente; reprezintă o descoperire semnificativă în controlul roboților umanoizi. Prin utilizarea inovatoare a învățării prin consolidare cu o arhitectură multi-critică și instruire bazată pe curriculum, aceasta depășește limitele abordărilor anterioare, permițând roboților să se ridice dintr-o varietate remarcabilă de poziții și pe diverse suprafețe. Transferul cu succes de la simulare la roboți reali, demonstrat pe Unitree G1, și robustețea sa impresionantă împotriva perturbațiilor subliniază potențialul enorm al acestei metode pentru aplicații practice.
HoST este un pas important către roboții umanoizi care nu numai că impresionează în laborator, dar pot oferi și o valoare adăugată reală în lumea reală. Ne apropie de viziunea unui viitor în care roboții umanoizi sunt integrați perfect în viața noastră de zi cu zi, sprijinindu-ne într-o varietate de sarcini și făcându-ne viața mai sigură, mai confortabilă și mai eficientă. Cu tehnologii precum HoST, ideea cândva futuristă a roboților umanoizi care ne însoțesc în viața de zi cu zi devine din ce în ce mai tangibilă.
Legat de asta:
Partenerul dumneavoastră global de marketing și dezvoltare a afacerilor
☑️ Limba noastră de afaceri este engleza sau germana
☑️ NOU: Corespondență în limba ta maternă!
Eu și echipa mea suntem bucuroși să vă fim la dispoziție în calitate de consilier personal.
Mă puteți contacta completând formularul de contact de aici sau pur și simplu sunându-mă la +49 89 89 674 804 ( München) . Adresa mea de e-mail este: wolfenstein@xpert.digital
Aștept cu nerăbdare proiectul nostru comun.














