⭐️ Robotika/Robotika ⭐️ XPaper  

Výběr hlasu 📢


Ovládání vstávání humanoidů: S „HoST“ se humanoidi učí vstávat – Průlom pro roboty v každodenním životě

Publikováno: 18. března 2025 / Aktualizováno: 18. března 2025 – Autor: Konrad Wolfenstein

Ovládání vstávání humanoidů: S HoST se humanoidi učí vstávat – Průlom pro roboty v každodenním životě

Ovládání vstávání humanoidů: S HoST se humanoidi učí vstávat – Průlom pro roboty v každodenním životě – Obrázek: humanoid-standingup.github.io

Více než jen vstávání: HoST dláždí cestu pro autonomní a všestranné humanoidní roboty

Od simulace k realitě: Jak HoST učí humanoidní roboty samostatně se postavit

Ve fascinujícím světě humanoidní robotiky, kde stroje stále více napodobují lidské schopnosti, hraje ústřední roli zdánlivě jednoduchá, ale zásadně důležitá dovednost: vstávání. Pro nás lidi je to druhá přirozenost, nevědomý pohyb, který provádíme nespočetněkrát denně. Pro humanoidního robota je však vstávání složitou výzvou vyžadující sofistikované řídicí systémy, přesné senzory a inteligentní algoritmy. Tato schopnost není jen působivou demonstrací inženýrských schopností, ale také nezbytným předpokladem pro to, aby si humanoidní roboti našli své místo v našem každodenním životě a podporovali nás v široké škále úkolů.

Schopnost vstát z různých poloh je mnohem víc než jen příjemná funkce navíc. Je to základ autonomie a všestrannosti humanoidních robotů. Představte si robota, který vám pomáhá v domácnosti, s péčí o ostatní nebo pracuje v nebezpečném prostředí. Ve všech těchto scénářích je schopnost samostatně se postavit z různých poloh klíčová. Robot, který funguje pouze v ideálních výchozích polohách a po pádu zůstane bezmocný, je v reálném světě jednoduše k ničemu. Vývoj robustních a všestranných strategií vstávání je proto klíčovým krokem k přenesení humanoidních robotů z výzkumné laboratoře do reálného světa.

Předchozí přístupy k řešení tohoto problému často narážely na své limity. Mnohé se spoléhaly na pečlivě předprogramované pohybové sekvence, které fungovaly v kontrolovaných prostředích, ale v nepředvídatelné realitě rychle dosáhly svých limitů. Tyto rigidní systémy byly nepružné, nedokázaly se přizpůsobit měnícím se podmínkám a žalostně selhávaly, když robot přistál v neočekávané poloze nebo na nerovném terénu. Jiné přístupy používaly složitá simulační prostředí, ale jejich výsledky bylo často obtížné přenést do skutečných robotů. Skok ze simulace do reality, tzv. „sim-to-real transfer“, se ukázal jako překážka pro mnoho slibných výzkumných přístupů.

V této souvislosti se objevuje inovativní rámec, který by mohl zásadně změnit způsob, jakým přemýšlíme o vstávání humanoidních robotů: HoST, zkratka pro Humanoid Standing-up Control (Humanoid Standing-up Control). HoST je víc než jen další metoda; je to změna paradigmatu. , vyvinutý konsorciem renomovaných univerzit v Asii , včetně Šanghajské univerzity Jiao Tong, Hongkongské univerzity, Univerzity Zhejiang a Čínské univerzity v Hongkongu, boří tradiční přístupy a razí zcela novou cestu k výuce humanoidních robotů vstávat – způsobem, který je úžasně všestranný, robustní a realistický.

Vhodné pro:

HoST: Framework, který se učí z chyb

Jádrem inovace společnosti HoST je aplikace posilovacího učení (RL), metody strojového učení inspirované tím, jak se učí lidé a zvířata. Představte si, že učíte dítě jezdit na kole. Nedáváte mu podrobné instrukce pro každý pohyb svalu; místo toho ho necháte, aby to prostě zkusilo. Pokud dítě upadne, při dalším pokusu své pohyby opraví. Metodou pokusů a omylů, prostřednictvím pozitivní a negativní zpětné vazby se dítě postupně učí zvládat jízdu na kole. Posilovací učení funguje na podobném principu.

V projektu HoST je humanoidní robot umístěn v simulovaném prostředí a má za úkol vstát z různých pozic. Robot v tomto prostředí funguje jako „agent“ a provádí akce, v tomto případě pohyby kloubů a těla. Za každou akci obdrží „odměnu“ nebo „trest“ v závislosti na jejím úspěchu. Vstání má za následek pozitivní odměnu, zatímco pád nebo provádění nežádoucích pohybů má za následek negativní odměnu. Prostřednictvím nesčetných pokusů, získávání zkušeností a optimalizace strategie se robot postupně učí vyvinout nejlepší možnou strategii stání.

Zásadní rozdíl oproti předchozím přístupům založeným na RL spočívá v tom, že HoST se učí od nuly. Nepoužívá žádné předem naprogramované dráhy pohybu, žádné lidské demonstrace ani jiné předchozí znalosti. Robot začíná s prázdným štítem a své strategie vstávání vyvíjí zcela samostatně. To je zásadní pokrok, protože umožňuje systému najít řešení, která mohou daleko překonat to, co si lidští inženýři dokázali představit. Navíc je systém extrémně přizpůsobivý, protože není závislý na rigidních předpokladech ani lidských předsudcích.

Kouzlo multikritické architektury

Dalším klíčovým prvkem inovace HoST je architektura s více kritickými body. Abychom tomu porozuměli, musíme si stručně prohlédnout, jak funguje posilovací učení. V typických systémech RL existují dvě centrální komponenty: aktér a kritik. Aktér je takříkajíc mozek robota, který vybírá akce a rozhoduje, které pohyby by měly být provedeny. Kritik hodnotí akce aktéra a poskytuje zpětnou vazbu. Říká aktérovi, zda jeho akce byly dobré nebo špatné a jak je lze zlepšit. V tradičních přístupech RL existuje obvykle pouze jeden kritik.

HoST se s touto konvencí rozchází a místo toho se spoléhá na více specializovaných kritiků. Představte si, že vstávání zahrnuje několik důležitých aspektů: udržování rovnováhy, zaujímání správného držení těla, koordinaci kloubů a ovládání rotační hybnosti. Každý z těchto aspektů by mohl být vyhodnocen vlastním „expertem“. Přesně to dělá architektura s více kritiky. HoST používá více sítí kritiků, z nichž každá se specializuje na specifický aspekt procesu stání. Například jeden kritik by mohl hodnotit rovnováhu, jiný koordinaci kloubů a třetí rotační hybnost.

Toto rozdělení na specializované kritiky se ukázalo jako nesmírně efektivní. Řeší problém, který se často vyskytuje v tradičních systémech řízení učení: negativní interference. Když se jeden kritik pokouší vyhodnotit všechny aspekty složitého úkolu současně, může docházet ke konfliktům a zmatku. Různé učební cíle se mohou vzájemně překážet, zpomalovat nebo dokonce způsobovat selhání procesu učení. Architektura s více kritiky tento problém obchází tím, že rozdělí učební úkol na menší, lépe zvládnutelné dílčí úkoly a každému dílčímu úkolu přiřadí specializovaného kritika. Aktér pak obdrží zpětnou vazbu od všech kritiků a naučí se optimálně kombinovat různé aspekty vstávání.

Tato architektura s více kritickými body je obzvláště důležitá pro složitý úkol vstávání. Vstávání vyžaduje řadu jemných motorických dovedností a přesné ovládání rotačního momentu pro udržení rovnováhy a zabránění pádu. Prostřednictvím specializovaných kritických bodů dokáže HoST cíleně trénovat a optimalizovat tyto různé aspekty vstávání, což vede k výrazně lepším výsledkům než u konvenčních přístupů používajících jediný kritický bod. Vědci ve svých studiích prokázali, že architektura s více kritickými body umožňuje významné zlepšení výkonu a umožňuje HoST vyvíjet strategie stání, kterých by konvenčními metodami nebylo možné dosáhnout.

Učení se v rámci kurikula: Od jednoduchého ke složitému

Dalším klíčem k úspěchu HoST je školení založené na kurikulu. Tato metoda je založena na lidském procesu učení, ve kterém si krok za krokem osvojujeme složité dovednosti, počínaje jednoduchými základy a postupně se propracováváme k obtížnějším úkolům. Zamyslete se znovu nad příkladem jízdy na kole. Než se dítě naučí jezdit na dvou kolech, může se nejprve naučit udržovat rovnováhu na odrážedle nebo používat pomocná kolečka. Tato přípravná cvičení usnadňují pozdější proces učení a zajišťují rychlejší a úspěšnější pokrok.

HoST implementuje podobný princip. Robot není od začátku konfrontován s nejtěžším úkolem – a to vstáním z jakékoli polohy na jakémkoli povrchu. Místo toho prochází stupňovitým kurikulem, v němž se úkoly postupně stávají složitějšími. Trénink začíná jednoduchými scénáři, jako je vstání z polohy vleže na rovné podlaze. Jakmile robot tento úkol zvládne, podmínky se postupně zvyšují. Přidávají se nové výchozí pozice, jako je vstání ze sedu nebo z polohy vleže s opřením o zeď. Povrch je také rozmanitý, od rovné podlahy přes mírně nerovný povrch až po náročnější terén.

Toto školení založené na kurikulu nabízí několik výhod. Zaprvé umožňuje efektivnější zkoumání prostoru řešení. Robot se zpočátku zaměřuje na základní aspekty stání a učí se je zvládat v jednoduchých scénářích. To urychluje proces učení a umožňuje robotovi rychleji dosáhnout dobré výkonnostní úrovně. Zadruhé, kurikulum zlepšuje zobecnitelnost modelu. Postupným vystavováním robota rozmanitějším a složitějším úkolům se učí přizpůsobovat se různým situacím a rozvíjet robustní strategie stání, které fungují nejen v ideálním, ale i v reálném prostředí. Rozmanitost tréninkových podmínek je klíčová pro robustnost systému v reálném světě, kde jsou nepředvídatelné povrchy a výchozí pozice pravidlem, nikoli výjimkou.

Vhodné pro:

Realismus skrze omezení pohybu

Dalším důležitým aspektem HoSTu je zohlednění použitelnosti v reálném světě. Simulace jsou sice mocným nástrojem pro trénink robotů, ale reálný svět je mnohem složitější a nepředvídatelnější. Aby HoST úspěšně překlenul mezeru mezi simulací a realitou, implementuje dvě základní omezení pohybu, která zajišťují, že naučené strategie lze aplikovat na reálný hardware bez poškození robota.

Prvním omezením je regularizace hladkosti. Cílem je omezit oscilační pohyby. V simulacích mohou roboti provádět pohyby, které by ve skutečnosti byly problematické. Mohou například provádět trhavé, roztřesené pohyby, které by mohly poškodit fyzický hardware nebo vést k nestabilnímu chování. Regularizace hladkosti zajišťuje, že naučené pohyby jsou plynulejší a plynulejší, což je nejen šetrnější k hardwaru, ale také vede k přirozenějšímu a stabilnějšímu chování při vstávání.

Druhým omezením je implicitní limit rychlosti. Ten zabraňuje nadměrně rychlým nebo náhlým pohybům. Simulace opět často představují idealizované podmínky, za kterých by roboti mohli provádět pohyby nerealisticky vysokými rychlostmi. V reálném světě však takové náhlé pohyby mohou robota poškodit, například přetížením motorů nebo poškozením kloubů. Limit rychlosti zajišťuje, že naučené pohyby zůstanou v rámci fyzikálních limitů skutečného hardwaru a neohrozí robota.

Tato omezení pohybu jsou klíčová pro přenos ze simulace do reality. Zajišťují, aby strategie naučené v simulaci fungovaly nejen teoreticky, ale aby je bylo možné implementovat i prakticky na skutečných robotech bez přetížení nebo poškození hardwaru. Jsou důležitým krokem k překlenutí propasti mezi simulací a realitou a k přípravě humanoidních robotů pro použití v reálném světě.

Praktický test: HoST na Unitree G1

Skutečným testem jakékoli metody řízení robota je její praktická implementace na reálném hardwaru. Pro demonstraci schopností HoSTu přenesli vědci strategie řízení naučené v simulaci na humanoidního robota Unitree G1. Unitree G1 je pokročilá humanoidní platforma charakterizovaná svou agilitou, robustností a realistickým designem. Je to ideální testovací platforma pro vyhodnocení schopností HoSTu v reálném světě.

Výsledky praktických testů byly působivé a potvrdily účinnost přístupu HoST. Robot Unitree G1, ovládaný systémem HoST, prokázal pozoruhodné schopnosti stát v široké škále poloh. Úspěšně se postavil z polohy vleže, vsedě, vkleče a dokonce i z poloh, kdy se opíral o předměty nebo na nerovném povrchu. Přenos simulovaných schopností do reálného světa byl téměř bezproblémový, což zdůrazňuje vysokou kvalitu přenosu simulací do reálného světa systémem HoST.

Zvláště pozoruhodná je odolnost vůči rušení, kterou prokázal robot Unitree G1 řízený systémem HoST. V experimentálních testech byl robot vystaven vnějším silám, jako jsou nárazy a otřesy. Byl konfrontován s překážkami, které mu bránily v postavení se. Byl dokonce zatížen těžkými břemeny (až 12 kg), aby se otestovala jeho stabilita a nosnost. Ve všech těchto situacích robot prokázal pozoruhodnou odolnost a úspěšně se narovnal, aniž by ztratil rovnováhu nebo se převrátil.

Působivé demonstrační video jasně ilustrovalo robustnost systému HoST. Ukázalo osobu, jak při vstávání robota Unitree G1 tlačí a kope. Navzdory těmto značným rušením robot zůstal neovlivněn. V reálném čase korigoval své pohyby, přizpůsoboval se neočekávaným nárazům a nakonec se bezpečně a stabilně postavil. Tato demonstrace působivě ilustruje praktickou použitelnost a spolehlivost systému HoST v reálných, nepředvídatelných prostředích.

Vhodné pro:

Ablační studie: Souhra složek

Aby vědci podrobněji prozkoumali význam jednotlivých komponent HoST, provedli rozsáhlé ablační studie. V těchto studiích byly jednotlivé prvky rámce HoST odstraněny nebo upraveny, aby se analyzoval jejich dopad na celkový výkon. Výsledky těchto studií poskytly cenné poznatky o funkčnosti HoST a potvrdily důležitost jeho klíčových inovací.

Klíčovým zjištěním ablačních studií bylo potvrzení klíčové role multikritické architektury. Když vědci upravili systém tak, aby používal pouze jednoho kritika, systém žalostně selhal. Systém se již nedokázal naučit úspěšné vzory stání a robot ve většině případů zůstal bezmocně ležet. Tento výsledek podtrhuje ústřední význam multikritické architektury pro výkon HoST a potvrzuje, že specializovaní kritici skutečně významně přispívají k úspěšnosti učení.

Školení založené na kurikulu se také ukázalo jako klíčový faktor úspěchu v ablačních studiích. Když vědci nahradili kurikulum randomizovaným školením bez postupného zvyšování obtížnosti, výkon systému se výrazně zhoršil. Robot se učil pomaleji, dosahoval nižší úrovně výkonu a byl méně odolný vůči různým výchozím pozicím a povrchům. To potvrzuje předpoklad, že školení založené na kurikulu zlepšuje efektivitu procesu učení a zvyšuje zobecnitelnost modelu.

Implementovaná omezení pohybu také významně přispěla k celkovému výkonu, zejména s ohledem na praktickou použitelnost. I když vědci odstranili regularizaci plynulosti a omezení rychlosti pohybu, robot se v simulaci stále učil strategie obnovy, ale ty byly v realitě méně stabilní a častěji vedly k pádům nebo nežádoucím trhavým pohybům. To ukazuje, že zatímco omezení pohybu v simulaci mírně omezují flexibilitu systému, v reálném světě jsou nezbytná pro zajištění robustního, bezpečného a hardwarově přívětivého chování.

HoST: Odrazový můstek pro všestranné humanoidní roboty

Schopnost vstát z různých poloh se může na první pohled zdát triviální, ale ve skutečnosti je to základní dílek skládačky pro vývoj skutečně všestranných a autonomních humanoidních robotů. Tvoří základ pro integraci do složitějších systémů pro pohyb a manipulaci a otevírá množství nových možností použití. Představte si robota, který se nejen postaví, ale také se plynule pohybuje mezi různými úkoly – vstává z pohovky, jde ke stolu, uchopuje předměty, vyhýbá se překážkám a vstává zpět, pokud zakopne. Tento druh bezproblémové interakce s prostředím, která je pro nás lidi druhou přirozeností, je cílem humanoidní robotiky a HoST nás k jeho dosažení přibližuje o klíčový krok blíž.

Díky platformě HoST by humanoidní roboti mohli být v budoucnu uplatněni v řadě oblastí, kde by jejich lidská podoba a schopnost interakce s lidským prostředím byly výhodné. V péči by mohli podporovat starší nebo nemocné lidi, pomáhat jim vstávat a posazovat se, podávat jim předměty nebo pomáhat s domácími pracemi. V sektoru služeb by mohli být uplatněni v hotelech, restauracích nebo obchodech k obsluze zákazníků, přepravě zboží nebo poskytování informací. V nebezpečných prostředích, jako je pomoc při katastrofách nebo průmyslové závody, by mohli převzít úkoly, které jsou pro člověka příliš riskantní nebo namáhavé.

Schopnost vstát je navíc zásadní pro zotavení se z pádu. Pády jsou pro humanoidní roboty častým problémem, zejména v nerovném nebo dynamickém prostředí. Robot, který se po pádu nedokáže sám zvednout, se v takovém prostředí rychle stává bezmocným. HoST zde nabízí řešení, protože umožňuje robotovi narovnat se i z neočekávaných pozic a pokračovat ve svém úkolu. To zvyšuje spolehlivost a bezpečnost humanoidních robotů, čímž se z nich stává robustnější a praktičtější nástroj.

HoST připravuje cestu pro novou generaci humanoidních robotů

HoST je více než jen vývoj stávajících metod; představuje významný průlom v řízení humanoidních robotů. Díky inovativnímu využití posilovacího učení s multikritickou architekturou a školení založeným na kurikulu překonává omezení předchozích přístupů a umožňuje robotům postavit se z pozoruhodné rozmanitosti pozic a na rozmanitých površích. Úspěšný přenos ze simulace na reálné roboty, demonstrovaný na Unitree G1, a jeho působivá odolnost vůči rušení podtrhují obrovský potenciál této metody pro praktické aplikace.

HoST je důležitým krokem směrem k humanoidním robotům, kteří nejenže ohromí v laboratoři, ale mohou také nabídnout skutečnou přidanou hodnotu v reálném světě. Přibližuje nás vizi budoucnosti, kde budou humanoidní roboti bezproblémově integrováni do našeho každodenního života, budou nás podporovat v různých úkolech a učiní náš život bezpečnějším, pohodlnějším a efektivnějším. S technologiemi, jako je HoST, se kdysi futuristická myšlenka humanoidních robotů, kteří nás doprovázejí v našem každodenním životě, stává stále hmatatelnější.

Vhodné pro:

 

Váš globální partner pro marketing a rozvoj podnikání

☑️ Naším obchodním jazykem je angličtina nebo němčina

☑️ NOVINKA: Korespondence ve vašem národním jazyce!

 

Digitální průkopník - Konrad Wolfenstein

Konrad Wolfenstein

Rád vám a mému týmu posloužím jako osobní poradce.

Kontaktovat mě můžete vyplněním kontaktního formuláře nebo mi jednoduše zavolejte na číslo +49 89 89 674 804 (Mnichov) . Moje e-mailová adresa je: wolfenstein xpert.digital

Těším se na náš společný projekt.

 

 

☑️ Podpora MSP ve strategii, poradenství, plánování a implementaci

☑️ Vytvoření nebo přeladění digitální strategie a digitalizace

☑️ Rozšíření a optimalizace mezinárodních prodejních procesů

☑️ Globální a digitální obchodní platformy B2B

☑️ Pioneer Business Development / Marketing / PR / Veletrhy


⭐️ Robotika/Robotika ⭐️ XPaper