⭐ Robotik/robotik ⭐ Xpaper  

Röstval 📱


Humanoid Standing-Up Control: LÀr dig att stÄ upp med "vÀrd" humanoider-genombrottet för robotar i vardagen

Publicerad: 18 mars 2025 / UPDATE FrÄn: 18 mars 2025 - Författare: Konrad Wolfenstein

Humanoid Standing-Up Control: LÀr dig att stÄ upp med vÀrd humanoider-genombrottet för robotar i vardagen

Humanoid Standing-Up Control: LÀrande att stÄ upp med vÀrdar-genombrottet för robotar i vardagen-Image: Humanoid-standup.github.io

Mer Àn bara att stÄ upp: vÀrd banar vÀgen för autonoma och mÄngsidiga humanoidrobotar

FrÄn simuleringen till verkligheten: Hur vÀrd för humanoidrobotar lÀr sig sjÀlvföretagen

I den fascinerande vÀrlden av humanoidrobotik, dÀr maskiner imiterar mer och mer mÀnskliga förmÄgor, Àr en uppenbarligen enkel men grundlÀggande viktig skicklighet att spela en central roll: att stÄ upp. Det Àr naturligtvis för oss mÀnniskor, en medvetslös rörelse som vi utför otaliga gÄnger varje dag. Men för en humanoidrobot Àr det en komplex utmaning som krÀver interaktion mellan sofistikerad kontroll, exakta sensorer och intelligenta algoritmer. Denna förmÄga Àr emellertid inte bara en imponerande demonstration av ingenjörskonst, utan ocksÄ en vÀsentlig förutsÀttning för humanoidrobotar finner sin plats i vÄr vardag och kan stödja oss inom olika ansvarsomrÄden.

Att stÄ upp frÄn olika positioner Àr mycket mer Àn bara en trevlig ytterligare funktion. Det Àr grunden för autonomi och mÄngsidighet hos humanoidrobotar. FörestÀll dig att en robot ska hjÀlpa dig i hushÄllet, hjÀlpa till med vÄrd eller arbeta i farliga miljöer. I alla dessa scenarier Àr förmÄgan att stÀlla in oberoende frÄn olika platser av avgörande betydelse. En robot som bara fungerar i idealiska startpositioner och förblir hjÀlplös nÀr man faller Àr helt enkelt oanvÀndbar i den verkliga vÀrlden. Utvecklingen av robusta och mÄngsidiga upp -till -upp -strategier Àr dÀrför ett viktigt steg för att föra humanoidrobotar frÄn forskningslaboratoriet till den verkliga vÀrlden.

Tidigare tillvÀgagÄngssÀtt för att lösa detta problem nÄdde ofta sina grÀnser. MÄnga var baserade pÄ mödosamt förprogrammerade rörelser som arbetade i kontrollerade miljöer, men nÄdde snabbt sina grÀnser i oförutsÀgbar verklighet. Dessa styva system var oflexibla, kunde inte anpassa sig till förÀndrade förhÄllanden och misslyckas elÀndigt nÀr roboten landade i ett ovÀntat lÀge eller var pÄ ojÀmna ytor. Andra tillvÀgagÄngssÀtt förlitar sig pÄ komplexa simuleringsmiljöer, vars resultat ofta var svÄra att överföra till riktiga robotar. SprÄnget frÄn simuleringen till verkligheten, den sÄ kallade "Sim-to-Real Transfer", visade sig vara snubblan för mÄnga lovande forskningsmetoder.

I detta sammanhang kommer ett innovativt ramverk in i scenen som i grunden kan förÀndra vÄrt sÀtt att tÀnka pÄ att fÄ upp humanoidrobotar: vÀrd, kort för humanoid stÄende kontroll. VÀrd Àr mer Àn bara en annan metod; Det Àr ett paradigmskifte. Utvecklad av ett konsortium av kÀnda universitet i Asien , inklusive Shanghai Jiao Tong University, University of Hong Kong, Zhejiang University och det kinesiska universitetet i Hong Kong, Àr vÀrd att bryta med traditionella tillvÀgagÄngssÀtt och tar ett helt nytt sÀtt att lÀra humanoidrobotar - pÄ ett sÀtt som Àr förvÄnansvÀrt mÄngsidigt, robust och realistiskt.

LÀmplig för detta:

VÀrd: En ram som lÀr sig av misstag

KÀrnan i vÀrdinnovationen ligger i anvÀndningen av förstÀrkningsinlÀrning (RL), en metod för maskininlÀrning som Àr inspirerad av hur mÀnniskor och djur lÀr sig. FörestÀll dig att du undervisar en barncykling. De ger honom inte detaljerade instruktioner för varje muskelrörelse, utan lÄter det helt enkelt prova det. Om barnet faller dÀr korrigerar det hans rörelser vid nÀsta försök. Genom försök och fel lÀr barnet gradvis att behÀrska cykeln genom positiv och negativ feedback. FörstÀrkningsinlÀrning fungerar enligt en liknande princip.

NÀr det gÀller vÀrd placeras en humanoidrobot i en simulerad miljö och konfronteras med uppgiften att stÄ upp frÄn olika positioner. Roboten fungerar som ett "agent" i detta omrÄde. Det utför handlingar, i detta fall rörelser i hans leder och hans kropp. För varje kampanj fÄr han en "belöning" eller "straff", beroende pÄ hur framgÄngsrik den var. Om han stÄr upp fÄr han en positiv belöning. Om det faller eller gör oönskade rörelser fÄr han en negativ belöning. Genom otaliga försök att fÄ erfarenhet och optimering av sina strategier lÀr sig roboten gradvis att utveckla bÀsta möjliga stand -up -strategi.

Den avgörande skillnaden i tidigare RL-baserade tillvÀgagÄngssÀtt Àr att vÀrd lÀr sig frÄn början. Inga förprogrammerade rörelser, inga mÀnskliga demonstrationer eller annan tidigare kunskap anvÀnds. Roboten börjar med ett "tomt ark" och utvecklar sina upp -datumstrategier helt oberoende. Detta Àr en grundlÀggande framsteg, eftersom det gör det möjligt för systemet att hitta lösningar som kan gÄ lÄngt utöver vad mÀnskliga ingenjörer kunde ha kommit med. Dessutom gör systemet det extremt anpassningsbart eftersom det inte förlitar sig pÄ styva antaganden eller mÀnsklig förspÀnning.

Magin i den multikritiska arkitekturen

Ett annat hjÀrta av vÀrdinnovation Àr den multikritiska arkitekturen. För att förstÄ det mÄste vi kort hantera funktionen av förstÀrkning. Det finns tvÄ centrala komponenter i typiska RL -system: stÀlldonet och kritikern. StÀlldonet Àr, sÄ att sÀga, robotens hjÀrna som vÀljer handlingarna, dvs beslutar vilka rörelser som ska genomföras. Kritikern utvÀrderar stÀlldonets handlingar och ger honom feedback. Han berÀttar för stÀlldonet om hans handlingar var bra eller dÄliga och hur de kan förbÀttras. I traditionella RL -metoder finns det vanligtvis bara en kritiker.

VÀrd bryter med denna konvention och förlitar sig istÀllet pÄ flera specialiserade kritiker. FörestÀll dig att det finns olika aspekter nÀr du stÄr upp som Àr viktiga: hÄll balans, ta rÀtt hÄllning, koordinera leder, kontrollera den roterande impulsen. Var och en av dessa aspekter kan utvÀrderas av sin egen "expert". Det Àr exakt vad som gör den multikritiska arkitekturen. VÀrd anvÀnder flera kritikernÀtverk, som var och en Àr specialiserad pÄ en viss aspekt av startprocessen. En kritiker kan till exempel betygsÀtta balansen, en annan den gemensamma samordningen och en tredje part till den roterande impulsen.

Denna uppdelning i specialiserade kritiker har visat sig vara extremt effektiv. Det löser ett problem som ofta uppstÄr i traditionella RL -system: den negativa störningen. Om en enda kritiker försöker utvÀrdera alla aspekter av en komplex uppgift samtidigt kan konflikter och förvirring uppstÄ. De olika inlÀrningsmÄlen kan hindra varandra och bromsa inlÀrningsprocessen eller till och med fÄ den att misslyckas. Den multikritiska arkitekturen kringgÄr detta problem genom att demontera inlÀrningsuppgiften till mindre, tydligare undertag och anvÀnda en specialiserad kritiker för varje partiell uppgift. StÀlldonet fÄr sedan feedback frÄn alla kritiker och lÀr sig att optimalt kombinera de olika aspekterna av att stÄ upp.

Denna multikritiska arkitektur Àr sÀrskilt relevant för den komplexa uppgiften att stÄ upp. Att stÄ upp krÀver en mÀngd fina motoriska fÀrdigheter och exakt kontroll av den roterande impulsen för att hÄlla balansen och inte falla över. Genom de specialiserade kritikerna kan vÀrd specifikt trÀna och optimera dessa olika aspekter av att stÄ upp, vilket leder till betydligt bÀttre resultat Àn konventionella tillvÀgagÄngssÀtt med en enda kritiker. I sina studier har forskarna visat att den multikritiska arkitekturen möjliggör ett betydande sprÄng i prestanda och gör det möjligt att utveckla stand-up-strategier som skulle vara oÄtkomliga med konventionella metoder.

LÀroplaninlÀrning: frÄn det enkla till komplexet

En annan nyckel till vÀrdens framgÄng Àr den lÀroplanbaserade utbildningen. Denna metod Àr baserad pÄ den mÀnskliga inlÀrningsprocessen, dÀr vi gradvis lÀr oss komplexa fÀrdigheter, börjar med enkla grunder och sedan lÄngsamt arbetar upp till oss. TÀnk pÄ exemplet med cykling. Innan ett barn lÀr sig att köra pÄ tvÄ hjul kan det lÀra sig att hÄlla balansen pÄ ett pumphjul eller köra med supportcyklar. Dessa förberedande övningar underlÀttar den senare inlÀrningsprocessen och sÀkerstÀller snabbare och mer framgÄngsrika framsteg.

VÀrd implementerade en liknande princip. Roboten konfronteras inte med den svÄraste uppgiften redan frÄn början, nÀmligen att stÄ upp pÄ nÄgon yta frÄn nÄgon position. IstÀllet utsÀtts den för en förskjuten lÀroplan dÀr uppgifterna gradvis blir mer komplexa. TrÀningen börjar med enkla scenarier, till exempel att stÄ upp frÄn ett liggande lÀge pÄ det platta golvet. SÄ snart roboten har behÀrskat denna uppgift vÀl blir förhÄllandena gradvis svÄrare. Det finns nya startpositioner för hur man stÄr upp frÄn sittande lÀge eller frÄn att ligga pÄ en vÀgg. Ytan Àr ocksÄ varierad, frÄn jÀmn jord till nÄgot ojÀmna ytor till mer krÀvande terrÀng.

Denna lĂ€roplanbaserade utbildning har flera fördelar. Å ena sidan möjliggör det effektivare utforskning av lösningsutrymmet. Roboten fokuserar initialt pĂ„ de grundlĂ€ggande aspekterna av att stĂ„ upp och lĂ€r sig att behĂ€rska dem i enkla scenarier. Detta pĂ„skyndar inlĂ€rningsprocessen och roboten nĂ„r en bra prestanda snabbare. Å andra sidan förbĂ€ttrar lĂ€roplanen generaliseringen av modellen. Genom att gradvis konfrontera roboten med mer varierade och komplexa uppgifter lĂ€r han sig att anpassa sig till olika situationer och utveckla robusta upp -till -upp -strategier som inte bara fungerar i ideal utan ocksĂ„ i verkliga miljöer. Olika trĂ€ningsförhĂ„llanden Ă€r avgörande för systemets robusthet i den verkliga vĂ€rlden, dĂ€r oförutsĂ€gbara ytor och startpositioner Ă€r regeln och inte undantaget.

LÀmplig för detta:

Verklighet genom rörelsebegrÀnsningar

En annan viktig aspekt av vÀrden Àr att ta hÀnsyn till verklig anvÀndbarhet. Simuleringar Àr ett kraftfullt verktyg för trÀningsrobotar, men den verkliga vÀrlden Àr ojÀmlik mer komplex och oförutsÀgbar. För att framgÄngsrikt behÀrska sprÄnget frÄn simuleringen till verkligheten implementerar vÀrd tvÄ betydande begrÀnsningar för rörelse som sÀkerstÀller att de lÀrda strategierna ocksÄ kan implementeras pÄ verklig hÄrdvara och inte skadar roboten.

Den första begrÀnsningen Àr jÀmnhetsreglering. Detta syftar till att minska oscillerande rörelser. I simuleringar kan robotar genomföra rörelser som skulle vara problematiska i verkligheten. Till exempel kan de göra ryckiga, skakande rörelser som kan vara skadliga för den fysiska hÄrdvaran eller skulle leda till instabilt beteende. SlÀthetsregleringen sÀkerstÀller att de lÀrda rörelserna Àr jÀmnare och flytande, vilket inte bara Àr mildare för hÄrdvaran, utan ocksÄ leder till ett mer naturligt och stabilt stand-up-beteende.

Den andra begrĂ€nsningen Ă€r den implicita rörelseshastighetsgrĂ€nsen. Detta förhindrar för snabba eller plötsliga rörelser. Även hĂ€r representerar simuleringar ofta idealiserade förhĂ„llanden dĂ€r robotar kan utföra rörelser med orealistiskt höga hastigheter. I den verkliga vĂ€rlden kan emellertid sĂ„dana plötsliga rörelser leda till skador pĂ„ roboten, till exempel för att överbelasta motorerna eller skadorna pĂ„ lederna. RörelseshastighetsgrĂ€nsen sĂ€kerstĂ€ller att de lĂ€rda rörelserna förblir inom de fysiska grĂ€nserna för den verkliga hĂ„rdvaran och inte Ă€ventyrar roboten.

Dessa begrÀnsningar för rörelse Àr avgörande för SIM-till-verklig överföring. De sÀkerstÀller att de strategier som lÀrts i simuleringen inte bara fungerar teoretiskt, utan ocksÄ kan genomföras praktiskt taget pÄ riktiga robotar utan att överbelasta eller skada hÄrdvaran. De Àr ett viktigt steg för att överbrygga klyftan mellan simulering och verklighet och förbereda humanoidrobotar för anvÀndning i den verkliga vÀrlden.

Det praktiska testet: VÀrd pÄ Unitree G1

Det verkliga testet för varje robotkontrollmetod Àr den praktiska implementeringen pÄ verklig hÄrdvara. För att demonstrera vÀrdens prestanda överförde forskarna de kontrollstrategier som lÀrt sig i simuleringen till Unitree G1 Humanoid Robot. Untree G1 Àr en avancerad humanoidplattform som kÀnnetecknas av dess smidighet, robusthet och realistisk konstruktion. Det Àr en idealisk testbÀdd för att utvÀrdera vÀrdens fÀrdigheter i den verkliga vÀrlden.

Resultaten av de praktiska testerna var imponerande och bekrĂ€ftade effektiviteten i vĂ€rdmetoden. UnTree G1 -roboten, kontrollerad av vĂ€rd, visade anmĂ€rkningsvĂ€rda pĂ„verkningsfunktioner frĂ„n en mĂ€ngd olika positioner. Han kunde framgĂ„ngsrikt stĂ„ upp frĂ„n ett liggande lĂ€ge, frĂ„n sittande lĂ€ge, frĂ„n knĂ€na och till och med frĂ„n positioner dĂ€r han lutade sig mot föremĂ„l eller var pĂ„ den ojĂ€mna ytan. Överföringen av de simulerade fĂ€rdigheterna till den verkliga vĂ€rlden var nĂ€stan smidig, vilket understryker den höga kvaliteten pĂ„ den sim-till-verkliga överföringen frĂ„n vĂ€rden.

SÀrskilt anmÀrkningsvÀrt Àr robustheten hos störningar som den vÀrdstyrda Unitree G1 demonstrerade. I experimentella tester konfronterades roboten med yttre krafter, till exempel av stötar eller slag. Han konfronterades med hinder som blockerade hans upp. Den laddades till och med med tunga belastningar (upp till 12 kg) för att testa dess stabilitet och belastningskapacitet. I alla dessa situationer visade roboten ett anmÀrkningsvÀrt motstÄnd och kunde framgÄngsrikt stÀlla in utan att förlora eller störta balansen.

I en imponerande demonstrationsvideo blev vÀrdens robusthet sÀrskilt tydlig. DÀr kunde du se hur en person stötte pÄ Unitree G1 -roboten under startprocessen. Trots dessa massiva störningar kunde roboten inte tas bort. Han korrigerade sina rörelser i realtid, anpassade de ovÀntade effekterna och stod slutligen upp sÀkert och stabilt. Denna demonstration illustrerar imponerande vÀrdsystemets praktiska anvÀndbarhet och tillförlitlighet i verkliga, oförutsÀgbara miljöer.

LÀmplig för detta:

Ablationsstudier: Interaktionen mellan komponenterna

För att undersöka vikten av de enskilda komponenterna i vÀrdar mer exakt genomförde forskarna omfattande ablationsstudier. I dessa studier avlÀgsnades eller Àndrades enskilda element i vÀrdramarna för att analysera deras inflytande pÄ den totala prestandan. Resultaten frÄn dessa studier gav vÀrdefull insikt om vÀrdens funktion och bekrÀftade vikten av de centrala innovationerna.

Ett centralt resultat av ablationsstudierna bekrÀftade den avgörande rollen för den multikritiska arkitekturen. NÀr forskarna modifierade systemet pÄ ett sÄdant sÀtt att det bara anvÀnde en enda kritiker misslyckades systemet ynkligt. Det kunde inte lÀngre lÀra sig framgÄngsrika risker och roboten förblev hjÀlplös i de flesta fall. Detta resultat understryker den centrala betydelsen av den multikritiska arkitekturen för att utföra vÀrdens prestanda och bekrÀftar att de specialiserade kritikerna faktiskt ger ett betydande bidrag till inlÀrningsframgÄngen.

Den lÀroplanbaserade utbildningen visade sig ocksÄ vara en viktig framgÄngsfaktor i ablationsstudierna. NÀr forskarna ersatte lÀroplanen genom slumpmÀssig utbildning utan gradvis svÄrighetsgrad, försÀmrades systemets prestanda. Roboten lÀrde sig lÄngsammare, nÄdde en lÀgre prestanda och var mindre robust jÀmfört med olika startpositioner och underlag. Detta bekrÀftar antagandet att den lÀroplanbaserade utbildningen förbÀttrar effektiviteten i inlÀrningsprocessen och ökar generaliseringen av modellen.

De implementerade rörelsebegrÀnsningarna bidrog ocksÄ vÀsentligt till den totala produktionen, sÀrskilt med avseende pÄ praktisk tillÀmpbarhet. NÀr forskarna tog bort jÀmnhetsreglering och rörelseshastighetsgrÀnsen lÀrde roboten fortfarande i simuleringen, men i verkligheten var de mindre stabila och ledde oftare att falla eller leda till oönskade, ryckiga rörelser. Detta visar att rörelsens begrÀnsningar begrÀnsar systemets flexibilitet i simuleringen, men Àr vÀsentliga i den verkliga vÀrlden för att sÀkerstÀlla robust, sÀkert och hÄrdvaruvÀnligt beteende.

VÀrd: En sprÄngbrÀda för mÄngsidiga humanoidrobotar

FörmÄgan att stÄ upp frÄn olika positioner kan verka triviala vid första anblicken, men Àr faktiskt ett grundlÀggande pussel för utveckling av riktigt mÄngsidiga och autonoma humanoidrobotar. Det Àr grunden för integration i mer komplexa rörelse- och manipulationssystem och öppnar upp en mÀngd nya applikationer. FörestÀll dig att en robot inte bara kan stÄ upp, utan ocksÄ flytta sömlöst mellan olika uppgifter - stÄ upp frÄn soffan, gÄ till bordet, ta föremÄl, undvika hinder och stÄ upp nÀr han snubblar. Denna typ av sömlös interaktion med miljön, som naturligtvis Àr för oss mÀnniskor, Àr mÄlet för humanoidrobotik och vÀrd ger oss ett avgörande steg nÀrmare detta mÄl.

VÀrd kan anvÀndas med vÀrd i framtiden i en mÀngd olika omrÄden dÀr deras mÀnskliga form och deras förmÄga att interagera med den mÀnskliga miljön Àr fördelaktiga. PÄ omvÄrdnad kan de stödja Àldre eller sjuka mÀnniskor, hjÀlpa dem att stÄ upp och sitta ner, tillrÀckligt med föremÄl eller hjÀlpa till i hushÄllet. I serviceomrÄdet kan de anvÀndas pÄ hotell, restauranger eller butiker för att driva kunder, transportera varor eller tillhandahÄlla information. I farliga miljöer, som katastrofhjÀlp eller i industrianlÀggningar, kan de ta pÄ sig uppgifter som Àr för riskabla eller för utmattande för mÀnniskor.

Dessutom Àr förmÄgan att stÄ upp ocksÄ avgörande för en envis produktion. Fall Àr ett vanligt problem med humanoidrobotar, sÀrskilt i ojÀmna eller dynamiska miljöer. En robot som inte kan komma upp sjÀlvstÀndigt efter ett fall Àr snabbt hjÀlplös i sÄdana miljöer. VÀrd erbjuder en lösning hÀr eftersom den gör det möjligt för roboten att dyka upp frÄn ovÀntade platser och fortsÀtta sin uppgift. Detta ökar tillförlitligheten och sÀkerheten för humanoidrobotar och gör dem mer robusta och mer praktiska verktyg.

VÀrd banar vÀgen för en ny generation humanoidrobotar

VÀrd Àr mer Àn bara en vidareutveckling av befintliga metoder; Det Àr ett betydande genombrott i kontrollen av humanoidrobotar. Genom innovativ anvÀndning av förstÀrkningslÀrande med multikritisk arkitektur och lÀroplanbaserad utbildning övervinner den begrÀnsningarna av tidigare tillvÀgagÄngssÀtt och gör det möjligt för robotar att stÄ upp frÄn en anmÀrkningsvÀrd variation av positioner och pÄ en mÀngd olika ytor. Den framgÄngsrika överföringen frÄn simuleringen till verklig robot demonstrerar pÄ Unitre G1 och imponerande robusthet till störningar understryker den enorma potentialen för denna metod för praktiska tillÀmpningar.

VÀrd Àr ett viktigt steg pÄ vÀgen till humanoidrobotar som inte bara imponerar pÄ laboratoriet, utan ocksÄ kan erbjuda verkligt mervÀrde i den verkliga vÀrlden. Det tar oss nÀrmare visionen om en framtid dÀr humanoidrobotar Àr sömlöst integrerade i vÄr vardag, stödjer oss i olika uppgifter och gör vÄra liv mer bekvÀma, bekvÀmare och effektiva. Med teknik som vÀrd blir den en gÄng futuristiska idén om humanoidrobotar som följer oss i vÄrt dagliga liv mer och mer konkret verklighet.

LÀmplig för detta:

 

Din globala marknadsförings- och affÀrsutvecklingspartner

☑ VĂ„rt affĂ€rssprĂ„k Ă€r engelska eller tyska

☑ Nytt: korrespondens pĂ„ ditt nationella sprĂ„k!

 

Digital Pioneer - Konrad Wolfenstein

Konrad Wolfenstein

Jag Àr glad att vara tillgÀnglig för dig och mitt team som personlig konsult.

Du kan kontakta mig genom att fylla i kontaktformulĂ€ret eller helt enkelt ringa mig pĂ„ +49 89 674 804 (MĂŒnchen) . Min e -postadress Ă€r: Wolfenstein ∂ xpert.digital

Jag ser fram emot vÄrt gemensamma projekt.

 

 

☑ SME -stöd i strategi, rĂ„dgivning, planering och implementering

☑ skapande eller omjustering av den digitala strategin och digitaliseringen

☑ Expansion och optimering av de internationella försĂ€ljningsprocesserna

☑ Globala och digitala B2B -handelsplattformar

☑ Pioneer Business Development / Marketing / PR / Measure


⭐ Robotik/robotik ⭐ Xpaper Â