Pubblicato il: 18 marzo 2025 / Aggiornato il: 18 marzo 2025 – Autore: Konrad Wolfenstein

Controllo umanoide in posizione eretta: con HoST, gli umanoidi imparano a stare in piedi – La svolta per i robot nella vita di tutti i giorni – Immagine: humanoid-standingup.github.io
Più che alzarsi e basta: HoST apre la strada a robot umanoidi autonomi e versatili
Dalla simulazione alla realtà: come HoST insegna ai robot umanoidi a stare in piedi in modo indipendente
Nell'affascinante mondo della robotica umanoide, dove le macchine imitano sempre più le capacità umane, un'abilità apparentemente semplice ma di fondamentale importanza gioca un ruolo centrale: stare in piedi. Per noi umani, è una seconda natura, un movimento inconscio che eseguiamo innumerevoli volte al giorno. Ma per un robot umanoide, stare in piedi è una sfida complessa che richiede sistemi di controllo sofisticati, sensori precisi e algoritmi intelligenti. Questa capacità non è solo un'impressionante dimostrazione di abilità ingegneristica, ma anche un prerequisito essenziale affinché i robot umanoidi trovino il loro posto nella nostra vita quotidiana e ci supportino in un'ampia gamma di compiti.
La capacità di alzarsi in piedi da diverse posizioni è molto più di una semplice caratteristica aggiuntiva. È il fondamento dell'autonomia e della versatilità dei robot umanoidi. Immaginate un robot che vi aiuta in casa, che vi assiste o che lavora in ambienti pericolosi. In tutti questi scenari, la capacità di alzarsi in piedi in modo indipendente da diverse posizioni è fondamentale. Un robot che funziona solo in posizioni di partenza ideali e che rimane inerme dopo una caduta è semplicemente inutile nel mondo reale. Sviluppare strategie di mantenimento della posizione eretta robuste e versatili è quindi un passo fondamentale per portare i robot umanoidi dal laboratorio di ricerca al mondo reale.
Gli approcci precedenti alla risoluzione di questo problema hanno spesso raggiunto i propri limiti. Molti si basavano su sequenze di movimento meticolosamente pre-programmate che funzionavano in ambienti controllati, ma che rapidamente raggiungevano i loro limiti in una realtà imprevedibile. Questi sistemi rigidi erano inflessibili, incapaci di adattarsi a condizioni mutevoli e fallivano miseramente quando il robot atterrava in una posizione inaspettata o su un terreno irregolare. Altri approcci utilizzavano ambienti di simulazione complessi, ma i loro risultati erano spesso difficili da trasferire a robot reali. Il salto dalla simulazione alla realtà, il cosiddetto "trasferimento dalla simulazione alla realtà", si è rivelato un ostacolo per molti promettenti approcci di ricerca.
In questo contesto, sta emergendo un framework innovativo che potrebbe cambiare radicalmente il modo in cui concepiamo i robot umanoidi in posizione eretta: HoST, acronimo di Humanoid Standing-up Control. HoST è più di un semplice metodo: rappresenta un cambio di paradigma. Sviluppato da un consorzio di rinomate università asiatiche , tra cui la Shanghai Jiao Tong University, l'Università di Hong Kong, l'Università di Zhejiang e l'Università Cinese di Hong Kong, HoST rompe con gli approcci tradizionali e apre una strada completamente nuova per insegnare ai robot umanoidi a stare in piedi, in un modo sorprendentemente versatile, robusto e realistico.
Adatto a:
- I robot umanoidi, industriali e di servizio sui robot umanoidi di ripresa non sono più una fantascienza
HoST: un framework che impara dagli errori
Il cuore dell'innovazione di HoST risiede nell'applicazione dell'apprendimento per rinforzo (RL), un metodo di apprendimento automatico ispirato al modo in cui imparano gli esseri umani e gli animali. Immagina di insegnare a un bambino ad andare in bicicletta. Non gli dai istruzioni dettagliate per ogni movimento muscolare; invece, lo lasci semplicemente provare. Se il bambino cade, corregge i suoi movimenti al tentativo successivo. Attraverso tentativi ed errori, tramite feedback positivi e negativi, il bambino impara gradualmente a padroneggiare la bicicletta. L'apprendimento per rinforzo funziona su un principio simile.
Nel progetto HoST, un robot umanoide viene posizionato in un ambiente simulato e gli viene chiesto di alzarsi in piedi da diverse posizioni. Il robot agisce come un "agente" all'interno di questo ambiente, eseguendo azioni, in questo caso movimenti delle articolazioni e del corpo. Per ogni azione, riceve una "ricompensa" o una "punizione", a seconda del successo. Alzarsi in piedi comporta una ricompensa positiva, mentre cadere o compiere movimenti indesiderati comporta una ricompensa negativa. Attraverso innumerevoli prove, acquisizione di esperienza e ottimizzazione della strategia, il robot impara gradualmente a sviluppare la migliore strategia possibile per alzarsi in piedi.
La differenza fondamentale rispetto ai precedenti approcci basati sull'apprendimento basato sulla realtà virtuale è che HoST apprende da zero. Non utilizza percorsi di movimento preprogrammati, né dimostrazioni umane o altre conoscenze pregresse. Il robot parte da zero e sviluppa le sue strategie di stand-up in modo completamente autonomo. Questo rappresenta un progresso fondamentale perché consente al sistema di trovare soluzioni che potrebbero superare di gran lunga quelle che gli ingegneri umani avrebbero potuto concepire. Inoltre, rende il sistema estremamente adattabile, in quanto non si basa su rigidi presupposti o pregiudizi umani.
La magia dell'architettura multicritica
Un altro elemento chiave dell'innovazione HoST è l'architettura multicritica. Per comprenderla, dobbiamo esaminare brevemente come funziona l'apprendimento per rinforzo. Nei tipici sistemi RL, ci sono due componenti centrali: l'attore e il critico. L'attore è, per così dire, il cervello del robot, che seleziona le azioni e decide quali movimenti eseguire. Il critico valuta le azioni dell'attore e fornisce un feedback. Indica all'attore se le sue azioni sono state buone o cattive e come possono essere migliorate. Negli approcci RL tradizionali, di solito c'è un solo critico.
HoST rompe con questa convenzione e si affida invece a più critici specializzati. Immaginate che alzarsi comporti diversi aspetti importanti: mantenere l'equilibrio, assumere la postura corretta, coordinare le articolazioni e controllare la quantità di moto rotazionale. Ognuno di questi aspetti potrebbe essere valutato da un proprio "esperto". Questo è esattamente ciò che fa l'architettura multicritica. HoST utilizza più reti di critici, ciascuna specializzata in un aspetto specifico del processo di stazione eretta. Ad esempio, un critico potrebbe valutare l'equilibrio, un altro la coordinazione articolare e un terzo la quantità di moto rotazionale.
Questa suddivisione in critici specializzati si è dimostrata estremamente efficace. Risolve un problema che spesso si presenta nei sistemi di gestione dell'apprendimento tradizionali: l'interferenza negativa. Quando un singolo critico tenta di valutare simultaneamente tutti gli aspetti di un compito complesso, possono verificarsi conflitti e confusione. I diversi obiettivi di apprendimento possono ostacolarsi a vicenda, rallentando o addirittura causando il fallimento del processo di apprendimento. L'architettura multicritica aggira questo problema suddividendo il compito di apprendimento in sottoattività più piccole e gestibili e assegnando un critico specializzato a ciascuna sottoattività. L'attore riceve quindi feedback da tutti i critici e impara a combinare in modo ottimale i diversi aspetti del processo di apprendimento.
Questa architettura multicritica è particolarmente rilevante per il complesso compito di alzarsi in piedi. Stare in piedi richiede una varietà di capacità motorie fini e un controllo preciso della coppia rotazionale per mantenere l'equilibrio ed evitare cadute. Grazie ai suoi critici specializzati, HoST può allenare e ottimizzare specificamente questi diversi aspetti dell'alzarsi in piedi, ottenendo risultati significativamente migliori rispetto agli approcci convenzionali che utilizzano un singolo critico. I ricercatori hanno dimostrato nei loro studi che l'architettura multicritica consente un significativo miglioramento delle prestazioni e consente a HoST di sviluppare strategie di elevazione che sarebbero irraggiungibili con i metodi convenzionali.
Apprendimento curriculare: dal semplice al complesso
Un altro fattore chiave del successo di HoST è la formazione basata sul curriculum. Questo metodo si basa sul processo di apprendimento umano, in cui acquisiamo competenze complesse passo dopo passo, partendo da nozioni di base semplici e poi procedendo gradualmente verso compiti più complessi. Ripensiamo all'esempio di andare in bicicletta. Prima che un bambino impari ad andare su due ruote, potrebbe imparare a stare in equilibrio su una bici senza pedali o a usare le rotelle. Questi esercizi preparatori facilitano il successivo processo di apprendimento e garantiscono progressi più rapidi e proficui.
HoST implementa un principio simile. Il robot non si trova ad affrontare fin dall'inizio il compito più difficile, ovvero alzarsi da qualsiasi posizione su qualsiasi superficie. Piuttosto, segue un percorso formativo a più livelli in cui i compiti diventano gradualmente più complessi. L'addestramento inizia con scenari semplici, come alzarsi da una posizione sdraiata su un pavimento piano. Una volta che il robot ha padroneggiato questo compito, le condizioni diventano progressivamente più impegnative. Vengono aggiunte nuove posizioni di partenza, come alzarsi da una posizione seduta o da sdraiata appoggiandosi a un muro. Anche la superficie è varia, da pavimenti piani a superfici leggermente irregolari e infine a terreni più impegnativi.
Questo addestramento basato sul curriculum offre diversi vantaggi. In primo luogo, consente un'esplorazione più efficiente dello spazio delle soluzioni. Il robot si concentra inizialmente sugli aspetti fondamentali della postura eretta e impara a padroneggiarli in scenari semplici. Questo accelera il processo di apprendimento, consentendo al robot di raggiungere più rapidamente un buon livello di prestazioni. In secondo luogo, il curriculum migliora la generalizzabilità del modello. Esponendo gradualmente il robot a compiti più diversi e complessi, impara ad adattarsi a diverse situazioni e a sviluppare solide strategie di postura eretta che funzionano non solo in ambienti ideali, ma anche in quelli reali. La varietà delle condizioni di addestramento è fondamentale per la robustezza del sistema nel mondo reale, dove superfici e posizioni di partenza imprevedibili sono la regola, non l'eccezione.
Adatto a:
- Il navigatore robot umanoide Alpha α e lo Zhejiang Humanoid Robot Innovation Center di SUPCON (Cina)
Realismo attraverso restrizioni di movimento
Un altro aspetto importante di HoST è la sua attenzione all'applicabilità nel mondo reale. Sebbene le simulazioni siano uno strumento potente per l'addestramento dei robot, il mondo reale è molto più complesso e imprevedibile. Per colmare efficacemente il divario tra simulazione e realtà, HoST implementa due vincoli di movimento essenziali che garantiscono che le strategie apprese possano essere applicate all'hardware reale senza danneggiare il robot.
Il primo vincolo è la regolarizzazione della fluidità. Questa mira a ridurre i movimenti oscillatori. Nelle simulazioni, i robot possono eseguire movimenti che nella realtà sarebbero problematici. Ad esempio, potrebbero eseguire movimenti a scatti e tremolanti che potrebbero danneggiare l'hardware fisico o portare a un comportamento instabile. La regolarizzazione della fluidità garantisce che i movimenti appresi siano più fluidi e fluidi, il che non solo è più delicato per l'hardware, ma si traduce anche in un comportamento di appoggio più naturale e stabile.
La seconda limitazione è il limite di velocità implicito. Questo impedisce movimenti eccessivamente rapidi o bruschi. Anche in questo caso, le simulazioni spesso rappresentano condizioni idealizzate in cui i robot potrebbero eseguire movimenti a velocità irrealisticamente elevate. Nel mondo reale, tuttavia, tali movimenti bruschi possono danneggiare il robot, ad esempio sovraccaricando i motori o danneggiando le articolazioni. Il limite di velocità garantisce che i movimenti appresi rimangano entro i limiti fisici dell'hardware reale e non mettano in pericolo il robot.
Queste restrizioni di movimento sono cruciali per il trasferimento delle conoscenze dalla simulazione al mondo reale. Garantiscono che le strategie apprese in simulazione non solo funzionino teoricamente, ma possano anche essere implementate praticamente su robot reali senza sovraccaricare o danneggiare l'hardware. Rappresentano un passo importante per colmare il divario tra simulazione e realtà e preparare i robot umanoidi all'uso nel mondo reale.
La prova pratica: HoST sull'Unitree G1
Il vero banco di prova di qualsiasi metodo di controllo robotico è la sua implementazione pratica su hardware reale. Per dimostrare le capacità di HoST, i ricercatori hanno trasferito le strategie di controllo apprese nella simulazione al robot umanoide Unitree G1. Unitree G1 è una piattaforma umanoide avanzata caratterizzata da agilità, robustezza e design realistico. Rappresenta un banco di prova ideale per valutare le capacità di HoST nel mondo reale.
I risultati dei test pratici sono stati impressionanti e hanno confermato l'efficacia dell'approccio HoST. Il robot Unitree G1, controllato da HoST, ha dimostrato notevoli capacità di stare in piedi da un'ampia varietà di posizioni. È riuscito a sollevarsi con successo da una posizione sdraiata, seduta, inginocchiata e persino da posizioni in cui era appoggiato a oggetti o su un terreno irregolare. Il trasferimento delle capacità simulate al mondo reale è stato pressoché impeccabile, evidenziando l'elevata qualità del trasferimento dalla simulazione alla realtà di HoST.
Di particolare rilievo è la robustezza alle perturbazioni dimostrata dal robot Unitree G1 controllato da HoST. Nei test sperimentali, il robot è stato sottoposto a forze esterne, come urti e impatti. Ha dovuto affrontare ostacoli che ne hanno impedito la capacità di stare in piedi. È stato persino caricato con carichi pesanti (fino a 12 kg) per testarne la stabilità e la capacità di carico. In tutte queste situazioni, il robot ha mostrato una notevole resilienza e si è raddrizzato con successo senza perdere l'equilibrio o cadere.
Un impressionante video dimostrativo ha illustrato chiaramente la robustezza di HoST. Mostrava una persona che spingeva e calciava il robot Unitree G1 mentre si alzava. Nonostante queste significative perturbazioni, il robot è rimasto imperturbabile. Ha corretto i suoi movimenti in tempo reale, si è adattato agli impatti imprevisti e alla fine si è alzato in modo sicuro e stabile. Questa dimostrazione illustra in modo impressionante l'applicabilità pratica e l'affidabilità del sistema HoST in ambienti reali e imprevedibili.
Adatto a:
Studi di ablazione: l'interazione dei componenti
Per esaminare più da vicino l'importanza dei singoli componenti di HoST, i ricercatori hanno condotto ampi studi di ablazione. In questi studi, singoli elementi del framework HoST sono stati rimossi o modificati per analizzarne l'impatto sulle prestazioni complessive. I risultati di questi studi hanno fornito preziose informazioni sulla funzionalità di HoST e hanno confermato l'importanza delle sue innovazioni principali.
Un risultato chiave degli studi sull'ablazione è stata la conferma del ruolo cruciale dell'architettura multicritica. Quando i ricercatori hanno modificato il sistema per utilizzare un solo critico, il sistema ha fallito miseramente. Non è stato più in grado di apprendere modelli di postura eretta efficaci e il robot è rimasto sdraiato inerme nella maggior parte dei casi. Questo risultato sottolinea l'importanza centrale dell'architettura multicritica per le prestazioni di HoST e conferma che i critici specializzati forniscono effettivamente un contributo significativo al successo dell'apprendimento.
Anche l'addestramento basato sul curriculum si è rivelato un fattore chiave per il successo negli studi sull'ablazione. Quando i ricercatori hanno sostituito il curriculum con un addestramento randomizzato senza un aumento graduale della difficoltà, le prestazioni del sistema sono peggiorate significativamente. Il robot ha imparato più lentamente, ha raggiunto un livello di prestazioni inferiore ed è risultato meno robusto su diverse posizioni di partenza e superfici. Ciò conferma l'ipotesi che l'addestramento basato sul curriculum migliori l'efficienza del processo di apprendimento e aumenti la generalizzabilità del modello.
Anche i vincoli di movimento implementati hanno contribuito in modo significativo alle prestazioni complessive, in particolare per quanto riguarda l'applicabilità pratica. Quando i ricercatori hanno rimosso la regolarizzazione della fluidità e il limite di velocità di movimento, il robot ha comunque appreso strategie di recupero nella simulazione, ma queste erano meno stabili nella realtà e provocavano più frequentemente cadute o movimenti indesiderati e a scatti. Ciò dimostra che, sebbene i vincoli di movimento limitino leggermente la flessibilità del sistema nella simulazione, sono essenziali nel mondo reale per garantire un comportamento robusto, sicuro e compatibile con l'hardware.
HoST: un trampolino di lancio per robot umanoidi versatili
La capacità di alzarsi da diverse posizioni può sembrare banale a prima vista, ma in realtà è un tassello fondamentale per lo sviluppo di robot umanoidi veramente versatili e autonomi. Costituisce la base per l'integrazione in sistemi di locomozione e manipolazione più complessi e apre una moltitudine di nuove possibilità applicative. Immaginate un robot che non solo sappia stare in piedi, ma che possa anche muoversi senza soluzione di continuità tra diverse attività: alzarsi dal divano, camminare verso il tavolo, afferrare oggetti, evitare ostacoli e rialzarsi se inciampa. Questo tipo di interazione fluida con l'ambiente, che è una seconda natura per noi umani, è l'obiettivo della robotica umanoide, e HoST ci porta un passo cruciale più vicini al suo raggiungimento.
Con HoST, i robot umanoidi potrebbero essere utilizzati in futuro in una varietà di campi in cui la loro forma umana e la capacità di interagire con l'ambiente umano risultano vantaggiose. Nell'assistenza, potrebbero supportare anziani o malati, aiutandoli ad alzarsi e sedersi, porgendo loro oggetti o assistendoli nelle faccende domestiche. Nel settore dei servizi, potrebbero essere utilizzati in hotel, ristoranti o negozi per servire i clienti, trasportare merci o fornire informazioni. In ambienti pericolosi, come i soccorsi in caso di calamità o gli impianti industriali, potrebbero svolgere compiti troppo rischiosi o faticosi per gli esseri umani.
Inoltre, la capacità di rialzarsi è essenziale per il recupero da cadute. Le cadute sono un problema comune per i robot umanoidi, soprattutto in ambienti irregolari o dinamici. Un robot che non riesce a rialzarsi da solo dopo una caduta diventa rapidamente indifeso in tali ambienti. HoST offre una soluzione in questo caso, poiché consente al robot di rialzarsi anche da posizioni inaspettate e di continuare il suo compito. Ciò aumenta l'affidabilità e la sicurezza dei robot umanoidi, rendendoli strumenti più robusti e pratici.
HoST apre la strada a una nuova generazione di robot umanoidi
HoST è più di una semplice evoluzione di metodi esistenti: rappresenta una svolta significativa nel controllo dei robot umanoidi. Attraverso l'uso innovativo dell'apprendimento per rinforzo con un'architettura multicritica e un addestramento basato sul curriculum, supera i limiti degli approcci precedenti, consentendo ai robot di posizionarsi da una notevole varietà di posizioni e su superfici diverse. Il successo del trasferimento dalla simulazione ai robot reali, dimostrato sull'Unitree G1, e la sua impressionante robustezza ai disturbi sottolineano l'enorme potenziale di questo metodo per le applicazioni pratiche.
HoST rappresenta un passo importante verso robot umanoidi che non solo impressionano in laboratorio, ma possono anche offrire un reale valore aggiunto nel mondo reale. Ci avvicina alla visione di un futuro in cui i robot umanoidi si integrano perfettamente nella nostra vita quotidiana, supportandoci in una varietà di compiti e rendendo la nostra vita più sicura, più comoda e più efficiente. Con tecnologie come HoST, l'idea, un tempo futuristica, di robot umanoidi che ci accompagnano nella vita quotidiana sta diventando sempre più concreta.
Adatto a:
Il tuo partner globale per il marketing e lo sviluppo aziendale
☑️ La nostra lingua commerciale è l'inglese o il tedesco
☑️ NOVITÀ: corrispondenza nella tua lingua nazionale!
Sarei felice di servire te e il mio team come consulente personale.
Potete contattarmi compilando il modulo di contatto o semplicemente chiamandomi al numero +49 89 89 674 804 (Monaco) . Il mio indirizzo email è: wolfenstein ∂ xpert.digital
Non vedo l'ora di iniziare il nostro progetto comune.














