Publicado em: 18 de março de 2025 / Atualizado em: 18 de março de 2025 – Autor: Konrad Wolfenstein

Controle de humanoides para ficarem em pé: Com o HoST, humanoides aprendem a ficar em pé – Um avanço para robôs no dia a dia – Imagem: humanoid-standingup.github.io
Mais do que simplesmente levantar: o HoST abre caminho para robôs humanoides autônomos e versáteis
Da simulação à realidade: como o HoST ensina robôs humanoides a ficarem de pé sozinhos
No fascinante mundo da robótica humanoide, onde as máquinas imitam cada vez mais as habilidades humanas, uma capacidade aparentemente simples, mas fundamentalmente importante, desempenha um papel central: ficar de pé. Para nós, humanos, é algo natural, um movimento inconsciente que realizamos inúmeras vezes todos os dias. Mas para um robô humanoide, ficar de pé é um desafio complexo que exige sistemas de controle sofisticados, sensores precisos e algoritmos inteligentes. Essa capacidade não é apenas uma demonstração impressionante de proeza da engenharia, mas também um pré-requisito essencial para que os robôs humanoides encontrem seu lugar em nosso cotidiano e nos auxiliem em uma ampla gama de tarefas.
A capacidade de se levantar a partir de diversas posições é muito mais do que um mero recurso adicional. É a base para a autonomia e versatilidade dos robôs humanoides. Imagine um robô ajudando você em casa, auxiliando nos cuidados com outras pessoas ou trabalhando em ambientes perigosos. Em todos esses cenários, a capacidade de se levantar de forma independente a partir de diferentes posições é crucial. Um robô que só funciona em posições iniciais ideais e fica indefeso após uma queda é simplesmente inútil no mundo real. Desenvolver estratégias de levantamento robustas e versáteis é, portanto, um passo fundamental para levar os robôs humanoides do laboratório de pesquisa para o mundo real.
As abordagens anteriores para resolver esse problema frequentemente atingiam seus limites. Muitas dependiam de sequências de movimento meticulosamente pré-programadas que funcionavam em ambientes controlados, mas que rapidamente se deparavam com suas limitações na realidade imprevisível. Esses sistemas rígidos eram inflexíveis, incapazes de se adaptar a condições variáveis e falhavam miseravelmente quando o robô pousava em uma posição inesperada ou em terreno irregular. Outras abordagens utilizavam ambientes de simulação complexos, mas seus resultados eram frequentemente difíceis de transferir para robôs reais. O salto da simulação para a realidade, a chamada "transferência da simulação para a realidade", provou ser um obstáculo para muitas abordagens de pesquisa promissoras.
Nesse contexto, está surgindo uma estrutura inovadora que pode mudar fundamentalmente a forma como pensamos sobre robôs humanoides se levantando: HoST, abreviação de Humanoid Standing-up Control (Controle de Levantamento de Humanoide). O HoST é mais do que apenas um novo método; é uma mudança de paradigma. Desenvolvido por um consórcio de universidades renomadas na Ásia , incluindo a Universidade Jiao Tong de Xangai, a Universidade de Hong Kong, a Universidade de Zhejiang e a Universidade Chinesa de Hong Kong, o HoST rompe com as abordagens tradicionais e abre um caminho completamente novo para ensinar robôs humanoides a se levantarem — de uma forma surpreendentemente versátil, robusta e realista.
Adequado para:
- Humanóides, robôs industriais e de serviço nos robôs de Upswing- Humanóides não são mais uma ficção científica
HoST: Uma estrutura que aprende com os erros
A essência da inovação da HoST reside na aplicação do aprendizado por reforço (RL), um método de aprendizado de máquina inspirado em como humanos e animais aprendem. Imagine ensinar uma criança a andar de bicicleta. Você não lhe dá instruções detalhadas para cada movimento muscular; em vez disso, você simplesmente a deixa tentar. Se a criança cair, ela corrige seus movimentos na próxima tentativa. Por meio de tentativas e erros, por meio de feedback positivo e negativo, a criança gradualmente aprende a dominar a bicicleta. O aprendizado por reforço funciona com um princípio semelhante.
No projeto HoST, um robô humanoide é colocado em um ambiente simulado e incumbido de se levantar a partir de diversas posições. O robô atua como um "agente" dentro desse ambiente, realizando ações, neste caso, movimentos de suas articulações e corpo. Para cada ação, ele recebe uma "recompensa" ou "punição", dependendo do seu sucesso. Levantar-se resulta em uma recompensa positiva, enquanto cair ou realizar movimentos indesejáveis resulta em uma recompensa negativa. Através de inúmeras tentativas, ganho de experiência e otimização de estratégias, o robô aprende gradualmente a desenvolver a melhor estratégia possível para se levantar.
A principal diferença em relação às abordagens anteriores baseadas em aprendizado por reforço é que o HoST aprende do zero. Ele não utiliza trajetórias de movimento pré-programadas, demonstrações humanas ou qualquer outro conhecimento prévio. O robô começa do zero e desenvolve suas estratégias de levantar-se de forma completamente independente. Este é um avanço fundamental, pois permite que o sistema encontre soluções que podem ir muito além do que engenheiros humanos poderiam ter concebido. Além disso, torna o sistema extremamente adaptável, já que não depende de suposições rígidas ou vieses humanos.
A magia da arquitetura multicrítica
Outro elemento fundamental da inovação do HoST é a arquitetura multicrítica. Para entender isso, precisamos examinar brevemente como funciona o aprendizado por reforço. Em sistemas típicos de RL, existem dois componentes centrais: o ator e o crítico. O ator é, por assim dizer, o cérebro do robô, selecionando ações e decidindo quais movimentos devem ser executados. O crítico avalia as ações do ator e fornece feedback. Ele informa ao ator se suas ações foram boas ou ruins e como podem ser aprimoradas. Em abordagens tradicionais de RL, geralmente há apenas um único crítico.
O HoST rompe com essa convenção e, em vez disso, se baseia em múltiplos críticos especializados. Imagine que levantar-se envolve vários aspectos importantes: manter o equilíbrio, assumir a postura correta, coordenar as articulações e controlar o momento rotacional. Cada um desses aspectos poderia ser avaliado por seu próprio "especialista". É exatamente isso que a arquitetura multicrítica faz. O HoST utiliza múltiplas redes de críticos, cada uma especializada em um aspecto específico do processo de levantar-se. Por exemplo, um crítico pode avaliar o equilíbrio, outro a coordenação articular e um terceiro o momento rotacional.
Essa divisão em críticos especializados provou ser extremamente eficaz. Ela resolve um problema que frequentemente surge em sistemas tradicionais de gestão de aprendizagem: a interferência negativa. Quando um único crítico tenta avaliar todos os aspectos de uma tarefa complexa simultaneamente, podem ocorrer conflitos e confusão. Os diversos objetivos de aprendizagem podem se atrapalhar mutuamente, atrasando ou até mesmo levando ao fracasso do processo de aprendizagem. A arquitetura multicrítica contorna esse problema ao dividir a tarefa de aprendizagem em subtarefas menores e mais gerenciáveis, atribuindo um crítico especializado a cada subtarefa. O agente, então, recebe feedback de todos os críticos e aprende a combinar de forma otimizada os diferentes aspectos do processo.
Essa arquitetura multicrítica é particularmente relevante para a tarefa complexa de se levantar. Levantar-se exige uma variedade de habilidades motoras finas e controle preciso do momento de rotação para manter o equilíbrio e evitar quedas. Por meio de seus críticos especializados, o HoST pode treinar e otimizar especificamente esses diferentes aspectos do ato de se levantar, levando a resultados significativamente melhores do que as abordagens convencionais que utilizam um único crítico. Os pesquisadores demonstraram em seus estudos que a arquitetura multicrítica possibilita uma melhora significativa no desempenho e permite que o HoST desenvolva estratégias para se levantar que seriam inatingíveis com métodos convencionais.
Aprendizagem curricular: do simples ao complexo
Outro fator-chave para o sucesso da HoST é o treinamento baseado em currículo. Esse método se fundamenta no processo de aprendizagem humana, no qual adquirimos habilidades complexas passo a passo, começando com o básico e progredindo gradualmente para tarefas mais difíceis. Pense novamente no exemplo de andar de bicicleta. Antes de uma criança aprender a andar sobre duas rodas, ela pode primeiro aprender a se equilibrar em uma bicicleta de equilíbrio ou usar rodinhas de apoio. Esses exercícios preparatórios facilitam o processo de aprendizagem posterior e garantem um progresso mais rápido e eficaz.
O HoST implementa um princípio semelhante. O robô não é confrontado com a tarefa mais difícil logo de início — ou seja, levantar-se de qualquer posição em qualquer superfície. Em vez disso, ele passa por um currículo em etapas, no qual as tarefas se tornam gradualmente mais complexas. O treinamento começa com cenários simples, como levantar-se de uma posição deitada em um piso plano. Assim que o robô domina essa tarefa, as condições se tornam progressivamente mais desafiadoras. Novas posições iniciais são adicionadas, como levantar-se de uma posição sentada ou deitando-se e encostando-se em uma parede. A superfície também é variada, desde pisos planos até superfícies ligeiramente irregulares e, finalmente, terrenos mais exigentes.
Este treinamento baseado em currículo oferece diversas vantagens. Primeiro, permite uma exploração mais eficiente do espaço de soluções. Inicialmente, o robô se concentra nos aspectos fundamentais de se levantar e aprende a dominá-los em cenários simples. Isso acelera o processo de aprendizagem, permitindo que o robô atinja um bom nível de desempenho mais rapidamente. Segundo, o currículo aprimora a generalização do modelo. Ao expor gradualmente o robô a tarefas mais diversas e complexas, ele aprende a se adaptar a diferentes situações e a desenvolver estratégias robustas de levantar que funcionam não apenas em ambientes ideais, mas também em ambientes reais. A variedade de condições de treinamento é crucial para a robustez do sistema no mundo real, onde superfícies e posições iniciais imprevisíveis são a regra, não a exceção.
Adequado para:
Realismo através de restrições de movimento
Outro aspecto importante do HoST é a sua consideração da aplicabilidade no mundo real. Embora as simulações sejam uma ferramenta poderosa para o treinamento de robôs, o mundo real é muito mais complexo e imprevisível. Para superar com sucesso a lacuna entre simulação e realidade, o HoST implementa duas restrições de movimento essenciais que garantem que as estratégias aprendidas possam ser aplicadas a hardware real sem danificar o robô.
A primeira restrição é a regularização da suavidade. O objetivo é reduzir os movimentos oscilatórios. Em simulações, os robôs podem realizar movimentos que seriam problemáticos na realidade. Por exemplo, podem fazer movimentos bruscos e trêmulos que poderiam danificar o hardware físico ou levar a um comportamento instável. A regularização da suavidade garante que os movimentos aprendidos sejam mais suaves e fluidos, o que não só é menos agressivo para o hardware, como também resulta em um comportamento de levantar mais natural e estável.
A segunda limitação é o limite de velocidade implícito. Isso impede movimentos excessivamente rápidos ou abruptos. Novamente, as simulações frequentemente representam condições idealizadas nas quais os robôs poderiam realizar movimentos em velocidades irrealisticamente altas. No mundo real, no entanto, tais movimentos abruptos podem danificar o robô, por exemplo, sobrecarregando os motores ou danificando as juntas. O limite de velocidade garante que os movimentos aprendidos permaneçam dentro dos limites físicos do hardware real e não coloquem o robô em perigo.
Essas restrições de movimento são cruciais para a transferência do conhecimento da simulação para o mundo real. Elas garantem que as estratégias aprendidas na simulação não apenas funcionem teoricamente, mas também possam ser implementadas na prática em robôs reais sem sobrecarregar ou danificar o hardware. Representam um passo importante para reduzir a lacuna entre a simulação e a realidade e preparar robôs humanoides para uso no mundo real.
O teste prático: HoST no Unitree G1
O verdadeiro teste de qualquer método de controle de robôs é sua implementação prática em hardware real. Para demonstrar as capacidades do HoST, os pesquisadores transferiram as estratégias de controle aprendidas na simulação para o robô humanoide Unitree G1. O Unitree G1 é uma plataforma humanoide avançada, caracterizada por sua agilidade, robustez e design realista. É um ambiente de teste ideal para avaliar as capacidades do HoST no mundo real.
Os resultados dos testes práticos foram impressionantes e confirmaram a eficácia da abordagem HoST. O robô Unitree G1, controlado pelo HoST, demonstrou notáveis capacidades de se levantar a partir de uma ampla variedade de posições. Ele se levantou com sucesso a partir da posição deitada, sentada, ajoelhada e até mesmo de posições em que estava encostado em objetos ou em terreno irregular. A transferência das capacidades simuladas para o mundo real foi quase perfeita, destacando a alta qualidade da transferência de simulação para realidade do HoST.
Merece destaque a robustez a perturbações demonstrada pelo Unitree G1 controlado pelo HoST. Em testes experimentais, o robô foi submetido a forças externas, como solavancos e impactos. Ele foi confrontado com obstáculos que impediam sua capacidade de se manter em pé. Foi até mesmo carregado com cargas pesadas (até 12 kg) para testar sua estabilidade e capacidade de carga. Em todas essas situações, o robô exibiu uma resiliência notável e conseguiu se endireitar sem perder o equilíbrio ou cair.
Um vídeo de demonstração impressionante ilustrou claramente a robustez do HoST. Ele mostrou uma pessoa empurrando e chutando o robô Unitree G1 enquanto ele se levantava. Apesar dessas perturbações significativas, o robô permaneceu imperturbável. Ele corrigiu seus movimentos em tempo real, adaptou-se aos impactos inesperados e, por fim, se levantou com segurança e estabilidade. Essa demonstração ilustra de forma impressionante a aplicabilidade prática e a confiabilidade do sistema HoST em ambientes reais e imprevisíveis.
Adequado para:
Estudos de ablação: a interação dos componentes
Para examinar mais detalhadamente a importância dos componentes individuais do HoST, os pesquisadores realizaram extensos estudos de ablação. Nesses estudos, elementos individuais da estrutura do HoST foram removidos ou modificados para analisar seu impacto no desempenho geral. Os resultados desses estudos forneceram informações valiosas sobre a funcionalidade do HoST e confirmaram a importância de suas principais inovações.
Uma descoberta fundamental dos estudos de ablação foi a confirmação do papel crucial da arquitetura multicrítica. Quando os pesquisadores modificaram o sistema para usar apenas um único crítico, o sistema falhou miseravelmente. Ele não conseguiu mais aprender padrões de postura em pé com sucesso e, na maioria dos casos, o robô permaneceu deitado, sem conseguir se manter em pé. Esse resultado ressalta a importância central da arquitetura multicrítica para o desempenho do HoST e confirma que os críticos especializados realmente contribuem significativamente para o sucesso do aprendizado.
O treinamento baseado em currículo também se mostrou um fator-chave de sucesso nos estudos de ablação. Quando os pesquisadores substituíram o currículo por treinamento aleatório sem aumento gradual da dificuldade, o desempenho do sistema deteriorou-se significativamente. O robô aprendeu mais lentamente, atingiu um nível de desempenho inferior e mostrou-se menos robusto a diferentes posições iniciais e superfícies. Isso confirma a hipótese de que o treinamento baseado em currículo melhora a eficiência do processo de aprendizagem e aumenta a generalização do modelo.
As restrições de movimento implementadas também contribuíram significativamente para o desempenho geral, principalmente em relação à aplicabilidade prática. Quando os pesquisadores removeram a regularização de suavidade e o limite de velocidade de movimento, o robô ainda aprendeu estratégias de recuperação na simulação, mas estas se mostraram menos estáveis na realidade e resultaram com mais frequência em quedas ou movimentos bruscos e indesejados. Isso demonstra que, embora as restrições de movimento limitem ligeiramente a flexibilidade do sistema na simulação, elas são essenciais no mundo real para garantir um comportamento robusto, seguro e compatível com o hardware.
HoST: Uma plataforma de lançamento para robôs humanoides versáteis
A capacidade de se levantar a partir de diferentes posições pode parecer trivial à primeira vista, mas na realidade é uma peça fundamental para o desenvolvimento de robôs humanoides verdadeiramente versáteis e autônomos. Ela forma a base para a integração em sistemas de locomoção e manipulação mais complexos e abre uma infinidade de novas possibilidades de aplicação. Imagine um robô que não só consegue se levantar, mas também se mover perfeitamente entre diferentes tarefas – levantar-se do sofá, caminhar até a mesa, agarrar objetos, desviar de obstáculos e se levantar caso tropece. Esse tipo de interação perfeita com o ambiente, que é tão natural para nós, humanos, é o objetivo da robótica humanoide, e o HoST nos aproxima ainda mais dessa conquista.
Com o HoST, robôs humanoides poderão ser utilizados em diversas áreas no futuro, onde sua forma humana e capacidade de interação com o ambiente humano sejam vantajosas. Em cuidados, eles poderiam auxiliar idosos ou enfermos, ajudando-os a se levantar e sentar, entregando-lhes objetos ou auxiliando em tarefas domésticas. No setor de serviços, poderiam ser utilizados em hotéis, restaurantes ou lojas para atender clientes, transportar mercadorias ou fornecer informações. Em ambientes perigosos, como em operações de socorro em desastres ou em instalações industriais, poderiam assumir tarefas que são muito arriscadas ou extenuantes para humanos.
Além disso, a capacidade de se levantar é essencial para a recuperação após uma queda. Quedas são um problema comum para robôs humanoides, especialmente em ambientes irregulares ou dinâmicos. Um robô que não consegue se levantar sozinho após uma queda torna-se rapidamente indefeso nesses ambientes. O HoST oferece uma solução para isso, permitindo que o robô se endireite mesmo em posições inesperadas e continue sua tarefa. Isso aumenta a confiabilidade e a segurança dos robôs humanoides, tornando-os ferramentas mais robustas e práticas.
O HoST abre caminho para uma nova geração de robôs humanoides
O HoST é mais do que uma simples evolução de métodos existentes; representa um avanço significativo no controle de robôs humanoides. Através do uso inovador de aprendizado por reforço com uma arquitetura multicrítica e treinamento baseado em currículo, ele supera as limitações de abordagens anteriores, permitindo que robôs se levantem a partir de uma notável variedade de posições e em diversas superfícies. A transferência bem-sucedida da simulação para robôs reais, demonstrada no Unitree G1, e sua impressionante robustez contra perturbações ressaltam o enorme potencial deste método para aplicações práticas.
O HoST representa um passo importante rumo a robôs humanoides que não apenas impressionam em laboratório, mas também oferecem valor agregado real no mundo prático. Ele nos aproxima da visão de um futuro onde robôs humanoides se integram perfeitamente ao nosso cotidiano, auxiliando-nos em diversas tarefas e tornando nossas vidas mais seguras, confortáveis e eficientes. Com tecnologias como o HoST, a ideia antes futurista de robôs humanoides nos acompanhando no dia a dia está se tornando cada vez mais tangível.
Adequado para:
Seu parceiro global de marketing e desenvolvimento de negócios
☑️ Nosso idioma comercial é inglês ou alemão
☑️ NOVO: Correspondência em seu idioma nacional!
Ficarei feliz em servir você e minha equipe como consultor pessoal.
Você pode entrar em contato comigo preenchendo o formulário de contato ou simplesmente ligando para +49 89 89 674 804 (Munique) . Meu endereço de e-mail é: wolfenstein ∂ xpert.digital
Estou ansioso pelo nosso projeto conjunto.














