言語の選択 📢


ヒューマノイドスタンディングアップコントロール:「ホスト」のヒューマノイドで起きることを学ぶ - 日常生活のロボットのブレークスルー

公開:2025年3月18日 /更新:2025年3月18日 - 著者: Konrad Wolfenstein

ヒューマノイドスタンディングアップコントロール:ホストヒューマノイドと一緒に立ち上がることを学ぶ - 日常生活のロボットのブレークスルー

ヒューマノイドスタンディングアップコントロール:ホストで起きることを学ぶ - 日常生活のロボットのブレークスルー - ヒューマノイドスタンドアップ:github.io

立ち上がる以上のもの:ホストは自律的で多目的なヒューマノイドロボットへの道を開きます

シミュレーションから現実まで:ホストヒューマノイドロボットが自己雇用を教える方法

マシンがますます人間の能力を模倣するヒューマノイドロボット工学の魅力的な世界では、明らかにシンプルだが根本的に重要なスキルが中心的な役割を果たしているということです。もちろん、私たちの人間にとっては、私たちが毎日何度も実行する無意識の動きです。しかし、ヒューマノイドロボットにとって、立ち上がることは、洗練されたコントロール、正確なセンサー、インテリジェントなアルゴリズムの相互作用を必要とする複雑な課題です。しかし、この能力はエンジニアリングアートの印象的なデモであるだけでなく、ヒューマノイドロボットにとって重要な前提条件でもあり、日常生活で自分の位置を見つけ、責任のさまざまな分野で私たちをサポートできます。

さまざまな位置から立ち上がることは、単なる追加の機能以上のものです。それは、ヒューマノイドロボットの自律性と汎用性の基礎です。ロボットが家庭であなたを助けたり、ケアを助けたり、危険な環境で働いたりするべきだと想像してください。これらのすべてのシナリオでは、異なる場所から独立してセットアップする機能が非常に重要です。理想的な開始位置でのみ機能し、落下するときは無力なままであるロボットは、現実の世界では単に使用できません。したがって、堅牢で多目的な順番の戦略の開発は、研究所から現実世界にヒューマノイドロボットをもたらすための重要なステップです。

この問題を解決するための以前のアプローチは、しばしば彼らの限界に達しました。多くは、制御された環境で働いていた、積極的に事前にプログラムされた動きに基づいていましたが、予測不可能な現実の制限にすぐに到達しました。これらの剛性システムは柔軟性がなく、変化した状態に適応できず、ロボットが予期しない位置に着地したり、不均一な表面にあったときに惨めに失敗することができました。他のアプローチは複雑なシミュレーション環境に依存しており、その結果は実際のロボットに転送することがしばしば困難でした。シミュレーションから現実への飛躍であるいわゆる「シムからリアルへの転送」は、多くの有望な研究アプローチのつまずきであることが判明しました。

これに関連して、革新的なフレームワークは、ヒューマノイドロボットの立ち上がりについての考え方を根本的に変えることができるステージに入ります。ホスト、ヒューマノイドスタンディングアップコントロールの略です。ホストは単なる別の方法以上のものです。パラダイムシフトです。アジアの有名な大学のコンソーシアムによって開発され、ホストの伝統的なアプローチで休憩を取り、驚くほど汎用性があり、堅牢で現実的な方法でヒューマノイドロボットを教えるために完全に新しい方法を取ります。

に適し:

ホスト:間違いから学ぶフレームワーク

ホストの革新の中核は、人々と動物が学ぶ方法に触発された機械学習の方法である強化学習(RL)の使用にあります。子供のサイクリングを教えると想像してみてください。彼らは彼にすべての筋肉の動きについて詳細な指示を与えませんが、それを試してみてください。子供がそこに落ちた場合、それは次の試みで彼の動きを修正します。試みとエラーを通じて、子供は徐々に肯定的および否定的なフィードバックを通して自転車をマスターすることを学びます。補強学習は、同様の原則に従って機能します。

ホストの場合、ヒューマノイドロボットはシミュレートされた環境に配置され、異なる位置から立ち上がるタスクに直面します。ロボットは、この分野で「エージェント」として機能します。この場合、彼の関節と彼の体の動きを実行します。各キャンペーンで、彼はそれがどれほど成功したかに応じて、「報酬」または「罰」を受け取ります。彼が起きた場合、彼は肯定的な報酬を受け取ります。それが落ちたり、望ましくない動きをしたりすると、彼は否定的な報酬を受け取ります。ロボットは、経験とその戦略の最適化を獲得しようとする無数の試みを通して、可能な限り最高のスタンドアップ戦略を開発することを徐々に学びます。

以前のRLベースのアプローチとの決定的な違いは、ホストがゼロから学習することです。事前にプログラムされた動きはなく、人間のデモやその他の以前の知識は使用されません。ロボットは「空のシート」から始まり、完全に独立して日付から日付の戦略を開発します。これは、システムが人間のエンジニアが思いついたものをはるかに超える可能性のあるソリューションを見つけることができるため、根本的な進歩です。さらに、システムは、厳格な仮定や人間のバイアスに依存していないため、非常に適応性があります。

マルチクリティックアーキテクチャの魔法

ホストイノベーションのもう1つの核心は、多粘膜アーキテクチャです。それを理解するには、強化学習の機能に簡単に対処する必要があります。典型的なRLシステムには、アクチュエーターと批評家の2つの中央コンポーネントがあります。アクチュエーターは、いわば、アクションを選択するロボットの脳であり、つまり、どの動きを実行すべきかを決定します。批評家はアクチュエーターの行動を評価し、フィードバックを与えます。彼はアクチュエーターに、自分の行動が良いか悪いか、どのように改善できるかを伝えます。従来のRLアプローチには、通常、批評家は1人だけです。

ホストはこの大会で休憩し、代わりにいくつかの専門的な批評家に依存しています。起きるときに重要な側面が異なると想像してください。バランスを保持し、正しい姿勢を取り、ジョイントを調整し、回転衝動を制御します。これらの側面のそれぞれは、独自の「専門家」によって評価できます。これがまさに多粘膜のアーキテクチャを作るものです。ホストはいくつかの批評家ネットワークを使用しており、それぞれが開始プロセスの特定の側面を専門としています。たとえば、ある批評家は、バランスを評価し、別の批評家は共同調整と回転衝動の第三者を評価することができます。

専門の批評家へのこの分裂は、非常に効果的であることが証明されています。従来のRLシステム、つまり負の干渉でしばしば発生する問題を解決します。単一の批評家が複雑なタスクのすべての側面を同時に評価しようとすると、紛争と混乱が発生する可能性があります。さまざまな学習目標は、互いに妨害し、学習プロセスを遅くしたり、失敗させたりすることさえあります。マルチクリティックアーキテクチャは、学習タスクをより小さく、より明確なサブタスクに分解し、各部分タスクに専門的な批評家を使用することにより、この問題をバイパスします。その後、アクチュエーターはすべての批評家からフィードバックを受け取り、起き上がることのさまざまな側面を最適に組み合わせることを学びます。

このマルチクリティックアーキテクチャは、起き上がるという複雑なタスクに特に関連しています。起きるには、バランスを維持し、転倒しないために、さまざまな細かい運動能力と回転衝動の正確な制御が必要です。専門の批評家を通じて、ホストは立ち上がることのこれらのさまざまな側面を具体的に訓練し、最適化することができます。彼らの研究では、研究者は、マルチクリティックアーキテクチャがパフォーマンスの大幅な飛躍を可能にし、ホストが従来の方法を使用して到達できないスタンドアップ戦略を開発できるようにすることを示しました。

カリキュラム学習:シンプルから複合施設まで

ホストの成功のもう1つの鍵は、カリキュラムベースのトレーニングです。この方法は、人間の学習プロセスに基づいています。このプロセスでは、複雑なスキルを徐々に学び、単純な基本から始めて、ゆっくりと私たちに向かっています。サイクリングの例について考えてください。子供が2つの車輪で運転することを学ぶ前に、サポートバイクを使用してインペラーやドライブでバランスを保つことを学ぶかもしれません。これらの準備エクササイズにより、後の学習プロセスが容易になり、より速く、より成功した進歩を確保します。

ホストは同様の原則を実装しました。ロボットは、最初から最も困難なタスク、つまり、あらゆる位置からあらゆる表面を起き上がることに直面していません。代わりに、それはタスクが徐々に複雑になる驚異的なカリキュラムにさらされます。トレーニングは、たとえば、平らな床の横になっている位置から立ち上がるなど、簡単なシナリオから始まります。ロボットがこのタスクをうまく習得するとすぐに、条件は徐々に困難になります。着席位置から立ち上がる方法や壁に横たわる方法について、新しい開始位置があります。また、水平な土壌からわずかに不均一な表面、より要求の厳しい地形まで、表面もさまざまです。

このカリキュラムベースのトレーニングにはいくつかの利点があります。一方では、ソリューションスペースのより効率的な調査を可能にします。ロボットは当初、立ち上がることの基本的な側面に焦点を当て、簡単なシナリオでそれらを習得することを学びます。これにより、学習プロセスが高速化され、ロボットは優れたレベルのパフォーマンスに到達します。一方、カリキュラムはモデルの一般化を改善します。より多様で複雑なタスクでロボットに徐々に立ち向かうことで、彼はさまざまな状況に適応し、理想だけでなく実際の環境でも機能する堅牢な-upからの戦略を開発することを学びます。トレーニング条件のさまざまな条件は、予測不可能な表面と開始位置がルールであり、例外ではない現実世界のシステムの堅牢性にとって非常に重要です。

に適し:

移動制限による現実

ホストのもう1つの重要な側面は、本当の適用性を考慮することです。シミュレーションはロボットをトレーニングするための強力なツールですが、現実の世界は不平等にはより複雑で予測不可能です。シミュレーションから現実への飛躍をうまく習得するために、ホストは、学習した戦略を実際のハードウェアに実装し、ロボットを損傷しないようにする動きに関する2つの重要な制限を実装します。

最初の制限は、滑らかさの正則化です。これは、振動する動きを減らすことを目的としています。シミュレーションでは、ロボットは現実に問題となる動きを実行できます。たとえば、物理的なハードウェアに有害であるか、不安定な動作につながる可能性のあるぎくしゃくした震える動きを作ることができます。滑らかさの正則化により、学習された動きが滑らかで流動的であることが保証されます。これは、ハードウェアにとって穏やかであるだけでなく、より自然で安定したスタンドアップ動作にもつながります。

2番目の制限は、暗黙の移動速度制限です。これにより、動きが速すぎるか、突然の動きが防止されます。ここでも、シミュレーションはしばしば、ロボットが非現実的に高速で動きを実行できる理想的な条件を表しています。しかし、現実の世界では、このような急激な動きは、たとえばエンジンに過負荷や関節の損傷など、ロボットの損傷につながる可能性があります。移動速度制限により、学習した動きが実際のハードウェアの物理的限界内に残り、ロボットを危険にさらすことが保証されます。

これらの移動に関する制限は、SIMからリアルへの転送に不可欠です。彼らは、シミュレーションで学んだ戦略が理論的に機能するだけでなく、ハードウェアを過負荷または損傷することなく実際のロボットに実際に実装できることを保証します。それらは、シミュレーションと現実のギャップを埋め、現実世界で使用するためにヒューマノイドロボットを準備するための重要なステップです。

実際のテスト:Unitree G1のホスト

すべてのロボット制御方法の実際のテストは、実際のハードウェアに関する実用的な実装です。ホストのパフォーマンスを実証するために、研究者はシミュレーションで学んだ制御戦略をUnitree G1ヒューマノイドロボットに転送しました。 Un -Tree G1は、その俊敏性、堅牢性、現実的な構造を特徴とする高度なヒューマノイドプラットフォームです。実世界のホストのスキルを評価するのに理想的なテストベッドです。

実際のテストの結果は印象的であり、ホストアプローチの有効性を確認しました。ホストによって制御されるUn -Tree G1ロボットは、さまざまなポジションから顕著な影響機能を示しました。彼は、嘘をついている位置から、座っている位置から、膝から、さらにはオブジェクトに寄りかかっているか、不均一な表面にいた位置から立ち上がることができました。シミュレートされたスキルの現実世界への伝達はほぼスムーズであり、ホストからのSIMからリアルへの転送の高品質を強調しています。

特に注目に値するのは、宿主制御のUnitree G1が示した障害の堅牢性です。実験テストでは、ロボットは、たとえばバンプや打撃など、外力に直面しました。彼は彼の姿を遮った障害に直面しました。安定性と負荷をかける容量をテストするために、重い負荷(最大12 kg)が搭載されていました。これらすべての状況で、ロボットは驚くべき抵抗を示し、バランスを失ったり転覆せずに正常にセットアップすることができました。

印象的なデモビデオでは、ホストの堅牢性が特に明確になりました。そこでは、開始プロセス中にその人がUnitree G1ロボットにどのようにぶつかったかを見ることができました。これらの大規模な障害にもかかわらず、ロボットを除去することはできませんでした。彼は彼の動きをリアルタイムで修正し、予期しない効果を適応させ、最終的に安全に安定しました。このデモンストレーションは、実際の予測不可能な環境におけるホストシステムの実用的な適用性と信頼性を印象的に示しています。

に適し:

アブレーション研究:コンポーネントの相互作用

ホストの個々のコンポーネントの重要性をより正確に調べるために、研究者は広範なアブレーション研究を実施しました。これらの研究では、全体的なパフォーマンスに対する影響を分析するために、ホストフレームワークの個々の要素が削除または変更されました。これらの研究の結果は、ホストの機能に関する貴重な洞察を提供し、中央の革新の重要性を確認しました。

アブレーション研究の中心的な結果は、マルチクリティックアーキテクチャの決定的な役割を確認することでした。研究者が単一の批評家を使用するようにシステムを変更したとき、システムは哀れに失敗しました。成功したリスクを学ぶことができなくなり、ほとんどの場合、ロボットは無力なままでした。この結果は、ホストのパフォーマンスのためのマルチクリティックアーキテクチャの中心的な重要性を強調し、専門の批評家が実際に学習の成功に大きく貢献していることを確認しています。

カリキュラムベースのトレーニングも、アブレーション研究の重要な成功要因であることが証明されました。研究者が難易度を徐々に増加させることなく、カリキュラムをランダムなトレーニングに置き換えたとき、システムのパフォーマンスは悪化しました。ロボットはよりゆっくりと学習し、パフォーマンスのレベルが低く、さまざまな開始位置や基質と比較して堅牢性が低くなりました。これは、カリキュラムベースのトレーニングが学習プロセスの効率を改善し、モデルの一般化を増加させるという仮定を確認します。

実装された移動制限は、特に実際の適用性に関して、総生産量に大きく貢献しました。研究者が滑らかさの正規化と移動速度制限を削除すると、ロボットはシミュレーションでまだ学習しましたが、実際には安定性が低く、頻繁に落ちたり、望ましくないぎくしゃくした動きにつながったりしました。これは、動きの制限がシミュレーションにおけるシステムの柔軟性をわずかに制限していることを示していますが、現実の世界では、堅牢で安全でハードウェアに優しい動作を確保するために不可欠です。

ホスト:多用途のヒューマノイドロボットのスプリングボード

さまざまな位置から立ち上がる能力は、一見すると些細なように思えるかもしれませんが、実際には、本当に多用途で自律的なヒューマノイドロボットの開発のための基本的なパズルです。これは、より複雑な移動および操作システムへの統合の基礎であり、さまざまな新しいアプリケーションを開きます。ロボットが立ち上がるだけでなく、異なるタスク間でシームレスに移動できると想像してください - ソファから立ち上がって、テーブルに移動し、オブジェクトをつかみ、障害物を避け、つまずいたときに起きます。もちろん、私たち人間にとっては、当然のことながら、このタイプのシームレスな環境との相互作用は、ヒューマノイドロボット工学の目標であり、ホストはこの目標に近づく決定的な一歩をもたらします。

ホストは、人間の形と人間の環境と相互作用する能力が有利であるさまざまな分野で、将来ホストと一緒に使用できます。看護では、高齢者や病気の人を支援したり、立ち上がったり座ったり、十分な物体を守ったり、家庭を支援したりすることができました。サービスエリアでは、ホテル、レストラン、ショップで使用して、顧客を運営したり、商品を輸送したり、情報を提供したりできます。災害救援や産業工場などの危険な環境では、人々にとって危険すぎる、または疲れすぎるタスクを引き受けることができました。

さらに、立ち上がる能力は、頑固な生産にも不可欠です。滝は、特に不均一または動的な環境で、ヒューマノイドロボットによくある問題です。このような環境では、転倒後に独立して立ち上がることができないロボットがすぐに無力になります。ホストは、ロボットが予期しない場所から再び現れ、タスクを継続できるため、ここでソリューションを提供します。これにより、ヒューマノイドロボットの信頼性とセキュリティが向上し、より堅牢で実用的なツールになります。

ホストは、新世代のヒューマノイドロボットへの道を開く

ホストは、既存の方法のさらなる開発以上のものです。これは、ヒューマノイドロボットの制御における重要なブレークスルーです。マルチクリティックなアーキテクチャとカリキュラムベースのトレーニングでの強化学習の革新的な使用により、以前のアプローチの制限を克服し、ロボットが驚くべき多様なポジションや多種多様な表面から立ち上がることができます。シミュレーションから実際のロボットへの転送が成功したことは、Unitre G1で実証されていることを示しています。障害への印象的な堅牢性は、実用的なアプリケーションのこの方法の大きな可能性を強調しています。

ホストは、研究室で感銘を受けただけでなく、現実の世界で真の付加価値を提供することができるヒューマノイドロボットへの道における重要なステップです。それは、ヒューマノイドロボットが日常生活にシームレスに統合され、多様なタスクで私たちをサポートし、私たちの生活をより快適で、より快適で効率的にする未来のビジョンに近づきます。ホストなどのテクノロジーにより、私たちの日常生活で私たちに伴うヒューマノイドロボットのかつて未来的なアイデアは、ますます具体的な現実になります。

に適し:

 

あなたのグローバルマーケティングおよびビジネス開発パートナー

☑️ 私たちのビジネス言語は英語またはドイツ語です

☑️ NEW: 母国語での通信!

 

デジタル パイオニア - Konrad Wolfenstein

コンラッド・ウルフェンシュタイン

喜んで個人アドバイザーとしてあなたと私のチームにお役に立ちたいと思っています。

お問い合わせフォームにご記入 +49 89 89 674 804 (ミュンヘン)までお電話ください。私のメールアドレスは: wolfenstein xpert.digital

私たちの共同プロジェクトを楽しみにしています。

 

 

☑️ 戦略、コンサルティング、計画、実行における中小企業のサポート

☑️ デジタル戦略の策定または再調整とデジタル化

☑️ 海外販売プロセスの拡大と最適化

☑️ グローバルおよびデジタル B2B 取引プラットフォーム

☑️ パイオニア事業開発 / マーケティング / PR / 見本市


⭐️ロボット工学/ロボット工学  ⭐️XPaper