تم نشره على: 18 مارس 2025 / تحديث من: 18 مارس 2025 - المؤلف: Konrad Wolfenstein

السيطرة على الوقوف البشري: تعلم الاستيقاظ مع المضيفين-اختراق الروبوتات في صورة الحياة اليومية: Humanoid-Standup.github.io
أكثر من مجرد الاستيقاظ: يمهد المضيف الطريق للروبوتات البشرية المستقلة والمتعددة الاستخدامات
من المحاكاة إلى الواقع: كيف تعلّم روبوتات Humanoid المضيفة أن الذات
في العالم الرائع من الروبوتات البشرية ، حيث تقليد الآلات المزيد والمزيد من القدرات البشرية ، فإن المهارة البسيطة ولكن المهمة على ما يبدو أنها تلعب دورًا رئيسيًا: الاستيقاظ. إنها مسألة بالطبع بالنسبة لنا نحن البشر ، وهي حركة اللاواعية التي نقوم بها بأوقات لا حصر لها كل يوم. ولكن بالنسبة للروبوت البشري ، فإن الاستيقاظ يمثل تحديًا معقدًا يتطلب تفاعل السيطرة المتطورة وأجهزة الاستشعار الدقيقة والخوارزميات الذكية. ومع ذلك ، فإن هذه القدرة ليست مجرد مظاهرة رائعة للفن الهندسي ، ولكنها أيضًا شرط أساسي للروبوتات البشرية التي تجد مكانها في حياتنا اليومية ويمكن أن تدعمنا في مجموعة متنوعة من مجالات المسؤولية.
الاستيقاظ من مواقع مختلفة هو أكثر بكثير من مجرد وظيفة إضافية لطيفة. هذا هو أساس الحكم الذاتي وتنوع الروبوتات البشرية. تخيل أن الروبوت يجب أن يساعدك في الأسرة أو المساعدة في الرعاية أو العمل في بيئات خطرة. في كل هذه السيناريوهات ، فإن القدرة على الإعداد بشكل مستقل عن مواقع مختلفة لها أهمية حاسمة. الروبوت الذي يعمل فقط في مواقع البداية المثالية ولا يزال عاجزًا عندما يكون السقوط غير قابل للاستخدام ببساطة في العالم الحقيقي. وبالتالي فإن تطوير استراتيجيات قوية ومتعددة الاستخدامات إلى ما هو خطوة أساسية لجلب الروبوتات البشرية من مختبر الأبحاث إلى العالم الحقيقي.
غالبًا ما وصلت النهج السابقة لحل هذه المشكلة إلى حدودها. استند الكثيرون إلى الحركات المبرمجة المبرمجة التي عملت في البيئات الخاضعة للرقابة ، ولكن سرعان ما وصلوا إلى حدودها في الواقع غير المتوقع. كانت هذه الأنظمة الصلبة غير مرنة ، ولم تتمكن من التكيف مع الظروف المتغيرة وفشل فشلاً ذريعًا عندما هبط الروبوت في وضع غير متوقع أو كان على أسطح غير متساوية. تعتمد الأساليب الأخرى على بيئات المحاكاة المعقدة ، والتي كان من الصعب نقل نتائجها إلى الروبوتات الحقيقية. تبين أن القفزة من المحاكاة إلى الواقع ، ما يسمى بـ "نقل سيم إلى حقيقي" ، هو حجر عثرة في العديد من أساليب البحث الواعدة.
في هذا السياق ، يدخل إطار مبتكر المرحلة التي يمكن أن تغير بشكل أساسي الطريقة التي نفكر بها في الحصول على روبوتات بشرية: مضيف ، قصير للسيطرة على الدفان البشري. المضيف أكثر من مجرد طريقة أخرى ؛ إنه تحول نموذج. تم تطويره من قبل كونسورتيوم من الجامعات المشهورة في آسيا ، بما في ذلك جامعة شنغهاي جياو تونغ ، وجامعة هونغ كونغ ، وجامعة تشجيانغ ، والجامعة الصينية في هونغ كونغ ، تستضيف النهج التقليدية وتتخذ طريقة جديدة تمامًا لتدريس الروبوتات البشرية - بطريقة تنوعية ومتنوعة وحيوية.
مناسب ل:
المضيف: إطار يتعلم من الأخطاء
يكمن جوهر الابتكار المضيف في استخدام التعلم التعزيز (RL) ، وهي طريقة للتعلم الآلي مستوحى من الطريقة التي يتعلم بها الأشخاص والحيوانات. تخيل أنك تعلّم طفلاً ركوب الدراجات. إنهم لا يعطونه تعليمات مفصلة لكل حركة عضلية ، لكنهم ببساطة دعوها تجربها. إذا سقط الطفل هناك ، فإنه يصحح تحركاته في المحاولة التالية. من خلال المحاولة والأخطاء ، يتعلم الطفل تدريجياً إتقان الدراجة من خلال ردود الفعل الإيجابية والسلبية. التعلم التعزيز يعمل وفقًا لمبدأ مماثل.
في حالة المضيف ، يتم وضع روبوت بشري في بيئة محاكاة ويواجه مهمة الاستيقاظ من مواقع مختلفة. يعمل الروبوت كـ "وكيل" في هذا المجال. إنه يؤدي الإجراءات ، في هذه الحالة حركات مفاصله وجسده. لكل حملة ، يتلقى "مكافأة" أو "عقوبة" ، اعتمادًا على مدى نجاحها. إذا استيقظ ، فإنه يتلقى مكافأة إيجابية. إذا سقطت أو قام بحركات غير مرغوب فيها ، فإنه يتلقى مكافأة سلبية. من خلال محاولات لا حصر لها لاكتساب الخبرة وتحسين استراتيجياتها ، يتعلم الروبوت تدريجياً تطوير أفضل استراتيجية ممكنة.
الفرق الحاسم في الأساليب السابقة المستندة إلى RL هو أن المضيف يتعلم من نقطة الصفر. لا يتم استخدام حركات مطبوعة مسبقًا ، ولا توجد مظاهرات بشرية أو غيرها من المعرفة السابقة. يبدأ الروبوت بـ "ورقة فارغة" ويطور استراتيجياتها بشكل مستقل تمامًا. هذا تقدم أساسي ، لأنه يمكّن النظام من إيجاد حلول قد تتجاوز بكثير ما يمكن للمهندسين البشر توصل إليه. بالإضافة إلى ذلك ، يجعل النظام قابلاً للتكيف للغاية لأنه لا يعتمد على افتراضات جامدة أو تحيز بشري.
سحر الهندسة المعمارية المتعددة
قلب آخر من الابتكار المضيف هو الهندسة المعمارية متعددة النقد. لفهم ذلك ، يتعين علينا أن نتعامل بإيجاز مع أداء التعلم التعزيز. هناك مكونان مركزيان في أنظمة RL النموذجية: المشغل والناقد. المشغل ، إذا جاز التعبير ، فإن دماغ الروبوت الذي يختار الإجراءات ، أي يقرر الحركات التي يجب تنفيذها. يقيم الناقد تصرفات المشغل ويعطيه ملاحظات. يخبر المشغل ما إذا كانت أفعاله جيدة أو سيئة وكيف يمكن تحسينها. في أساليب RL التقليدية ، عادة ما يكون هناك ناقد واحد فقط.
يستمتع المضيف بهذه الاتفاقية وبدلاً من ذلك يعتمد على العديد من النقاد المتخصصين. تخيل أن هناك جوانب مختلفة عند الاستيقاظ المهم: امسك التوازن ، خذ الموقف الصحيح ، تنسيق المفاصل ، والتحكم في الدافع الدوار. يمكن تقييم كل من هذه الجوانب من قبل "الخبير" الخاص به. هذا هو بالضبط ما يجعل الهندسة المعمارية متعددة النقد. يستخدم Host العديد من شبكات النقاد ، كل منها متخصص في جانب معين من عملية البداية. يمكن أن يقوم أحد الناقدين ، على سبيل المثال ، بتقييم التوازن ، وآخر التنسيق المشترك وطرف ثالث في الدافع الدوار.
أثبت هذا القسم إلى النقاد المتخصصين أنه فعال للغاية. إنه يحل مشكلة تحدث غالبًا في أنظمة RL التقليدية: التداخل السلبي. إذا حاول أحد الناقدين تقييم جميع جوانب المهمة المعقدة في نفس الوقت ، فيمكن أن يحدث التعارض والارتباك. يمكن أن تعيق أهداف التعلم المختلفة بعضها البعض وتؤدي إلى إبطاء عملية التعلم أو حتى تجعلها تفشل. تتجاوز الهندسة المعمارية المتعددة هذه المشكلة عن طريق تفكيك مهمة التعلم إلى مهام أصغر وأكثر وضوحًا واستخدام ناقد متخصص لكل مهمة جزئية. ثم يتلقى المشغل ملاحظات من جميع النقاد ويتعلم الجمع بين الجوانب المختلفة للاستيقاظ على النحو الأمثل.
هذه الهندسة المعمارية متعددة النحوية ذات صلة بشكل خاص بالمهمة المعقدة المتمثلة في الاستيقاظ. يتطلب الحصول على مجموعة متنوعة من المهارات الحركية الدقيقة والتحكم الدقيق في الدافع الدوار من أجل الحفاظ على التوازن وعدم السقوط. من خلال النقاد المتخصصين ، يمكن للمضيف تدريب وتحسين هذه الجوانب المختلفة من الاستيقاظ ، مما يؤدي إلى نتائج أفضل بكثير من الأساليب التقليدية مع ناقد واحد. في دراساتهم ، أظهر الباحثون أن الهندسة المعمارية متعددة النحوية تتيح قفزة كبيرة في الأداء وتمكين المضيف لتطوير استراتيجيات الوقوف التي لا يمكن الوصول إليها باستخدام الطرق التقليدية.
تعلم المناهج الدراسية: من البسيط إلى المجمع
مفتاح آخر لنجاح المضيف هو التدريب القائم على المناهج الدراسية. تعتمد هذه الطريقة على عملية التعلم البشري ، حيث نتعلم تدريجياً مهارات معقدة ، بدءًا من الأساسيات البسيطة ثم العمل ببطء معنا. فكر في مثال ركوب الدراجات. قبل أن يتعلم الطفل القيادة على عجلتين ، قد يتعلم ذلك الحفاظ على رصيدك على المكره أو القيادة مع دراجات الدعم. هذه التمارين التحضيرية تجعل عملية التعلم اللاحقة أسهل وتضمن تقدمًا أسرع وأكثر نجاحًا.
نفذ المضيف مبدأ مماثل. لا يواجه الروبوت مهمة أصعب من البداية ، وهي الاستيقاظ على أي سطح من أي موضع. بدلاً من ذلك ، فإنه يخضع لمنهج متداخل تصبح فيه المهام تدريجياً أكثر تعقيدًا. يبدأ التدريب بسيناريوهات بسيطة ، على سبيل المثال الاستيقاظ من وضع الكذب على الطابق المسطح. بمجرد أن يتقن الروبوت هذه المهمة بشكل جيد ، تصبح الظروف أكثر صعوبة تدريجياً. هناك مواقع انطلاق جديدة حول كيفية الاستيقاظ من وضع الجلوس أو من الاستلقاء على الحائط. يتنوع السطح أيضًا ، من التربة المستوية إلى الأسطح غير المستوية قليلاً إلى التضاريس الأكثر تطلبًا.
هذا التدريب القائم على المنهج لديه العديد من المزايا. من ناحية ، فإنه يتيح استكشاف أكثر كفاءة لمساحة الحل. يركز الروبوت في البداية على الجوانب الأساسية للاستيقاظ والتعلم لإتقانها في سيناريوهات بسيطة. هذا يسرع في عملية التعلم ويصل الروبوت إلى مستوى جيد من الأداء بشكل أسرع. من ناحية أخرى ، فإن المنهج يحسن تعميم النموذج. من خلال مواجهة الروبوت تدريجياً بمهام أكثر تنوعًا وتعقيدًا ، يتعلم التكيف مع المواقف المختلفة وتطوير استراتيجيات قوية -لا تعمل فقط في المثل العليا ولكن أيضًا في البيئات الحقيقية. تعد مجموعة متنوعة من ظروف التدريب أمرًا بالغ الأهمية بالنسبة لمتانة النظام في العالم الحقيقي ، حيث تكون الأسطح غير المتوقعة ومواقف البدء هي القاعدة وليس الاستثناء.
مناسب ل:
الواقع من خلال قيود الحركة
جانب آخر مهم من المضيف هو أخذ في الاعتبار قابلية التطبيق الحقيقي. تعد المحاكاة أداة قوية لتدريب الروبوتات ، لكن العالم الحقيقي غير متكافئ أكثر تعقيدًا ولا يمكن التنبؤ به. من أجل إتقان قفزة من المحاكاة إلى الواقع بنجاح ، يقوم المضيف بتنفيذ قيودان مهمتين على الحركة التي تضمن أنه يمكن أيضًا تنفيذ الاستراتيجيات المستفادة على أجهزة حقيقية ولا تضر بالروبوت.
التقييد الأول هو تنظيم نعومة. هذا يهدف إلى تقليل الحركات المتذبذبة. في عمليات المحاكاة ، يمكن للروبوتات تنفيذ حركات من شأنها أن تكون مشكلة في الواقع. على سبيل المثال ، يمكن أن يصنعوا حركات متشنج ، ترتجف قد تكون ضارة بالأجهزة المادية أو قد تؤدي إلى سلوك غير مستقر. يضمن تنظيم النعومة أن تكون الحركات المستفادة أكثر سلاسة وسائلة ، والتي ليست فقط ألطفًا للأجهزة ، ولكنها تؤدي أيضًا إلى سلوك احتياطي أكثر طبيعية ومستقرة.
التقييد الثاني هو حد سرعة الحركة الضمنية. هذا يمنع الحركات السريعة أو المفاجئة. هنا ، أيضًا ، غالبًا ما تمثل عمليات المحاكاة الظروف المثالية التي يمكن أن تؤدي فيها الروبوتات إلى حركات بسرعات عالية بشكل غير واقعي. ومع ذلك ، في العالم الحقيقي ، يمكن أن تؤدي مثل هذه الحركات المفاجئة إلى تلف الروبوت ، على سبيل المثال لإفراط في تحميل المحركات أو الأضرار التي لحقت بالمفاصل. يضمن حد سرعة الحركة أن تبقى الحركات المستفادة ضمن الحدود المادية للأجهزة الحقيقية ولا تعرض الروبوت للخطر.
هذه القيود المفروضة على الحركة أمر بالغ الأهمية لنقل سيم إلى حقيقي. إنها تضمن أن الاستراتيجيات المستفادة في المحاكاة لا تعمل من الناحية النظرية فحسب ، بل يمكن تنفيذها عمليًا على الروبوتات الحقيقية دون التحميل الزائد أو إتلاف الأجهزة. إنها خطوة مهمة لسد الفجوة بين المحاكاة والواقع وإعداد الروبوتات البشرية للاستخدام في العالم الحقيقي.
الاختبار العملي: مضيف على Unitree G1
الاختبار الحقيقي لكل طريقة التحكم في الروبوت هو التنفيذ العملي على الأجهزة الحقيقية. من أجل إظهار أداء المضيف ، قام الباحثون بنقل استراتيجيات التحكم المستفادة في المحاكاة إلى Robot Humanoid Unitree G1. The Untree G1 عبارة عن منصة بشرية متقدمة تتميز بخفة بخشاعها وقويتها والبناء الواقعي. إنه سرير اختبار مثالي لتقييم مهارات المضيف في العالم الحقيقي.
كانت نتائج الاختبارات العملية مثيرة للإعجاب وأكدت فعالية نهج المضيف. أظهر روبوت G1 Un -Tree ، الذي يسيطر عليه المضيف ، قدرات تأثير ملحوظة من مجموعة واسعة من المواقف. لقد كان قادرًا على الاستيقاظ بنجاح من وضع الكذب ، من موقع جالس ، من الركبتين وحتى من المواقف التي كان يميل فيها ضد الأشياء أو كان على السطح غير المتكافئ. كان نقل المهارات المحاكاة إلى العالم الحقيقي سلسًا تقريبًا ، مما يؤكد على الجودة العالية لنقل SIM إلى REAL من المضيف.
الجدير بالملاحظة بشكل خاص هو متانة الاضطرابات التي أظهرها Unitree G1 التي يسيطر عليها المضيف. في الاختبارات التجريبية ، واجه الروبوت مع قوى خارجية ، على سبيل المثال عن طريق المطبات أو الضربات. واجه عقبات منعت. حتى أنه تم تحميله بأحمال ثقيلة (تصل إلى 12 كجم) لاختبار استقرارها وقدرة الحمل. في كل هذه المواقف ، أظهر الروبوت مقاومة ملحوظة وتمكن من الإعداد بنجاح دون فقدان التوازن أو الإطاحة به.
في فيديو مظاهرة مثيرة للإعجاب ، أصبحت متانة المضيف واضحة بشكل خاص. هناك يمكنك أن ترى كيف اصطدم الشخص بروبوت Unitree G1 أثناء عملية البدء. على الرغم من هذه الاضطرابات الهائلة ، لا يمكن إزالة الروبوت. قام بتصحيح تحركاته في الوقت الفعلي ، وتكييف الآثار غير المتوقعة وأخيراً استيقظ بأمان ومستقرة. يوضح هذا العرض التوضيحي بشكل مثير للإعجاب قابلية التطبيق وموثوقية نظام المضيف في بيئات حقيقية لا يمكن التنبؤ بها.
مناسب ل:
دراسات الاجتثاث: تفاعل المكونات
من أجل دراسة أهمية المكونات الفردية للمضيفين بشكل أكثر دقة ، قام الباحثون بدراسات استئصال واسعة النطاق. في هذه الدراسات ، تمت إزالة العناصر الفردية من أطر المضيف أو تغييرها من أجل تحليل تأثيرها على الأداء الكلي. قدمت نتائج هذه الدراسات رؤى قيمة في عمل المضيفين وأكدت أهمية الابتكارات المركزية.
وكانت النتيجة المركزية لدراسات الاجتثاث تؤكد الدور الحاسم للعمارة متعددة النقد. عندما قام الباحثون بتعديل النظام بطريقة لا تستخدم سوى ناقد واحد ، فشل النظام بشكل كبير. لم يعد قادرًا على تعلم المخاطر الناجحة ، وظل الروبوت عاجزًا في معظم الحالات. تؤكد هذه النتيجة على الأهمية المركزية للهندسة المعمارية متعددة النحى لأداء المضيف وتؤكد أن النقاد المتخصصين يقدمون في الواقع مساهمة كبيرة في النجاح في التعلم.
أثبت التدريب القائم على المناهج أيضًا أنه عامل نجاح مهم في دراسات الاجتثاث. عندما استبدل الباحثون المنهج بالتدريب العشوائي دون زيادة تدريجية في الصعوبة ، تدهور أداء النظام. تعلم الروبوت ببطء أكثر ، ووصل إلى مستوى أقل من الأداء وكان أقل قوة مقارنة بمختلف مواقع البداية والركائز. هذا يؤكد افتراض أن التدريب القائم على المناهج الدراسية يحسن كفاءة عملية التعلم ويزيد من تعميم النموذج.
كما ساهمت قيود الحركة المنفذة بشكل كبير في إجمالي الناتج ، خاصة فيما يتعلق بالتطبيق العملي. عندما قام الباحثون بإزالة تنظيم النعومة وحد سرعة حركة الحركة ، لا يزال الروبوت يتعلم في المحاكاة ، ولكن في الواقع كانوا أقل استقرارًا وأقدموا في كثير من الأحيان إلى السقوط أو يؤدي إلى حركات غير مرغوب فيها. هذا يدل على أن القيود المفروضة على الحركة تقيد بشكل طفيف مرونة النظام في المحاكاة ، ولكنها ضرورية في العالم الحقيقي لضمان سلوك قوي وآمن وأجهزة.
المضيف: نقطة انطلاق للروبوتات البشرية متعددة الاستخدامات
قد تبدو القدرة على الاستيقاظ من مواقف مختلفة تافهة للوهلة الأولى ، ولكنها في الواقع جزء أساسي من اللغز لتطوير الروبوتات البشرية متعددة الاستخدامات والمستقلة. هذا هو الأساس للتكامل في أنظمة الحركة والتلاعب الأكثر تعقيدًا ويفتح مجموعة متنوعة من التطبيقات الجديدة. تخيل أن الروبوت لا يمكنه الاستيقاظ فحسب ، بل يتحرك أيضًا بسلاسة بين المهام المختلفة - استيقظ من الأريكة ، والانتقال إلى الطاولة ، والاستيلاء على الأشياء ، وتجنب العقبات والاستيقاظ عندما يتعثر. هذا النوع من التفاعل السلس مع البيئة ، وهو أمر بالطبع بالنسبة لنا البشر ، هو هدف الروبوتات البشرية والمضيف يجعلنا خطوة حاسمة من هذا الهدف.
يمكن استخدام المضيف مع المضيف في المستقبل في مجموعة متنوعة من المجالات التي يكون فيها شكلها البشري وقدرتها على التفاعل مع البيئة البشرية مفيدة. في التمريض ، يمكنهم دعم الأشخاص الأكبر سناً أو المرضى ، أو مساعدتهم على الصعود والجلوس ، أو أشياء كافية أو مساعدة في الأسرة. في منطقة الخدمة ، يمكن استخدامها في الفنادق أو المطاعم أو المتاجر لتشغيل العملاء أو نقل السلع أو تقديم المعلومات. في البيئات الخطرة ، مثل النقوش في حالات الكوارث أو في النباتات الصناعية ، يمكن أن تواجه مهام محفوفة بالمخاطر أو مرهقة للغاية بالنسبة للأشخاص.
بالإضافة إلى ذلك ، فإن القدرة على الاستيقاظ ضرورية أيضًا للإنتاج العنيدة. تعتبر السقوط مشكلة شائعة مع الروبوتات البشرية ، وخاصة في البيئات غير المستوية أو الديناميكية. روبوت لا يمكنه الاستيقاظ بشكل مستقل بعد السقوط لا حول له ولا قوة في مثل هذه البيئات. يقدم Host حلاً هنا لأنه يمكّن الروبوت من الظهور من مواقع غير متوقعة ومواصلة مهمته. هذا يزيد من موثوقية وأمن الروبوتات البشرية ويجعلها أكثر قوة وأكثر عملية.
يستهدف المضيف الطريق لجيل جديد من الروبوتات البشرية
المضيف هو أكثر من مجرد تطور آخر للطرق الحالية ؛ إنه اختراق كبير في السيطرة على الروبوتات البشرية. من خلال الاستخدام المبتكر للتعلم التعزيز مع الهندسة المعمارية المتعددة النحوية والتدريب القائم على المناهج الدراسية ، فإنه يتغلب على قيود الأساليب السابقة ويمكن الروبوتات من الوقوف من مجموعة متنوعة رائعة من المواقف وعلى مجموعة واسعة من الأسطح. يوضح النقل الناجح من المحاكاة إلى الروبوت الحقيقي ، في Unitre G1 ، والمتانة المثيرة للإعجاب للاضطرابات التي تؤكد على الإمكانات الهائلة لهذه الطريقة للتطبيقات العملية.
يعد المضيف خطوة مهمة في الطريق إلى الروبوتات البشرية التي لا تثير الإعجاب في المختبر فحسب ، بل يمكنها أيضًا تقديم قيمة مضافة حقيقية في العالم الحقيقي. إنه يقترب من رؤية المستقبل الذي يتم فيه دمج الروبوتات البشرية بسلاسة في حياتنا اليومية ، ويدعمنا في مهام متنوعة وجعل حياتنا أكثر راحة وأكثر راحة وكفاءة. مع التقنيات مثل المضيف ، تصبح الفكرة المستقبلية التي كانت مستقبلية للروبوتات البشرية التي ترافقنا في حياتنا اليومية أكثر فأكثر واقعية.
مناسب ل:
شريكك العالمي في التسويق وتطوير الأعمال
☑️ لغة العمل لدينا هي الإنجليزية أو الألمانية
☑️ جديد: المراسلات بلغتك الوطنية!
سأكون سعيدًا بخدمتك وفريقي كمستشار شخصي.
يمكنك الاتصال بي عن طريق ملء نموذج الاتصال أو ببساطة اتصل بي على +49 89 89 674 804 (ميونخ) . عنوان بريدي الإلكتروني هو: ولفنشتاين ∂ xpert.digital
إنني أتطلع إلى مشروعنا المشترك.