⭐️机器人/机器人⭐️ XPaper  

语言选择 📢


类人动物站立控制:学会与“宿主”类人动物起床 - 日常生活中机器人的突破

发表于:2025年3月18日 /更新,发表于:2025年3月18日 - 作者: Konrad Wolfenstein

类人动物站立控制:学会与宿主类人生物一起起床 - 日常生活中机器人的突破

人形站立控制:学会与主机一起起床 - 日常生活中的机器人突破:humanoid-standup.github.io

不仅仅是起床:主机为自动和多功能的人形机器人铺平了道路

从模拟到现实:托管人类机器人如何教导自我就业

在令人着迷的人形机器人技术的世界中,机器模仿了越来越多的人类能力,这一显然简单但重要的技巧是起着核心作用:起床。对于我们人类来说,这是一个无意识的运动,这是我们每天执行无意识的运动。但是对于人形机器人来说,起床是一个复杂的挑战,需要复杂的控制,精确的传感器和智能算法的相互作用。但是,这种能力不仅是工程艺术的令人印象深刻的演示,而且是人形机器人在我们的日常生活中的地位,可以在各种责任领域为我们提供支持。

从不同的位置起床不仅仅是一个不错的附加功能。它是人形机器人的自主性和多功能性的基础。想象一下,机器人应该在家庭中为您提供帮助,协助照料或在危险环境中工作。在所有这些情况下,独立于不同位置设置的能力至关重要。在现实世界中,只有在理想的起始位置工作并且在跌倒时仍然无助的机器人仍然无助。因此,强大和多功能的策略的发展是将人类机器人从研究实验室带到现实世界的关键步骤。

以前解决此问题的方法通常达到了局限性。许多基于在受控环境中起作用的费力预编程的运动,但在无法预测的现实中迅速达到了极限。这些刚性系统不灵活,无法适应发生变化的状况,并且当机器人处于意外位置或处于不均匀的表面上时,会惨败。其他方法依赖于复杂的模拟环境,其结果通常很难转移到真实的机器人中。从模拟到现实的飞跃,即所谓的“模拟传播转移”,是许多有前途的研究方法的绊脚石。

在这种情况下,一个创新的框架进入了舞台,可以从根本上改变我们对抬高人形机器人的思考方式:主机,缩短了人形站立控制。主机不仅仅是另一种方法。这是一个范式转变。由亚洲著名大学的联盟建立,包括上海若o汤大学,香港大学,千江大学和香港中国大学,以传统的方式进行主持人,并采取了一种全新的方式来教人类机器人 - 以一种令人惊讶的多功能性,强大的,强大的,强大的和现实的方式。

适合:

主机:从错误中学习的框架

主机创新的核心在于使用增强学习(RL),这是一种由人和动物学习方式启发的机器学习方法。想象一下你教孩子骑自行车。他们没有给他每次肌肉运动的详细说明,而只是让它尝试一下。如果孩子跌倒在那里,它会在下一次尝试中纠正他的动作。通过尝试和错误,孩子逐渐学会通过正面和负面的反馈来掌握自行车。强化学习根据类似原则起作用。

在主机的情况下,人形机器人被放置在模拟环境中,并面临从不同位置起床的任务。机器人在该领域充当“代理”。在这种情况下,它采取了行动,在他的关节和身体的运动中。对于每个竞选活动,他都会获得“奖励”或“惩罚”,具体取决于它的成功。如果他起床,他将获得积极的回报。如果它跌倒或做出不必要的动作,他将获得负面的奖励。通过无数尝试获得经验和优化其策略的尝试,机器人逐渐学会了制定最佳的立场策略。

与以前基于RL的方法的决定性区别在于主机从头开始学习。没有预编程的运动,不使用人类示范或其他先前的知识。机器人以“空表”开头,并完全独立地制定了自己的成熟策略。这是一个基本进步,因为它使系统能够找到可能远远超出人类工程师可能提出的解决方案。此外,该系统使其具有极强的适应性,因为它不依赖于严格的假设或人类偏见。

多批架构的魔力

主持人创新的另一个心脏是多批架构。要理解这一点,我们必须简要处理强化学习的功能。典型的RL系统中有两个主要组成部分:执行器和评论家。可以说,执行器是选择动作的机器人大脑,即决定应进行哪些运动。评论家评估了执行者的行动,并给了他反馈。他告诉执行者他的行为是好是坏,以及如何改善它们。在传统的RL方法中,通常只有一个评论家。

主持人违反了这一约定,而是依靠几位专业批评家。想象一下,起床时有不同的方面:保持平衡,采取正确的姿势,坐标接头,控制旋转冲动。这些方面中的每一个都可以通过其自己的“专家”来评估。这正是使多批评结构的原因。主机使用多个评论家网络,每个网络都专门研究起始过程的某个方面。例如,一个评论家可以对余额进行评分,另一个批评家的共同协调和旋转冲动的第三方。

事实证明,这一分为专门的批评家非常有效。它解决了一个经常发生在传统RL系统中的问题:负面干扰。如果一个评论家试图同时评估复杂任务的所有方面,则可能会发生冲突和混乱。各种学习目标可以互相阻碍,减慢学习过程,甚至使它失败。多批架构通过将学习任务分解为较小,更清晰的子任务,并为每个部分任务使用专门的评论家,从而绕开了这个问题。然后,执行器会收到来自所有评论家的反馈,并学会结合起床的各个方面。

这种多批架构与起床的复杂任务特别相关。起床需要各种精细的运动技能和对旋转冲动的精确控制,以保持平衡而不跌倒。通过专门的批评家,主持人可以专门训练和优化起床的这些不同方面,这比单一评论家的传统方法可以取得明显更好的结果。在他们的研究中,研究人员表明,多批架构可以取得重大的绩效飞跃,并使主机能够制定使用常规方法无法达到无法达到的站立策略。

课程学习:从简单到复杂的

主持人成功的另一个关键是基于课程的培训。该方法基于人类的学习过程,在该过程中,我们逐渐学习复杂的技能,从简单的基础知识开始,然后慢慢地向我们努力。考虑骑自行车的例子。在孩子学会驾驶两个轮子之前,它可能会学会在叶轮上保持平衡或带有支撑自行车的驱动器。这些准备练习使以后的学习过程变得更加容易,并确保更快,更成功的进步。

主机实施了类似的原则。从一开始,机器人就不会面临最困难的任务,即从任何位置上站起来。取而代之的是,它接受了交错的课程,其中任务逐渐变得更加复杂。训练始于简单的场景,例如从平坦地板上的躺着的位置起床。一旦机器人很好地掌握了这项任务,条件就会逐渐变得更加困难。关于如何从坐姿或躺在墙上起床的新起点。从水平的土壤到略微不平衡的表面再到苛刻的地形,表面也有所不同。

基于课程的培训具有几个优势。一方面,它可以更有效地探索解决方案空间。该机器人最初着重于起床的基本方面,并在简单的情况下学习掌握它们。这加快了学习过程,机器人的性能更快。另一方面,课程改善了模型的概括。通过逐渐面对机器人更加多样化和复杂的任务,他学会了适应不同的情况,并发展出强大的策略,不仅在理想中而且在真实环境中也可以使用。各种训练条件对于在现实世界中系统的鲁棒性至关重要,在现实世界中,不可预测的表面和起始位置是规则而不是例外。

适合:

通过运动限制现实

主机的另一个重要方面是考虑到实际适用性。仿真是训练机器人的强大工具,但是现实世界不平等和不可预测。为了成功地掌握从模拟到现实的飞跃,主机对运动实施了两个重大限制,以确保所学的策略也可以在真实硬件上实施,并且不会损坏机器人。

第一个限制是平滑度正则化。这旨在减少振荡运动。在模拟中,机器人可以执行现实中存在问题的运动。例如,他们可能会产生生涩,发抖的动作,可能对物理硬件有害或导致行为不稳定。平滑度正则化确保了学习的动作更顺畅,流畅的动作,这不仅对硬件更温和,而且会导致更自然,更稳定的站立行为。

第二个限制是隐式运动速度限制。这样可以防止太快或突然的运动。在这里,模拟也经常代表理想的条件,在这种情况下,机器人可以以不切实际的高速进行运动。但是,在现实世界中,这种突然的运动可能会导致机器人损坏,例如使发动机超载或关节损坏。运动速度限制可确保所学的运动保留在真实硬件的物理极限范围内,并且不会危害机器人。

这些对运动的限制对于SIM到现实的转移至关重要。他们确保模拟中学到的策略不仅从理论上起作用,而且可以在不超载或损坏硬件的情况下实际上在真实的机器人上实施。它们是弥合模拟与现实之间差距并为在现实世界中使用的人形机器人之间的差距的重要一步。

实际测试:单位G1上的主机

每个机器人控制方法的实际测试是对真实硬件的实际实现。为了证明宿主的性能,研究人员将模拟中学到的控制策略转移到了单位G1人形机器人机器人中。 Untree G1是一个先进的人形生物平台,其特征是其敏捷性,稳健性和现实结构。它是评估现实世界中主机技能的理想测试床。

实际测试的结果令人印象深刻,并证实了宿主方法的有效性。由主机控制的Untree G1机器人从各种位置显示出显着的影响能力。他能够从坐着的位置,膝盖,甚至从他俯身在物体上或处于不平坦的表面上的位置上成功地从躺着的位置上站起来。模拟技能向现实世界的传输几乎是平稳的,这强调了主机的SIM卡转移的高质量。

特别值得注意的是,宿主控制的Unitree G1表现出的疾病的鲁棒性。在实验测试中,机器人面临外力,例如颠簸或打击。他面临着阻碍自己的障碍。它甚至装有重载(最多12公斤),以测试其稳定性和承载能力。在所有这些情况下,机器人都表现出显着的阻力,并能够成功地设置而不会失去或推翻平衡。

在一个令人印象深刻的示范视频中,主人的鲁棒性变得特别清晰。在那里,您可以看到一个人在开始过程中如何撞到单位G1机器人。尽管有这些巨大的疾病,但机器人仍无法删除。他实时纠正了自己的动作,改编了意外的效果,并最终安全地站起来。该演示令人印象深刻地说明了主机系统在真实,不可预测的环境中的实际适用性和可靠性。

适合:

消融研究:组件的相互作用

为了更精确地检查宿主的各个组成部分的重要性,研究人员进行了广泛的消融研究。在这些研究中,删除或更改了主机框架的各个要素,以分析其对整体绩效的影响。这些研究的结果为宿主的功能提供了宝贵的见解,并确认了中央创新的重要性。

消融研究的核心结果是确认了多批评结构的决定性作用。当研究人员以仅使用单个评论家的方式修改系统时,该系统可怜地失败了。它不再能够学习成功的风险,在大多数情况下,机器人仍然无助。该结果强调了多批架构对主机表现的核心重要性,并确认专门的批评家实际上对学习成功做出了重要贡献。

基于课程的培训也被证明是消融研究中的重要成功因素。当研究人员通过随机培训而没有逐渐增加难度来取代课程时,系统的性能恶化。机器人学到的较慢,达到较低的性能水平,与各种起始位置和底物相比,它的稳健性较低。这证实了以下假设:基于课程的培训可以提高学习过程的效率并增加模型的概括。

实施的运动限制也对总产出做出了重大贡献,尤其是在实际适用性方面。当研究人员删除平滑度正则化和运动速度限制时,机器人仍会在模拟中学到,但实际上它们的稳定性较低,导致更频繁地跌落或导致不良的生动动作。这表明,对运动的限制略微限制了模拟中系统的灵活性,但在现实世界中至关重要,以确保坚固,安全和硬件友好的行为。

主机:用于多功能类人机器人的跳板

乍一看,从不同位置起床的能力似乎很容易,但实际上是开发真正多才多艺和自主的人形机器人机器人的根本难题。它是集成到更复杂的运动和操纵系统中的基础,并打开了各种新应用程序。想象一下,机器人不仅可以站起来,而且可以在不同的任务之间无缝地移动 - 从沙发上起床,转到桌子上,抓住对象,避免障碍并在跌跌撞撞时起床。这种与环境的无缝互动对我们来说当然是人类机器人技术的目标,这是人类机器人技术的目标,主机使我们更接近这个目标。

将来,主机可以与主机一起在各个领域与他们的人类形态和与人类环境互动的能力有利。在护理方面,他们可以支持年长或病人,帮助他们起身坐下,足够的物体或帮助家庭。在服务区域,它们可用于酒店,餐馆或商店来运营客户,运输商品或提供信息。在危险环境中,例如救灾或工厂,他们可能承担对人们太冒险或疲惫的任务。

此外,起床的能力对于顽固的生产也是必不可少的。跌倒是人形机器人的常见问题,尤其是在不均匀或动态环境中。在这种环境中,跌倒后无法独立起床的机器人很快就无助。主机在这里提供解决方案,因为它使机器人能够从意外地点重新出现并继续其任务。这增加了人形机器人的可靠性和安全性,并使它们更加健壮,更实用。

主机为新一代的人形机器人铺平了道路

主机不仅仅是现有方法的进一步发展;这是人类机器人控制的重大突破。通过创新的增强学习和基于课程的培训的增强学习,它克服了对先前方法的限制,并使机器人能够从各种各样的位置和各种表面上站起来。从仿真到真正的机器人的成功转移,在Unitre G1上证明,以及对疾病的令人印象深刻的鲁棒性强调了这种方法在实际应用中的巨大潜力。

主机是通往人形机器人的重要一步,不仅在实验室中给人留下深刻印象,而且还可以在现实世界中提供真正的附加价值。它使我们更接近一个未来的愿景,即人类机器人无缝整合到我们的日常生活中,支持我们从事多种任务,并使我们的生活更加舒适,更舒适和高效。借助诸如主机之类的技术,曾经伴随着我们日常生活的人形机器人的未来派思想变得越来越明显。

适合:

 

您的全球营销和业务发展合作伙伴

☑️我们的业务语言是英语或德语

☑️ 新:用您的国家语言进行通信!

 

数字先锋 - 康拉德·德军总部

康拉德·德军总部

我很乐意作为个人顾问为您和我的团队提供服务。

您可以通过填写此处的联系表,或者直接致电+49 89 89 674 804 (慕尼黑)。我的电子邮件地址是: wolfenstein xpert.digital

我很期待我们的联合项目。

 

 

☑️ 为中小企业提供战略、咨询、规划和实施方面的支持

☑️ 创建或调整数字战略和数字化

☑️国际销售流程的扩展和优化

☑️ 全球数字 B2B 交易平台

☑️ 先锋业务发展/营销/公关/贸易展览会


⭐️机器人/机器人⭐️ XPaper