机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 110|回复: 0

当前人形机器人训练方法的根本缺陷

[复制链接]

2万

主题

3万

帖子

21万

积分

超级版主

Rank: 8Rank: 8

积分
215413
发表于 6 天前 | 显示全部楼层 |阅读模式
https://www.news.cn/tech/2025120 ... 42bed75113d4/c.html

这是新华网关于人形机器人训练场的一篇报道,其中笑掉大牙。

在某市人形机器人机器人数据采集预训练场,训练员在教一台人形机器人使用扳手拧螺丝。
新闻说,人形机器人还需掌握螺丝型号识别,多规格工具适配等复合技能。
怎么教呢,就是训练员戴着VR眼镜,通过人形机器人的摄像头来看到操作台进行操作。


这就是最大的问题,当训练员戴着 VR 眼镜通过机器人的摄像头看世界并操控它时,整个系统中真正在 "思考" 和 "感知" 的是人类的大脑和眼睛,机器人只是一个高精度的远程执行器。

在这个过程中:
螺丝在哪里、是什么型号 → 人类眼睛识别;
扳手应该怎么拿、对准哪个角度 → 人类大脑决策;
用多大的力拧、拧到什么程度停 → 人类肌肉感知和判断;
机器人只是忠实地复现人类的关节运动轨迹。


咱们假设一下:一个人蒙着眼,在另一个人的语音指导下做动作。无论重复多少次,蒙眼人永远学不会自己看、自己判断。当有一天摘掉眼罩让他独立操作时,他会完全不知所措。
VR 遥操作示教之所以成为行业标配,不是因为它是最好的方法,而是因为它是当前技术水平下唯一可行的方法。
人形机器人有大约 30 个自由度,其状态空间是天文数字级别的。如果让机器人完全从零开始通过试错学习(纯强化学习),即使在仿真环境中也需要上亿次尝试,更不用说在真实硬件上会导致灾难性的损坏。


人类遥操作可以直接提供:经过验证的、成功的动作轨迹;精确的关节角度和时序数据;
物理交互的力觉和触觉数据,这是纯视频学习无法提供的。
视频只能告诉你 "做了什么动作",但无法告诉你 "用了多大的力"。而拧螺丝、拿鸡蛋这类精细操作,力的控制恰恰是成败的关键。

很多公司宣传的 "机器人上岗",实际上是 "远程操控 + 少量自主" 的混合模式。在机器人真正具备自主能力之前,通过人类远程操控实现 "即刻可用",先占领市场,再慢慢迭代算法。

但是VR 示教训练存在几个无法克服的根本性问题:
在训练过程中,感知和决策环节被人类替代了,模型学到的只是 "在某种视觉输入下应该做出什么动作" 的映射关系,而没有真正理解 "为什么要这么做"。

这就导致:
机器人在完全相同的场景下可以完美复现动作;
但只要场景有一点点变化,比如螺丝位置偏了 1 厘米、光线变了、扳手换了个型号,成功率就会断崖式下跌。
它永远不会主动去寻找螺丝,也不会在拧滑牙时调整策略。



人类的身体结构和运动方式与机器人有本质区别,人类的动作是为人类的骨骼、肌肉和关节优化的,直接复制到机器人身上往往不是最优解,甚至可能导致机器人损坏。
更严重的是,人类会不自觉地带入自己的 "常识" 和 "经验",而这些是机器人没有的。比如人类知道 "螺丝拧不动时不能硬拧",但机器人只会严格执行人类示范的扭矩,直到把螺丝拧断。


一个熟练的训练员一天最多只能采集 4-6 小时的有效数据。要让机器人掌握一个简单的拧螺丝技能,可能需要上千次示范。而现实世界中有无数种螺丝、无数种工具、无数种场景,这种方法永远无法覆盖所有可能性。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2026-5-17 16:44 , Processed in 0.072966 second(s), 20 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表