在北京人形机器人数据基地,一个机器人如何学会“洗水果”?

在北京人形机器人数据基地,一个机器人如何学会“洗水果”?

2026-03-21 动态更新

界面新闻记者|金晶

界面新闻记者|文姝琪

正常人类洗4个水果,可能只需要1分钟,但在北京人形机器人创新中心具身智能机器人数据与训练基地,一个机器人洗完4个水果,需要8分钟,而这还是在人工通过遥操作器控制的前提下完成的。

不过,要让机器人真正有一天能进入家庭完成洗水果这件事,通过大量重复行为获取训练数据,再交由大模型学习,是必经之路北京人形机器人创新中心具身智能机器人数据与训练基地,正尝试围绕这一逻辑,开展数据采集、标注、质检的工业化流程探索。

操作员正在操控机器人洗水果

四天前,这位操控机器人洗水果的操作员拿到了一份文档,他必须严格按照客户的要求执行:在四个仿真水果上涂抹模拟污渍,然后用遥操作器操作机械臂拿起水果、打开水龙头、擦洗污渍、摆放回水果篮。四个水果都擦洗完毕,才算真正完成一遍。

遥操作器上有两个供人操作的机械臂,每个机械臂有六个关节,三个可以左右移动,三个可以竖直移动,分别与实际完成洗碗动作的机器人关节一一对应。由于不如人类关节灵活,机械臂动作略显缓慢。

目前,这位操作员已经完成了160遍,重复洗了640个水果。客户的要求是500遍,意味着他至少还需要保质保量地再重复这个动作六天。

这500条数据,是为了让大模型理解“把水果洗干净”究竟意味着什么。因此,需要采集的不仅仅是“洗”这个动作数据。机器人的两个夹爪和顶端各有两个摄像头,用于采集“干净”这一视觉数据。此外,操作员还需要实时更换背景,比如将洗手池上的清洁剂换成洗洁精,调换海绵擦和钢丝球的位置,以此提升模型的泛化性,让未来机器人在不同场景下都能完成这一任务。

这只是北京人形机器人创新中心具身智能机器人数据与训练基地的其中一个场景。除此之外,这里还根据客户需求搭建了家居、商超、办公、工业、医药、康养等领域的30余个场景,120多台机器人正在人工操控下,缓慢、精准地完成指定动作,包括摆放水果、给婴儿换尿布、整理工具箱、将矿泉水从冰箱拿至收银台等,每一个动作都至少需要重复上百遍。

机器人正在将矿泉水从冰箱拿至收银台

人形机器人想要真正走进生活或工业场景,需要处理复杂、多变的物理世界,涉及视觉、力觉、触觉等多模态数据。但当前,机器人行业普遍面临一个共同难题,缺乏足够的训练数据。

“跟小孩学习一样,你要教他知识,这些数据就是知识“。北京人形机器创新中心具身数据负责人孔超告诉界面新闻。数据与训练基地为解决这个问题提供了一个实际落地场景样本,为模型提供海量、多样、高质量的训练数据,提升能力,帮助机器人更好的理解人类世界。

北京人形机器人创新中心产品负责人、具身智能机器人数据与训练基地负责人蒋未来在接受界面新闻等媒体采访时介绍,目前数据训练基地的主要客户以模型研发公司为主,客户会指定特定的场景、任务以及数据数量。价格根据任务复杂度决定,简单的操作一小时数据价格在百元级别,复杂的任务则可达千元。

目前,北京人形机器人创新中心具身智能机器人数据与训练基地累计交付数据时长近两万小时。据蒋未来观察,2026年,机器人行业对数据的需求量级迎来跨越式增长,“目前市场上的订单或需求基本都是十万甚至几十万小时的量级,跟去年相比至少乘以十”。

“但是只有合格的数据才是知识”,孔超强调。以洗水果为例,一旦顺序错误,或者水果污渍没有擦干净,操作过程存在卡顿,质检人员便会将这条数据视为无效数据。一条合格的质量的数据要求包含多个维度,但简单来说,“越接近于人的操作的观感,质量更好“,蒋未来表示。

为了提高采集的数据的质量,需要针对不同任务类型制定详细的操作规范,比如操作员上岗前需通过标准化动作考核,确保同一任务在不同时间、不同人员执行下,采集到的动作轨迹具有高度一致性;数据质检时,需要保证动作完整、标注准确等等。只有通过全部质检的数据,才能进入算法训练流程。四个月前,数据训练基地刚刚成立时,质检合格率可能不到50%,但目前来说,“整体的合格率应该在95%以上的“,蒋未来称。

但蒋未来也坦言,真机采集模式需要投入大量资金采购机器人设备,设备还存在资产折旧问题,加上人员培训、场地搭建等持续投入,使得数据采集的前期成本居高不下。

从行业发展维度来看,人形机器人数据领域尚未建立统一的确权、定价与交易规范,加之采集数据与机器人硬件构型深度绑定,即A机型采集的数据无法直接适配B机型的训练需求,导致标准化的数据交易市场难以成型,大量数据的价值无法得到充分释放与流转。这套行业标准的统一与完善,仍需在全行业的实践探索中逐步推进。

孔超在接受界面新闻采访时表示,当前基地内的采集仍类似于“实验室”环境,“如果想要真正具备接近人类的智能水平,还需要到真实的环境里去跑”,以提升泛化能力。

然而,让机器人直接进入工厂或诸多复杂真实环境存在较大风险。因此,孔超认为,无本体采集将成为未来机器人数据采集的主要趋势,通过让人佩戴头环、手套等设备模拟机器人动作完成数据采集,再经算法清洗优化形成可用数据。在市场需求的推动下,预计今年无本体技术将更加成熟。

转载请注明来自研顺网,本文标题:《在北京人形机器人数据基地,一个机器人如何学会“洗水果”?》

每一天,每一秒,你所做的决定都会改变你的人生!
Top