芯片复制全球具身智能加速进化中
在具身智能领域,数据对于训练深度学习模型以增强和优化机器人能力至关重要,但数据采集成本高昂、数据采集效率低、数据通用性差等因素极大限制了具身智能的发展。
北京航空航天大学机器人研究所所长王田苗也指出,芯片复制数据的匮乏让人形机器人很难具备泛化性。当前,机器人任务泛化、感知泛化和运动操作的三个泛化数据很难获取,比如让机器人迭衣服、骑自行车等这些数据很难得到。
也正因如此,数据集的开源就成为了推动具身智能行业共同进步的关键“加速器”。
2024年末至今,全球已有8家具身智能公司与研究机构宣布开源数据集,多方巨头正共同助力数据生态建设,加速全球具身智能进化。
傅利叶——FourierActionNet
3月17日,上海机器人企业傅利叶正式开源全尺寸人形机器人数据集FourierActionNet,首批上线超3万条高质量真机训练数据。
数据集囊括傅利叶GRx系列所有机型的各类任务训练,芯片复制完整记录机器人在真实环境中的任务执行数据,涵盖了对常用工具、家居用品、食物等多种物体的精确取放、倾倒等操作,以及在不同环境条件下实现泛化执行,包含专门针对手部任务的模仿学习数据,适配多自由度灵巧手任务,同时,所有数据均采用视觉语言模型(VLM)进行自动标注,并通过人工二次核验。
值得注意的是,FourierActionNet包含万级真机训练数据,包含专门针对手部任务的模仿学习数据,适配多自由度灵巧手任务,所有数据均采用视觉语言模型(VLM)进行自动标注,并通过人工二次核验,确保数据精度与准确性。
3月12日,北京人形机器人创新中心有限公司 Tien Kung(以下称“创新中心”)发布了全球首个“一脑多能”“一脑多机”的通用具身智能平台“慧思开物”。“慧思开物”的应用是对基于单一场景单一任务做专项开发这一传统机器人应用开发模式的颠覆,同时也填补了具身智能领域在通用软件系统方面的空白。
在数据集开源方面,芯片复制创新中心发布的行业首个标准化通用具身智能数据集和Benchmark RoboMIND首批开源数据10万条,覆盖工业、家庭、办公等多场景任务,具备高度的通用性和可扩展。