智元开源行业首个专属于世界模型的具身数据集,让机器人从“多样交互”中理解真实世界

智元开源行业首个专属于世界模型的具身数据集,让机器人从“多样交互”中理解真实世界 2026年6月3日智元正式开源AGIBOT WORLD 2026数据集第二期主题“多样交互Rich Interaction”。这是行业首个聚焦物理交互的开源具身数据集面向世界模型、神经仿真器、物理感知以及表征学习等具身智能研究系统记录机器人与真实物理世界之间复杂、高密度、非理想的交互过程旨在补齐当前世界模型训练中长期缺失的真实物理交互数据。本期数据集已在Hugging Face平台开放下载。继此前发布以“模仿学习”为主题的第一期数据集后AGIBOT WORLD 2026进一步将数据建设从专家示范和成功轨迹推进到真实环境中更复杂、更不确定、也更接近物理世界本质的交互学习阶段。长期以来具身智能数据集大多围绕标准任务、专家示范和成功案例展开。然而真实世界并不总是理想、稳定和可控的。机器人在现实环境中会频繁遇到抓取失败、物体滑落、意外碰撞、液体飞溅、布料变形等非标准情境。对于人类而言这些是日常生活中习以为常的经验但对于机器人而言它们恰恰是理解接触、摩擦、重心、形变和反馈等物理规律的关键入口。为了补齐当前世界模型训练中长期缺失的真实物理交互数据AGIBOT WORLD 2026第二期“多样交互”数据集应运而生。与传统具身数据集中只关注“成功示范案例”的采集逻辑不同智元此次开源的“多样交互”主题数据集主动保留并强调非理想行为的研究价值。该数据集基于100%真实场景采集系统记录了机器人与不同材质、形态和结构物体之间的丰富物理互动覆盖成功与失败、预期与意外、稳定与混沌等多种交互状态。通过开放这批数据智元希望为世界模型提供更接近真实世界运行规律的数据基础推动机器人从“学习如何完成任务”进一步走向“理解动作如何改变世界”。这些过去常被视为“失败”或“噪声”的数据正在成为世界模型研究中宝贵的资产。对于世界模型而言如果训练数据只包含标准动作和成功示范模型往往容易停留在对成功状态的拟合上。当面对少见动作、复杂接触和非理想情况时模型可能难以准确预测真实世界中的失败分布与物理演化。只有见过足够丰富的成功与失败过程模型才能更好地模拟真实未来场景减少不符合物理规律的生成结果。智元在实验中证实基于其世界模型仿真器Genie Envisioner-Sim 2.0多样交互数据与失败数据对于提升Action-Conditioned World Model的建模能力具有重要意义。相比仅基于成功示范训练的模型纳入更丰富动作分布、接触过程和非理想交互结果的数据有助于模型更准确地理解“动作如何改变世界”并提升未来状态预测的物理一致性。本期数据集的发布意味着具身智能数据建设正在进入新的阶段。过去机器人更多是在学习“如何成功执行动作”现在机器人需要进一步学习对世界的建模——“真实世界如何回应动作”。从成功到失败从动作到反馈从任务完成到世界理解AGIBOT WORLD 2026正试图为下一代世界模型、机器人学习和物理智能研究搭建更完整的数据底座。随着“多样交互”数据集开源智元希望推动全球研究者共同探索真实物理世界中的复杂交互规律加速世界模型、具身智能和物理智能的发展。项目主页agibot-world.com/开源地址huggingface.co/datasets/agibot-world/AgiBotWorld2026