AD数据集:Waymo、nuPlan对比

AD数据集:Waymo、nuPlan对比 下面把Waymo Open Dataset和nuPlan做一个系统对比。先说结论:Waymo 更像“感知 + 预测 + 端到端驾驶”的综合数据集家族;nuPlan 更像“面向规划/planning 的大规模数据集 + 闭环仿真 benchmark”。两者不是完全同一类型,直接对比时要区分任务侧重点。1. 总体定位对比维度Waymo Open DatasetnuPlan核心定位自动驾驶开放数据集套件,覆盖感知、运动预测、端到端驾驶面向自动驾驶规划的真实世界数据集与 benchmark更强的方向3D 检测、跟踪、语义分割、运动预测、交互预测、Sim Agents、端到端驾驶轨迹规划、闭环/开环仿真、规划器评测、场景级评估数据组织分为 Perception、Motion、End-To-End Driving 三类数据以真实驾驶 log、地图、agent track、交通灯、场景标签和仿真框架组织典型用途训练感知模型、预测模型、交互预测模型、端到端驾驶模型训练/评测 planner,尤其是 ML-based planner 和 closed-loop plannerWaymo 官方代码库明确说明,Waymo Open Dataset 包含Perception dataset、Motion dataset、End-To-End Driving dataset三部分,其中 Motion dataset 包含 103,354 个带轨迹和 3D 地图的场景。(GitHub)nuPlan 论文则把 nuPlan 定义为真实世界自动驾驶规划数据集和 benchmark,目标是测试 planner 在复杂驾驶场景中的安全、高效决策能力。(ar5iv)2. 数据规模与采集城市维度WaymonuPlan总规模Motion 数据集超过 100,000 个场景;论文称超过 570 小时、覆盖 6 个美国城市1282 小时,覆盖 Las Vegas、Boston、Pittsburgh、Singapore 四个城市场景长度Motion 每个 segment 为 20 秒,10Hz;常用任务切成 9 秒窗口,1 秒历史 + 8 秒未来原始驾驶 log 更长,基于真实 log 挖掘 planning 场景地理特征美国城市/郊区为主,强调大规模、多样化、交互场景美国 + 亚洲城市;包含 Las Vegas PUDO、Boston double parking、Singapore 左行等差异化交通模式Waymo Motion 官方文档说明其由103,354 个 20 秒 segment构成,每个 segment 含 10Hz object tracks 和地图数据;训练/验证窗口通常是1 秒历史 + 8 秒未来。(Waymo)nuPlan 论文说明其包含1282 小时、来自 Boston、Pittsburgh、Las Vegas 和 Singapore 的真实驾驶数据,并特别列举了这些城市的差异化场景,例如 Boston 双排停车、Pittsburgh 左转优先规则、Las Vegas 酒店/赌场 PUDO、Singapore 左侧通行。(ar5iv)3. 传感器数据对比维度