中文搜索引擎指南网
标题:
物理AI开放数据集(NVIDIA)- 英伟达推出的开放数据集
[打印本页]
作者:
sowang
时间:
4 天前
标题:
物理AI开放数据集(NVIDIA)- 英伟达推出的开放数据集
物理AI开放数据集(Physical AI Open Dataset)是由英伟达(NVIDIA)推出的一系列大规模开源数据集,旨在为构建下一代物理AI提供高质量、商业级的开源数据基础,加速自动驾驶汽车及机器人技术的研发。
官网地址与资源获取
官方下载与托管平台:Hugging Face(数据集及模型权重均在此开放)
代码与开发工具库:GitHub(提供 physical_ai_av 等 Python 开发工具包及文档)
核心特色
超大规模与多传感器融合:该系列数据集规模庞大,其中面向自动驾驶的开放数据集包含超过1700小时的驾驶数据,覆盖25个国家、超2500座城市,包含多摄像头视频、激光雷达及毫米波雷达数据。
聚焦长尾与极端场景:数据广泛覆盖多样化的地理区域、天气条件及交通状况,特别收录了推动推理架构发展所必需的罕见且复杂的真实世界极端场景。
支持因果链推理(CoT):数据集不仅提供传感器数据,还带有因果链推理标签,使AI模型能够逐步推演驾驶决策背后的逻辑,提升系统的可解释性。
多场景与合成数据扩展:除自动驾驶外,NVIDIA还发布了面向多摄像头智能空间应用的 Physical AI Smart Spaces 数据集(达3.31TB),涵盖仓库、医院等场景的2D/3D检测与追踪数据,且大量采用基于Omniverse平台生成的合成数据。
如何使用
1. 账号注册与权限申请
由于数据集属于受限(Gated)资源,使用前需完成认证:
访问 Hugging Face 上的 PhysicalAI-Autonomous-Vehicles 数据集页面,点击 "Request Access" 申请访问权限(通常几分钟内即可获批)。
在 Hugging Face 设置中创建一个 "Read" 权限的 Token,并在本地终端运行 huggingface-cli login 完成身份验证。
2. 环境准备与代码拉取
前往 GitHub 克隆 physical_ai_av 代码仓库,该仓库提供了用于加载数据集的 Python 工具包。
根据官方文档配置 Python 虚拟环境并安装必要的依赖库。
3. 数据加载与模型推理
使用提供的 Python API 或 Jupyter Notebook 示例,即可在代码中按需加载特定片段(如包含施工区域的视频片段)。
结合 NVIDIA Alpamayo 等开源 VLA(视觉-语言-动作)推理模型,可将加载的视频数据输入模型,生成带有推理逻辑的行驶轨迹预测。
4. 国内加速下载(可选)
若直接访问 Hugging Face 速度较慢,可选择从 ModelScope(魔搭社区)克隆对应的数据集镜像仓库至本地,并在代码中配置本地路径进行加载。
适用场景
自动驾驶与辅助驾驶研发:用于训练和评估基于物理AI的端到端驾驶系统,特别是解决长尾场景下的安全决策问题。
具身智能与机器人训练:利用包含机器人训练轨迹、仿真资产及人类运动动画(如BONES-SEED库)的数据,训练人形机器人及机械臂。
智能空间与多摄像头追踪:赋能工业仓储AGV路径规划、医院服务机器人导航以及智慧零售场景中的多目标追踪与行为分析。
欢迎光临 中文搜索引擎指南网 (http://www.sowang.com/bbs/)
Powered by Discuz! X3.2