Ropedia Xperience-10M 任务套件
面向 Xperience-10M 的多语言公开研究入口:样本数据、20 个具身智能任务、基线、Qwen3/Cosmos 诊断结果,以及基础模型训练方向。
English · 中文 · Español · Français · Deutsch · 日本語 · 한국어 · Português
如何阅读这个项目
这个仓库把 Ropedia 公开的 Xperience-10M sample episode 变成一个可检查的具身智能任务实验室。请先看仪表盘和项目状态,再进入 20 个任务、结果矩阵和 Hugging Face 镜像。
更新时间: 2026-06-18。
范围: 完整可复现的任务套件来自一个公开样本 episode;128-episode 结果只发布 public-safe 的指标、报告、预测摘要和模型卡。原始 MP4/HDF5/RRD、完整 Qwen 权重和 gated 数据不在本仓库重新分发。
快速入口
| 目标 | 入口 |
|---|---|
| 快速理解项目 | PROJECT_BRIEF.md, PROJECT_STATUS.md |
| 选择 GitHub / 网页 / HF 的正确入口 | PUBLIC_READER_MAP.md |
| 查看 20 个任务定义 | TASK_SUITE_20.md, task_suite_20.json |
| 比较结果 | RESEARCH_TAKEAWAYS.md, task_method_20_result_matrix.json |
| 查看一个 sample 的全部文件关系 | single_episode_explorer.html, raw_sample_files.json |
| 阅读三个基础模型方向 | THREE_FOUNDATION_PIPELINES.md, three_foundation_pipelines.json |
| 复现与审计 | REPRODUCIBILITY.md, EVIDENCE_CONTRACT.md |
核心结构
- 数据层:公开 sample episode 被切成 20-frame 窗口,并连接视频、音频、深度、pose/SLAM、mocap、IMU、calibration 和语言标注。
- 任务层:20 个统一任务覆盖识别、预测、检索、重建、同步、长时预测、action-object 关系和 sensor bridge。
- 结果层:单 episode minimal/NN 覆盖 20/20;128-episode metadata/raw/Qwen3/Cosmos 分开标注,不能评估的格子保留为显式 gap。
- 训练方向:spatial intelligence、human-video world model、vision-language-action 三条 pipeline 已经有任务映射和需要的证据清单。
公开边界
本项目只发布小型 derived artifacts、指标、图表、README、模型卡和 public-safe 预测摘要。原始 Xperience-10M 数据使用仍以 Ropedia 官方 Hugging Face 数据卡和访问条款为准。
Public Surfaces
Citation
Use CITATION.cff and cite the upstream Ropedia Xperience-10M dataset according to its official card.