Ropedia Xperience-10M 任务套件

面向 Xperience-10M 的多语言公开研究入口：样本数据、20 个具身智能任务、基线、Qwen3-Omni 与 Cosmos3 诊断结果，以及基础模型训练方向。

English · 中文 · Español · Français · Deutsch · 日本語 · 한국어 · Português

如何阅读这个项目

这个仓库把 Ropedia 公开的 Xperience-10M sample episode 变成一个可检查的具身智能任务实验室。请先看仪表盘和项目状态，再进入 20 个任务、结果矩阵和 Hugging Face 镜像。

更新时间： 2026-06-21。

范围： 完整可复现的任务套件来自一个公开样本 episode；128-episode 结果只发布 public-safe 的指标、报告、预测摘要和模型卡。原始 MP4/HDF5/RRD、完整 Qwen 权重和 gated 数据不在本仓库重新分发。

两条证据线

线	数据单元	方法与结果	用途
1 sample episode	5,821 帧；1,161 个 20-frame 对齐窗口；8,546 维特征。	Minimal + Neural MLP；20 个任务全覆盖；40/40 scored records；全部为 direct scores。	检查原始 sample 文件、任务定义、可复现基线和每个任务是否成立。
128 selected episodes	96/16/16 split；34,269 个导出窗口；public-safe 特征链接到官方 gated episode path。	Metadata simple/NN、raw-feature simple/NN、Qwen3-Omni、Cosmos3-Super、Cosmos3-Nano；140/140 scored records；134 direct + 6 compact proxy。	比较同一 split 上的基线和模型分支；proxy target 会显式标注。

公式：2 个单 episode 方法 x 20 个任务 = 40；7 个 128-episode 方法 x 20 个任务 = 140；公开矩阵总计 180/180 scored records。

方法块：Line 1 是 task-head baselines（Minimal、Neural MLP）。Line 2 分成 aligned baseline heads（metadata simple/NN、raw-feature simple/NN）、Qwen3-Omni series（Qwen3-Omni v6 LoRA）和 Cosmos3 series（Cosmos3-Super Reasoner、Cosmos3-Nano Future Window）。Qwen3 run v1-v6 是 Line 2 内部的 LoRA/评估演进线，不是项目的 evidence lines；20-task matrix 使用 v6，v5 是 pinned prior release。Cosmos3-Super Forward-Dynamics LoRA 是单独发布的 adapter 权重/结果，不计入 20-task matrix method row。

入口：双证据线说明、双证据线数据、180 条结果表、双线结果摘要。

快速入口

目标	入口
快速理解项目	项目简报, 项目状态
选择 GitHub / 网页 / HF 的正确入口	公共阅读地图
查看 20 个任务定义	20 任务指南, 任务契约数据
比较结果	研究结论, 180 条结果表
查看一个 sample 的全部文件关系	单 episode 浏览器, sample 文件地图
阅读三个基础模型方向	三条基础模型 pipeline, pipeline 契约数据
复现与审计	复现指南, 证据契约

核心结构

识别规则：有 metric 的是 20 个任务层；解释这些 evidence 研究什么的是 4 个 research directions；描述模型 input/output 和训练目标的是 3 条 foundation pipelines；把感知、3D 记忆、语言推理、action 和 planning 合并起来的是 unified embodied model target，不是新的评分轴。
数据层：公开 sample episode 被切成 20-frame 窗口，并连接视频、音频、深度、pose/SLAM、mocap、IMU、calibration 和语言标注。
任务层：20 个统一任务覆盖识别、预测、检索、重建、同步、长时预测、action-object 关系和 sensor bridge。
结果层：单 episode minimal/NN 覆盖 20/20；128-episode metadata/raw、Qwen3-Omni v6 LoRA、Cosmos3-Super Reasoner、Cosmos3-Nano Future Window 分开标注；当前公开矩阵为 180/180 scored records，其中 174 direct、6 compact proxy，proxy target 显式保留。
训练方向：spatial intelligence、human-video world model、vision-language-action 三条 pipeline 已经有任务映射和需要的证据清单；长期目标是一个 unified embodied foundation model。

公开边界

本项目只发布小型 derived artifacts、指标、图表、README、模型卡和 public-safe 预测摘要。原始 Xperience-10M 数据使用仍以 Ropedia 官方 Hugging Face 数据卡和访问条款为准。

Public Surfaces

Surface	Link
GitHub	https://github.com/ChaoYue0307/ropedia-xperience-10m-task-suite
Website	https://chaoyue0307.github.io/ropedia-xperience-10m-task-suite/
HF Space	https://huggingface.co/spaces/cy0307/ropedia-xperience-10m-task-suite
HF artifacts	https://huggingface.co/datasets/cy0307/ropedia-xperience-10m-task-suite-artifacts
HF baselines	https://huggingface.co/cy0307/ropedia-xperience-10m-task-baselines
HF weights/results	https://huggingface.co/cy0307/ropedia-xperience-10m-weights-results
HF collection	https://huggingface.co/collections/cy0307/ropedia-xperience-10m-task-suite

Glossary

Use GLOSSARY.md and docs/data/glossary.json for project terminology: evidence line, 20-frame window, compact-proxy score, Qwen v1-v6, Cosmos3-Super, LoRA adapter, HF artifact dataset, and related terms.

Citation

Use CITATION.cff and cite the upstream Ropedia Xperience-10M dataset according to its official card.