Ropedia Xperience-10M Task Suite

Superfície pública multilíngue para Xperience-10M: dados de amostra, 20 tarefas embodied-AI, baselines, diagnósticos Qwen3-Omni e Cosmos3 e direções de treino.

English · 中文 · Español · Français · Deutsch · 日本語 · 한국어 · Português

Como Ler Este Projeto

Este repositório transforma o episódio público de amostra do Xperience-10M em um laboratório verificável de tarefas para embodied AI. Comece pelo painel visual e pelo status do projeto; depois abra os contratos de tarefas, matrizes de resultados e espelhos no Hugging Face.

Atualizado: 2026-06-21.

Escopo: a suíte totalmente reproduzível usa um episódio público; os resultados de 128 episódios publicam apenas métricas, relatórios, predições seguras e model cards. MP4/HDF5/RRD originais, pesos completos do Qwen e dados gated não são redistribuídos.

Duas Linhas de Evidência

Linha	Unidade de dados	Métodos e resultados	Uso
1 episódio de amostra	5,821 frames; 1,161 janelas alinhadas de 20 frames; 8,546 dimensões.	Minimal + Neural MLP em 20 tarefas; 40/40 registros com score; todos são direct scores.	Inspecionar arquivos da amostra, definições de tarefas, baselines reproduzíveis e validade das tarefas.
128 episódios selecionados	Split 96/16/16; 34,269 janelas exportadas; features public-safe ligadas aos caminhos oficiais gated.	Metadata simple/NN, raw-feature simple/NN, Qwen3-Omni, Cosmos3-Super e Cosmos3-Nano; 140/140 registros com score; 134 direct + 6 compact proxy.	Comparar baselines e ramos de modelo no mesmo split; proxy targets permanecem visíveis.

Fórmula: 2 métodos de um episódio x 20 tarefas = 40; 7 métodos de 128 episódios x 20 tarefas = 140; matriz pública total = 180/180 registros com score.

Blocos de métodos: a linha 1 contém task-head baselines (Minimal, Neural MLP). A linha 2 separa aligned baseline heads (metadata simple/NN, raw-feature simple/NN), a série Qwen3-Omni (Qwen3-Omni v6 LoRA) e a série Cosmos3 (Cosmos3-Super Reasoner, Cosmos3-Nano Future Window). Qwen3 v1-v6 é uma linhagem LoRA/eval interna à linha 2, não as evidence lines do projeto; a matriz de 20 tarefas usa v6 e v5 fica como pinned prior release. Cosmos3-Super Forward-Dynamics LoRA é publicado como adapter/pesos/resultados separado e não conta como linha de método na matriz de 20 tarefas.

Entradas: TWO_EVIDENCE_LINES.md, two_evidence_lines.json, task_method_20_result_matrix.json, two_evidence_line_result_summary.json.

Rota Rápida

Objetivo	Entrada
Entender o projeto	PROJECT_BRIEF.md, PROJECT_STATUS.md
Escolher a superfície pública correta	PUBLIC_READER_MAP.md
Ver as 20 tarefas	TASK_SUITE_20.md, task_suite_20.json
Comparar resultados	RESEARCH_TAKEAWAYS.md, task_method_20_result_matrix.json
Inspecionar uma amostra	single_episode_explorer.html, raw_sample_files.json
Ler as três pipelines foundation	THREE_FOUNDATION_PIPELINES.md, three_foundation_pipelines.json
Reproduzir ou auditar	REPRODUCIBILITY.md, EVIDENCE_CONTRACT.md

Estrutura

Dados: janelas de 20 frames ligam vídeo, áudio, profundidade, pose/SLAM, mocap, IMU, calibração e anotações de linguagem.
Tarefas: 20 contratos cobrem reconhecimento, previsão, retrieval, reconstrução, ordem, sincronização, horizonte longo, relação ação-objeto e pontes de sensores.
Resultados: minimal/NN de um episódio cobrem 20/20; a camada de 128 episódios separa metadata, raw features, Qwen3 e Cosmos; a matriz pública está em 180/180 registros com score: 174 direct e 6 compact proxy, com proxy targets visíveis.
Direções: spatial intelligence, human-video world model e vision-language-action têm mapeamento de tarefas e requisitos de evidência.

Fronteira Pública

O projeto publica apenas artifacts derivados, métricas, figuras, cards e resumos public-safe. O uso do Xperience-10M segue o dataset card oficial da Ropedia no Hugging Face.

Public Surfaces

Surface	Link
GitHub	https://github.com/ChaoYue0307/ropedia-xperience-10m-task-suite
Website	https://chaoyue0307.github.io/ropedia-xperience-10m-task-suite/
HF Space	https://huggingface.co/spaces/cy0307/ropedia-xperience-10m-task-suite
HF artifacts	https://huggingface.co/datasets/cy0307/ropedia-xperience-10m-task-suite-artifacts
HF baselines	https://huggingface.co/cy0307/ropedia-xperience-10m-task-baselines
HF weights/results	https://huggingface.co/cy0307/ropedia-xperience-10m-weights-results
HF collection	https://huggingface.co/collections/cy0307/ropedia-xperience-10m-task-suite

Glossary

Use GLOSSARY.md and docs/data/glossary.json for project terminology: evidence line, 20-frame window, compact-proxy score, Qwen v1-v6, Cosmos3-Super, LoRA adapter, HF artifact dataset, and related terms.

Citation

Use CITATION.cff and cite the upstream Ropedia Xperience-10M dataset according to its official card.