cy0307's picture
Add files using upload-large-folder tool
bd4e048 verified
|
Raw
History Blame
7.35 kB

Ropedia Xperience-10M Task Suite cover

Ropedia Xperience-10M Task Suite

Ropedia Xperience-10M logo

Xperience-10M을 위한 다국어 공개 연구 표면: 샘플 데이터, 20개 embodied-AI 과제, 베이스라인, Qwen3-Omni 및 Cosmos3 진단, foundation 모델 학습 방향.

English · 中文 · Español · Français · Deutsch · 日本語 · 한국어 · Português

GitHub Pages HF Space artifact dataset baseline model repo Xperience-10M license

이 프로젝트를 읽는 방법

이 저장소는 공개 Xperience-10M sample episode를 검증 가능한 embodied AI 과제 실험 표면으로 정리합니다. 먼저 대시보드와 프로젝트 상태를 보고, 이후 20개 과제, 결과 행렬, Hugging Face 미러를 확인하세요.

업데이트: 2026-06-21.

범위: 완전히 재현 가능한 task suite는 공개 sample episode 하나를 사용합니다. 128-episode 결과는 public-safe 지표, 리포트, 예측 요약, 모델 카드만 공개합니다. 원본 MP4/HDF5/RRD, 전체 Qwen 가중치, gated 데이터는 재배포하지 않습니다.

두 증거 라인

라인 데이터 단위 방법과 결과 용도
1 sample episode 5,821 frames, 1,161 aligned 20-frame windows, 8,546 dimensions. Minimal + Neural MLP가 20 tasks 전체를 평가; 40/40 scored records; 모두 direct scores. Raw sample files, task definitions, reproducible baselines, task validity 확인.
128 selected episodes 96/16/16 split, 34,269 exported windows, public-safe features가 official gated episode paths에 연결됨. Metadata simple/NN, raw-feature simple/NN, Qwen3-Omni v6, Cosmos3-Super, Cosmos3-Nano; 140/140 scored records; 134 direct + 6 compact proxy. 같은 split에서 metadata/raw baselines, Qwen3-Omni diagnostics, Cosmos3 diagnostics 비교; proxy targets는 명시 유지.

공식: single-episode 방법 2개 x 20 tasks = 40; 128-episode 방법 7개 x 20 tasks = 140; 전체 공개 matrix = 180/180 scored records.

방법 블록: Line 1은 task-head baselines(Minimal, Neural MLP)입니다. Line 2는 aligned baseline heads(metadata simple/NN, raw-feature simple/NN), Qwen3-Omni series(Qwen3-Omni v6 LoRA), Cosmos3 series(Cosmos3-Super Reasoner, Cosmos3-Nano Future Window)로 분리됩니다. Qwen3 v1-v6은 Line 2 내부의 LoRA/eval lineage이며 project evidence lines와 다릅니다. 20-task matrix는 v6을 사용하고 v5는 pinned prior release입니다. Cosmos3-Super Forward-Dynamics LoRA는 별도의 adapter/weights/results artifact로 공개되며 20-task matrix method row에는 포함되지 않습니다.

입구: TWO_EVIDENCE_LINES.md, two_evidence_lines.json, task_method_20_result_matrix.json, two_evidence_line_result_summary.json.

빠른 경로

목표 시작점
프로젝트 빠르게 이해 PROJECT_BRIEF.md, PROJECT_STATUS.md
공개 표면 선택 PUBLIC_READER_MAP.md
20개 과제 확인 TASK_SUITE_20.md, task_suite_20.json
결과 비교 RESEARCH_TAKEAWAYS.md, task_method_20_result_matrix.json
샘플 하나 검사 single_episode_explorer.html, raw_sample_files.json
세 foundation pipeline 읽기 THREE_FOUNDATION_PIPELINES.md, three_foundation_pipelines.json
재현 및 감사 REPRODUCIBILITY.md, EVIDENCE_CONTRACT.md

구조

  • 데이터: 20-frame window가 video, audio, depth, pose/SLAM, mocap, IMU, calibration, language annotation을 연결합니다.
  • 과제: 인식, 예측, retrieval, reconstruction, order, sync, long-horizon, action-object binding, sensor bridge 등 20개 계약.
  • 결과: single-episode minimal/NN은 20/20; 128-episode 레이어는 metadata, raw feature, Qwen3, Cosmos를 증거 유형별로 분리합니다. 공개 matrix는 180/180 scored records이며 174 direct와 6 compact proxy를 분리하고 proxy targets를 명시합니다.
  • 방향: spatial intelligence, human-video world model, vision-language-action에 대해 과제 매핑과 필요한 증거를 기록합니다.

공개 경계

이 프로젝트는 파생 artifacts, 지표, 그림, 카드, public-safe 요약만 공개합니다. Xperience-10M 사용은 Ropedia 공식 Hugging Face 데이터 카드와 접근 조건을 따릅니다.

Public Surfaces

Glossary

Use GLOSSARY.md and docs/data/glossary.json for project terminology: evidence line, 20-frame window, compact-proxy score, Qwen v1-v6, Cosmos3-Super, LoRA adapter, HF artifact dataset, and related terms.

Citation

Use CITATION.cff and cite the upstream Ropedia Xperience-10M dataset according to its official card.