cy0307 commited on 10 days ago

Commit

f67c53b

verified ·

1 Parent(s): 39b6985

Add 128-episode raw-feature baseline results

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/input_report.json +89 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/logs/gpu0_tasks01_05.log +9 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/logs/gpu0_tasks01_05_rerun.log +9 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/logs/gpu1_tasks06_10.log +9 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/logs/gpu2_tasks11_15.log +9 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/logs/gpu3_task16_rerun_4096cap.log +5 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/logs/gpu3_tasks16_20.log +9 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/metrics_summary.csv +3 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/metrics_summary_all.csv +41 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/action_object_relation/metrics.json +62 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/action_object_relation/predictions.csv +0 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/camera_view_sync_retrieval/metrics.json +13 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/caption_grounding/metrics.json +52 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/contact_prediction/metrics.json +62 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/contact_prediction/predictions.csv +0 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/cross_modal_retrieval/metrics.json +52 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/hand_trajectory_forecast/metrics.json +52 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/imu_to_hand_pose/metrics.json +52 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/interaction_text_prediction/metrics.json +13 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/long_horizon_next_action/metrics.json +62 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/long_horizon_next_action/predictions.csv +0 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/misalignment_detection/metrics.json +62 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/misalignment_detection/predictions.csv +0 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/modality_reconstruction/metrics.json +52 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/next_action/metrics.json +62 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/next_action/predictions.csv +0 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/next_subtask_forecast/metrics.json +62 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/next_subtask_forecast/predictions.csv +0 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/object_relevance/metrics.json +51 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/object_set_forecast/metrics.json +51 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/temporal_order/metrics.json +62 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/temporal_order/predictions.csv +0 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/time_to_transition/metrics.json +52 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/timeline_action/metrics.json +62 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/timeline_action/predictions.csv +0 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/timeline_subtask/metrics.json +62 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/timeline_subtask/predictions.csv +0 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/transition_detection/metrics.json +62 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/transition_detection/predictions.csv +0 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/run_summary.json +43 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/run_summary_all.json +409 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/simple_raw128/action_object_relation/metrics.json +38 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/simple_raw128/action_object_relation/predictions.csv +0 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/simple_raw128/caption_grounding/metrics.json +25 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/simple_raw128/contact_prediction/metrics.json +38 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/simple_raw128/contact_prediction/predictions.csv +0 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/simple_raw128/cross_modal_retrieval/metrics.json +25 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/simple_raw128/hand_trajectory_forecast/metrics.json +25 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/simple_raw128/imu_to_hand_pose/metrics.json +25 -0
results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/simple_raw128/long_horizon_next_action/metrics.json +38 -0

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/input_report.json ADDED Viewed

	@@ -0,0 +1,89 @@

+{
+  "load_report": {
+    "resolved_npz_files": 357,
+    "loaded_feature_rows": 34269,
+    "input_rows": 34269,
+    "dropped_rows": 0,
+    "missing_path_examples": [],
+    "feature_dim": 4430
+  },
+  "split_counts": {
+    "train": 25629,
+    "val": 4608,
+    "test": 4032
+  },
+  "feature_manifest": [
+    {
+      "name": "hand_left_joints",
+      "start": 0,
+      "end": 441,
+      "dim": 441
+    },
+    {
+      "name": "hand_right_joints",
+      "start": 441,
+      "end": 882,
+      "dim": 441
+    },
+    {
+      "name": "body_joints",
+      "start": 882,
+      "end": 1974,
+      "dim": 1092
+    },
+    {
+      "name": "body_contacts",
+      "start": 1974,
+      "end": 2121,
+      "dim": 147
+    },
+    {
+      "name": "camera_translation",
+      "start": 2121,
+      "end": 2142,
+      "dim": 21
+    },
+    {
+      "name": "camera_rotation_matrix",
+      "start": 2142,
+      "end": 2205,
+      "dim": 63
+    },
+    {
+      "name": "imu_accel_gyro",
+      "start": 2205,
+      "end": 2247,
+      "dim": 42
+    },
+    {
+      "name": "depth_confidence",
+      "start": 2247,
+      "end": 3227,
+      "dim": 980
+    },
+    {
+      "name": "audio_fisheye_cam0_aac",
+      "start": 3227,
+      "end": 3395,
+      "dim": 168
+    },
+    {
+      "name": "caption_objects_interaction_text",
+      "start": 3395,
+      "end": 4291,
+      "dim": 896
+    },
+    {
+      "name": "slam_point_cloud",
+      "start": 4291,
+      "end": 4313,
+      "dim": 22
+    },
+    {
+      "name": "calibration",
+      "start": 4313,
+      "end": 4430,
+      "dim": 117
+    }
+  ]
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/logs/gpu0_tasks01_05.log ADDED Viewed

	@@ -0,0 +1,9 @@

+[raw20] loading rows from results/omni_finetune/xperience10m_qwen3_omni_128ep_multiscale_cap96_v5_full8gpu_lora_dataset/dataset.jsonl
+[raw20] loading feature matrix for 34269 rows
+[raw20] loaded 34269 x 4430 features from 357 NPZ files
+[raw20] running timeline_action
+[raw20] running timeline_subtask
+[raw20] running transition_detection
+[raw20] running next_action
+[raw20] running hand_trajectory_forecast
+[raw20] done; wrote 10 result records to results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/logs/gpu0_tasks01_05_rerun.log ADDED Viewed

	@@ -0,0 +1,9 @@

+[raw20] loading rows from results/omni_finetune/xperience10m_qwen3_omni_128ep_multiscale_cap96_v5_full8gpu_lora_dataset/dataset.jsonl
+[raw20] loading feature matrix for 34269 rows
+[raw20] loaded 34269 x 4430 features from 357 NPZ files
+[raw20] running timeline_action
+[raw20] running timeline_subtask
+[raw20] running transition_detection
+[raw20] running next_action
+[raw20] running hand_trajectory_forecast
+[raw20] done; wrote 10 result records to results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/logs/gpu1_tasks06_10.log ADDED Viewed

	@@ -0,0 +1,9 @@

+[raw20] loading rows from results/omni_finetune/xperience10m_qwen3_omni_128ep_multiscale_cap96_v5_full8gpu_lora_dataset/dataset.jsonl
+[raw20] loading feature matrix for 34269 rows
+[raw20] loaded 34269 x 4430 features from 357 NPZ files
+[raw20] running contact_prediction
+[raw20] running object_relevance
+[raw20] running caption_grounding
+[raw20] running cross_modal_retrieval
+[raw20] running modality_reconstruction
+[raw20] done; wrote 10 result records to results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/logs/gpu2_tasks11_15.log ADDED Viewed

	@@ -0,0 +1,9 @@

+[raw20] loading rows from results/omni_finetune/xperience10m_qwen3_omni_128ep_multiscale_cap96_v5_full8gpu_lora_dataset/dataset.jsonl
+[raw20] loading feature matrix for 34269 rows
+[raw20] loaded 34269 x 4430 features from 357 NPZ files
+[raw20] running temporal_order
+[raw20] running misalignment_detection
+[raw20] running long_horizon_next_action
+[raw20] running next_subtask_forecast
+[raw20] running interaction_text_prediction
+[raw20] done; wrote 10 result records to results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/logs/gpu3_task16_rerun_4096cap.log ADDED Viewed

	@@ -0,0 +1,5 @@

+[raw20] loading rows from results/omni_finetune/xperience10m_qwen3_omni_128ep_multiscale_cap96_v5_full8gpu_lora_dataset/dataset.jsonl
+[raw20] loading feature matrix for 34269 rows
+[raw20] loaded 34269 x 4430 features from 357 NPZ files
+[raw20] running action_object_relation
+[raw20] done; wrote 2 result records to results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/logs/gpu3_tasks16_20.log ADDED Viewed

	@@ -0,0 +1,9 @@

+[raw20] loading rows from results/omni_finetune/xperience10m_qwen3_omni_128ep_multiscale_cap96_v5_full8gpu_lora_dataset/dataset.jsonl
+[raw20] loading feature matrix for 34269 rows
+[raw20] loaded 34269 x 4430 features from 357 NPZ files
+[raw20] running action_object_relation
+[raw20] running object_set_forecast
+[raw20] running imu_to_hand_pose
+[raw20] running camera_view_sync_retrieval
+[raw20] running time_to_transition
+[raw20] done; wrote 10 result records to results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/metrics_summary.csv ADDED Viewed

	@@ -0,0 +1,3 @@

+task,task_display_name,model_family,status,primary_metric,primary_score,metric_direction,reason,error
+action_object_relation,Action Object Relation,simple_raw128_centroid,pass,macro_f1,0.0,higher,,
+action_object_relation,Action Object Relation,neural_mlp_raw128,pass,macro_f1,0.0,higher,,

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/metrics_summary_all.csv ADDED Viewed

	@@ -0,0 +1,41 @@

+task,model_family,status,primary_metric,primary_score,metric_direction,reason,error
+action_object_relation,neural_mlp_raw128,pass,macro_f1,0.0,higher,,
+action_object_relation,simple_raw128_centroid,pass,macro_f1,0.0,higher,,
+camera_view_sync_retrieval,neural_mlp_raw128,unsupported,mrr,,higher,"128-episode NPZ manifest has camera pose plus audio/depth/caption features, but no two explicit video-view feature blocks for camera-view synchronization",
+camera_view_sync_retrieval,simple_raw128_ridge,unsupported,mrr,,higher,"128-episode NPZ manifest has camera pose plus audio/depth/caption features, but no two explicit video-view feature blocks for camera-view synchronization",
+caption_grounding,neural_mlp_raw128,pass,mrr,0.0063402121886610985,higher,,
+caption_grounding,simple_raw128_ridge,pass,mrr,0.011150892823934555,higher,,
+contact_prediction,neural_mlp_raw128,pass,macro_f1,1.0,higher,,
+contact_prediction,simple_raw128_centroid,pass,macro_f1,0.886990707397193,higher,,
+cross_modal_retrieval,neural_mlp_raw128,pass,mrr,0.002535284962505102,higher,,
+cross_modal_retrieval,simple_raw128_ridge,pass,mrr,0.003459817497059703,higher,,
+hand_trajectory_forecast,neural_mlp_raw128,pass,mae,0.18475216627120972,lower,,
+hand_trajectory_forecast,simple_raw128_ridge,pass,mae,0.2729249894618988,lower,,
+imu_to_hand_pose,neural_mlp_raw128,pass,mae,0.252998411655426,lower,,
+imu_to_hand_pose,simple_raw128_ridge,pass,mae,0.22941437363624573,lower,,
+interaction_text_prediction,neural_mlp_raw128,unsupported,macro_f1,,higher,raw 128-episode annotation.hdf5 interaction text is not present in the JSONL export; only hashed caption_objects_interaction_text features are available,
+interaction_text_prediction,simple_raw128_centroid,unsupported,macro_f1,,higher,raw 128-episode annotation.hdf5 interaction text is not present in the JSONL export; only hashed caption_objects_interaction_text features are available,
+long_horizon_next_action,neural_mlp_raw128,pass,macro_f1,0.001063859887389299,higher,,
+long_horizon_next_action,simple_raw128_centroid,pass,macro_f1,0.0024280172369056294,higher,,
+misalignment_detection,neural_mlp_raw128,pass,macro_f1,0.8272709077974252,higher,,
+misalignment_detection,simple_raw128_centroid,pass,macro_f1,0.4958867673901769,higher,,
+modality_reconstruction,neural_mlp_raw128,pass,r2,-1.3974418160502369,higher,,
+modality_reconstruction,simple_raw128_ridge,pass,r2,-1.3450960391924882,higher,,
+next_action,neural_mlp_raw128,pass,macro_f1,0.0018477984371755407,higher,,
+next_action,simple_raw128_centroid,pass,macro_f1,0.003285273363482094,higher,,
+next_subtask_forecast,neural_mlp_raw128,pass,macro_f1,0.0,higher,,
+next_subtask_forecast,simple_raw128_centroid,pass,macro_f1,0.0,higher,,
+object_relevance,neural_mlp_raw128_multilabel,pass,micro_f1,0.1765890386972509,higher,,
+object_relevance,simple_raw128_ridge_multilabel,pass,micro_f1,0.0655376369662084,higher,,
+object_set_forecast,neural_mlp_raw128_multilabel,pass,micro_f1,0.17523098630012288,higher,,
+object_set_forecast,simple_raw128_ridge_multilabel,pass,micro_f1,0.06469493412657774,higher,,
+temporal_order,neural_mlp_raw128,pass,macro_f1,0.8030047098504103,higher,,
+temporal_order,simple_raw128_centroid,pass,macro_f1,0.49824413370686593,higher,,
+time_to_transition,neural_mlp_raw128,pass,mae,42.374061584472656,lower,,
+time_to_transition,simple_raw128_ridge,pass,mae,52.32759094238281,lower,,
+timeline_action,neural_mlp_raw128,pass,macro_f1,0.0014955083181204041,higher,,
+timeline_action,simple_raw128_centroid,pass,macro_f1,0.002915061325704321,higher,,
+timeline_subtask,neural_mlp_raw128,pass,macro_f1,7.35632183908046e-05,higher,,
+timeline_subtask,simple_raw128_centroid,pass,macro_f1,0.0,higher,,
+transition_detection,neural_mlp_raw128,pass,macro_f1,0.4902206914147213,higher,,
+transition_detection,simple_raw128_centroid,pass,macro_f1,0.4203613574238283,higher,,

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/action_object_relation/metrics.json ADDED Viewed

	@@ -0,0 +1,62 @@

+{
+  "task": "action_object_relation",
+  "task_display_name": "Action Object Relation",
+  "task_family": "classification",
+  "model_family": "neural_mlp_raw128",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "sensor features excluding hashed caption text",
+  "primary_metric": "macro_f1",
+  "metric_direction": "higher",
+  "status": "pass",
+  "device": "cuda",
+  "history": [
+    {
+      "epoch": 1,
+      "loss": 7.840090205664913,
+      "train_accuracy": 0.02232423101067169
+    },
+    {
+      "epoch": 5,
+      "loss": 1.9252043012845315,
+      "train_accuracy": 0.4901129943502825
+    },
+    {
+      "epoch": 10,
+      "loss": 0.8283010613446855,
+      "train_accuracy": 0.6963669177652229
+    },
+    {
+      "epoch": 15,
+      "loss": 0.5116730567724991,
+      "train_accuracy": 0.7887633396107973
+    },
+    {
+      "epoch": 20,
+      "loss": 0.37476183882840236,
+      "train_accuracy": 0.8343926553672316
+    },
+    {
+      "epoch": 25,
+      "loss": 0.2903947299819882,
+      "train_accuracy": 0.8655053358443189
+    }
+  ],
+  "num_train_windows": 25488,
+  "num_test_windows": 4014,
+  "num_classes": 4149,
+  "num_train_classes": 3058,
+  "input_dim": 3534,
+  "fit_input_dim": 2048,
+  "selected_column_count": 2048,
+  "splits": {
+    "test": {
+      "accuracy": 0.0,
+      "balanced_accuracy": 0.0,
+      "macro_f1": 0.0,
+      "weighted_f1": 0.0,
+      "num_eval_windows": 4014,
+      "num_classes": 4149
+    }
+  },
+  "primary_score": 0.0
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/action_object_relation/predictions.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/camera_view_sync_retrieval/metrics.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+  "task": "camera_view_sync_retrieval",
+  "task_display_name": "Camera View Sync Retrieval",
+  "task_family": "retrieval",
+  "model_family": "neural_mlp_raw128",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "not run",
+  "primary_metric": "mrr",
+  "metric_direction": "higher",
+  "status": "unsupported",
+  "reason": "128-episode NPZ manifest has camera pose plus audio/depth/caption features, but no two explicit video-view feature blocks for camera-view synchronization",
+  "primary_score": null
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/caption_grounding/metrics.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "task": "caption_grounding",
+  "task_display_name": "Language Grounding",
+  "task_family": "retrieval",
+  "model_family": "neural_mlp_raw128",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "non-caption sensor blocks projected to hashed caption/object/interaction block",
+  "primary_metric": "mrr",
+  "metric_direction": "higher",
+  "status": "pass",
+  "device": "cuda",
+  "history": [
+    {
+      "epoch": 1,
+      "loss": 0.9730807784066104
+    },
+    {
+      "epoch": 5,
+      "loss": 0.8797651895419402
+    },
+    {
+      "epoch": 10,
+      "loss": 0.8487889279395084
+    },
+    {
+      "epoch": 15,
+      "loss": 0.8318103914064764
+    },
+    {
+      "epoch": 20,
+      "loss": 0.821267495579444
+    },
+    {
+      "epoch": 25,
+      "loss": 0.8125992868655396
+    }
+  ],
+  "num_train_windows": 25629,
+  "num_test_windows": 4032,
+  "input_dim": 3534,
+  "fit_input_dim": 2048,
+  "target_dim": 896,
+  "splits": {
+    "test": {
+      "mrr": 0.0063402121886610985,
+      "top1": 0.002232142857142857,
+      "median_rank": 1392.0,
+      "num_queries": 4032
+    }
+  },
+  "primary_score": 0.0063402121886610985
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/contact_prediction/metrics.json ADDED Viewed

	@@ -0,0 +1,62 @@

+{
+  "task": "contact_prediction",
+  "task_display_name": "Contact State Prediction",
+  "task_family": "classification",
+  "model_family": "neural_mlp_raw128",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "sensor features excluding hashed caption text",
+  "primary_metric": "macro_f1",
+  "metric_direction": "higher",
+  "status": "pass",
+  "device": "cuda",
+  "history": [
+    {
+      "epoch": 1,
+      "loss": 0.02249114251404696,
+      "train_accuracy": 0.9850950095594834
+    },
+    {
+      "epoch": 5,
+      "loss": 3.892005114592888e-06,
+      "train_accuracy": 1.0
+    },
+    {
+      "epoch": 10,
+      "loss": 1.6485579969316457e-06,
+      "train_accuracy": 1.0
+    },
+    {
+      "epoch": 15,
+      "loss": 7.494956065371638e-07,
+      "train_accuracy": 1.0
+    },
+    {
+      "epoch": 20,
+      "loss": 3.961833819914944e-07,
+      "train_accuracy": 1.0
+    },
+    {
+      "epoch": 25,
+      "loss": 3.9328009280915035e-07,
+      "train_accuracy": 1.0
+    }
+  ],
+  "num_train_windows": 25629,
+  "num_test_windows": 4032,
+  "num_classes": 2,
+  "num_train_classes": 2,
+  "input_dim": 3534,
+  "fit_input_dim": 2048,
+  "selected_column_count": 2048,
+  "splits": {
+    "test": {
+      "accuracy": 1.0,
+      "balanced_accuracy": 1.0,
+      "macro_f1": 1.0,
+      "weighted_f1": 1.0,
+      "num_eval_windows": 4032,
+      "num_classes": 2
+    }
+  },
+  "primary_score": 1.0
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/contact_prediction/predictions.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/cross_modal_retrieval/metrics.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "task": "cross_modal_retrieval",
+  "task_display_name": "Cross-Modal Retrieval",
+  "task_family": "retrieval",
+  "model_family": "neural_mlp_raw128",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "all non-depth sensor blocks projected to depth-confidence block",
+  "primary_metric": "mrr",
+  "metric_direction": "higher",
+  "status": "pass",
+  "device": "cuda",
+  "history": [
+    {
+      "epoch": 1,
+      "loss": 0.7975420301166781
+    },
+    {
+      "epoch": 5,
+      "loss": 0.5641444217256827
+    },
+    {
+      "epoch": 10,
+      "loss": 0.5163868686951831
+    },
+    {
+      "epoch": 15,
+      "loss": 0.4953940257414378
+    },
+    {
+      "epoch": 20,
+      "loss": 0.4823577042322097
+    },
+    {
+      "epoch": 25,
+      "loss": 0.4730072832515932
+    }
+  ],
+  "num_train_windows": 25629,
+  "num_test_windows": 4032,
+  "input_dim": 3450,
+  "fit_input_dim": 2048,
+  "target_dim": 980,
+  "splits": {
+    "test": {
+      "mrr": 0.002535284962505102,
+      "top1": 0.0,
+      "median_rank": 1893.5,
+      "num_queries": 4032
+    }
+  },
+  "primary_score": 0.002535284962505102
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/hand_trajectory_forecast/metrics.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "task": "hand_trajectory_forecast",
+  "task_display_name": "Hand Trajectory Forecasting",
+  "task_family": "regression",
+  "model_family": "neural_mlp_raw128",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "current non-hand/non-caption features; target hand joint feature block +20 frames",
+  "primary_metric": "mae",
+  "metric_direction": "lower",
+  "status": "pass",
+  "device": "cuda",
+  "history": [
+    {
+      "epoch": 1,
+      "loss": 0.8031348615485111
+    },
+    {
+      "epoch": 5,
+      "loss": 0.5183512075500258
+    },
+    {
+      "epoch": 10,
+      "loss": 0.3657062302656374
+    },
+    {
+      "epoch": 15,
+      "loss": 0.28521906561420884
+    },
+    {
+      "epoch": 20,
+      "loss": 0.24974514583392887
+    },
+    {
+      "epoch": 25,
+      "loss": 0.22191785270443581
+    }
+  ],
+  "num_train_windows": 25502,
+  "num_test_windows": 4015,
+  "input_dim": 2652,
+  "fit_input_dim": 2048,
+  "target_dim": 882,
+  "splits": {
+    "test": {
+      "mae": 0.18475216627120972,
+      "rmse": 0.43915748596191406,
+      "r2": 0.11917128475110383,
+      "mean_l2": 9.090903282165527
+    }
+  },
+  "primary_score": 0.18475216627120972
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/imu_to_hand_pose/metrics.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "task": "imu_to_hand_pose",
+  "task_display_name": "Imu To Hand Pose",
+  "task_family": "regression",
+  "model_family": "neural_mlp_raw128",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "IMU acceleration/gyroscope block reconstructs hand-joint blocks",
+  "primary_metric": "mae",
+  "metric_direction": "lower",
+  "status": "pass",
+  "device": "cuda",
+  "history": [
+    {
+      "epoch": 1,
+      "loss": 0.9585941261004479
+    },
+    {
+      "epoch": 5,
+      "loss": 0.9127171490970956
+    },
+    {
+      "epoch": 10,
+      "loss": 0.8793233014191721
+    },
+    {
+      "epoch": 15,
+      "loss": 0.844667680290311
+    },
+    {
+      "epoch": 20,
+      "loss": 0.8032877514339916
+    },
+    {
+      "epoch": 25,
+      "loss": 0.7622054215548092
+    }
+  ],
+  "num_train_windows": 25629,
+  "num_test_windows": 4032,
+  "input_dim": 42,
+  "fit_input_dim": 42,
+  "target_dim": 882,
+  "splits": {
+    "test": {
+      "mae": 0.252998411655426,
+      "rmse": 0.5090259909629822,
+      "r2": -0.1798296121579115,
+      "mean_l2": 12.296762466430664
+    }
+  },
+  "primary_score": 0.252998411655426
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/interaction_text_prediction/metrics.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+  "task": "interaction_text_prediction",
+  "task_display_name": "Interaction Text Prediction",
+  "task_family": "classification",
+  "model_family": "neural_mlp_raw128",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "not run",
+  "primary_metric": "macro_f1",
+  "metric_direction": "higher",
+  "status": "unsupported",
+  "reason": "raw 128-episode annotation.hdf5 interaction text is not present in the JSONL export; only hashed caption_objects_interaction_text features are available",
+  "primary_score": null
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/long_horizon_next_action/metrics.json ADDED Viewed

	@@ -0,0 +1,62 @@

+{
+  "task": "long_horizon_next_action",
+  "task_display_name": "Long Horizon Next Action",
+  "task_family": "classification",
+  "model_family": "neural_mlp_raw128",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "current non-caption features; target action +100 frames",
+  "primary_metric": "macro_f1",
+  "metric_direction": "higher",
+  "status": "pass",
+  "device": "cuda",
+  "history": [
+    {
+      "epoch": 1,
+      "loss": 5.801561136460293,
+      "train_accuracy": 0.07798787298547949
+    },
+    {
+      "epoch": 5,
+      "loss": 1.1626708901668443,
+      "train_accuracy": 0.513602999840434
+    },
+    {
+      "epoch": 10,
+      "loss": 0.6149468233715847,
+      "train_accuracy": 0.6583692356789532
+    },
+    {
+      "epoch": 15,
+      "loss": 0.4115334245525937,
+      "train_accuracy": 0.7293362055209829
+    },
+    {
+      "epoch": 20,
+      "loss": 0.339562276861248,
+      "train_accuracy": 0.7671134514121589
+    },
+    {
+      "epoch": 25,
+      "loss": 0.25582631674416995,
+      "train_accuracy": 0.8034546034785384
+    }
+  ],
+  "num_train_windows": 25068,
+  "num_test_windows": 3951,
+  "num_classes": 1211,
+  "num_train_classes": 887,
+  "input_dim": 3534,
+  "fit_input_dim": 2048,
+  "selected_column_count": 2048,
+  "splits": {
+    "test": {
+      "accuracy": 0.0020248038471273096,
+      "balanced_accuracy": 0.0019148400100781054,
+      "macro_f1": 0.001063859887389299,
+      "weighted_f1": 0.0011975577833811789,
+      "num_eval_windows": 3951,
+      "num_classes": 1211
+    }
+  },
+  "primary_score": 0.001063859887389299
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/long_horizon_next_action/predictions.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/misalignment_detection/metrics.json ADDED Viewed

	@@ -0,0 +1,62 @@

+{
+  "task": "misalignment_detection",
+  "task_display_name": "Multimodal Synchronization Detection",
+  "task_family": "classification",
+  "model_family": "neural_mlp_raw128",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "motion/camera/IMU query paired with aligned or shifted depth/audio target",
+  "primary_metric": "macro_f1",
+  "metric_direction": "higher",
+  "status": "pass",
+  "device": "cuda",
+  "history": [
+    {
+      "epoch": 1,
+      "loss": 0.584179866367518,
+      "train_accuracy": 0.6658104908295541
+    },
+    {
+      "epoch": 5,
+      "loss": 0.37274408434943146,
+      "train_accuracy": 0.8252598627443111
+    },
+    {
+      "epoch": 10,
+      "loss": 0.2720396854143376,
+      "train_accuracy": 0.8785969418469318
+    },
+    {
+      "epoch": 15,
+      "loss": 0.21012097329801926,
+      "train_accuracy": 0.9071116105470161
+    },
+    {
+      "epoch": 20,
+      "loss": 0.1713544537477405,
+      "train_accuracy": 0.925793634867761
+    },
+    {
+      "epoch": 25,
+      "loss": 0.14908742030340427,
+      "train_accuracy": 0.9357466789741943
+    }
+  ],
+  "num_train_windows": 49834,
+  "num_test_windows": 7840,
+  "num_classes": 2,
+  "num_train_classes": 2,
+  "input_dim": 3395,
+  "fit_input_dim": 2048,
+  "selected_column_count": 2048,
+  "splits": {
+    "test": {
+      "accuracy": 0.8274234693877551,
+      "balanced_accuracy": 0.8274234693877551,
+      "macro_f1": 0.8272709077974252,
+      "weighted_f1": 0.8272709077974253,
+      "num_eval_windows": 7840,
+      "num_classes": 2
+    }
+  },
+  "primary_score": 0.8272709077974252
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/misalignment_detection/predictions.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/modality_reconstruction/metrics.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "task": "modality_reconstruction",
+  "task_display_name": "Cross-Modal Reconstruction",
+  "task_family": "regression",
+  "model_family": "neural_mlp_raw128",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "all non-depth sensor blocks reconstruct depth-confidence block",
+  "primary_metric": "r2",
+  "metric_direction": "higher",
+  "status": "pass",
+  "device": "cuda",
+  "history": [
+    {
+      "epoch": 1,
+      "loss": 0.795406650627551
+    },
+    {
+      "epoch": 5,
+      "loss": 0.5652745503729759
+    },
+    {
+      "epoch": 10,
+      "loss": 0.5144153572181445
+    },
+    {
+      "epoch": 15,
+      "loss": 0.4929477720702684
+    },
+    {
+      "epoch": 20,
+      "loss": 0.4814860376392508
+    },
+    {
+      "epoch": 25,
+      "loss": 0.4724465353307799
+    }
+  ],
+  "num_train_windows": 25629,
+  "num_test_windows": 4032,
+  "input_dim": 3450,
+  "fit_input_dim": 2048,
+  "target_dim": 980,
+  "splits": {
+    "test": {
+      "mae": 4963.66650390625,
+      "rmse": 381740.15625,
+      "r2": -1.3974418160502369,
+      "mean_l2": 3501567.0
+    }
+  },
+  "primary_score": -1.3974418160502369
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/next_action/metrics.json ADDED Viewed

	@@ -0,0 +1,62 @@

+{
+  "task": "next_action",
+  "task_display_name": "Next-Action Prediction",
+  "task_family": "classification",
+  "model_family": "neural_mlp_raw128",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "sensor features excluding hashed caption text",
+  "primary_metric": "macro_f1",
+  "metric_direction": "higher",
+  "status": "pass",
+  "device": "cuda",
+  "history": [
+    {
+      "epoch": 1,
+      "loss": 5.596322411365963,
+      "train_accuracy": 0.08123609973077374
+    },
+    {
+      "epoch": 5,
+      "loss": 1.0855037269383347,
+      "train_accuracy": 0.5211674275235085
+    },
+    {
+      "epoch": 10,
+      "loss": 0.5761551915229453,
+      "train_accuracy": 0.655780561083148
+    },
+    {
+      "epoch": 15,
+      "loss": 0.37495767347169556,
+      "train_accuracy": 0.7235943657575403
+    },
+    {
+      "epoch": 20,
+      "loss": 0.28612062079771855,
+      "train_accuracy": 0.758008505989309
+    },
+    {
+      "epoch": 25,
+      "loss": 0.2286090604913533,
+      "train_accuracy": 0.7849311327012369
+    }
+  ],
+  "num_train_windows": 25629,
+  "num_test_windows": 4032,
+  "num_classes": 1217,
+  "num_train_classes": 891,
+  "input_dim": 3534,
+  "fit_input_dim": 2048,
+  "selected_column_count": 2048,
+  "splits": {
+    "test": {
+      "accuracy": 0.004464285714285714,
+      "balanced_accuracy": 0.0034805255007437285,
+      "macro_f1": 0.0018477984371755407,
+      "weighted_f1": 0.003505490015635165,
+      "num_eval_windows": 4032,
+      "num_classes": 1217
+    }
+  },
+  "primary_score": 0.0018477984371755407
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/next_action/predictions.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/next_subtask_forecast/metrics.json ADDED Viewed

	@@ -0,0 +1,62 @@

+{
+  "task": "next_subtask_forecast",
+  "task_display_name": "Next Subtask Forecast",
+  "task_family": "classification",
+  "model_family": "neural_mlp_raw128",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "current non-caption features; target subtask +100 frames",
+  "primary_metric": "macro_f1",
+  "metric_direction": "higher",
+  "status": "pass",
+  "device": "cuda",
+  "history": [
+    {
+      "epoch": 1,
+      "loss": 4.954612842526032,
+      "train_accuracy": 0.13140258496888463
+    },
+    {
+      "epoch": 5,
+      "loss": 0.9000010563651207,
+      "train_accuracy": 0.6606430509015477
+    },
+    {
+      "epoch": 10,
+      "loss": 0.46146437387365996,
+      "train_accuracy": 0.7953566299664911
+    },
+    {
+      "epoch": 15,
+      "loss": 0.28807071359682185,
+      "train_accuracy": 0.8596218286261369
+    },
+    {
+      "epoch": 20,
+      "loss": 0.21170043317832615,
+      "train_accuracy": 0.8893011010052657
+    },
+    {
+      "epoch": 25,
+      "loss": 0.17162281766032153,
+      "train_accuracy": 0.9070927078346896
+    }
+  ],
+  "num_train_windows": 25068,
+  "num_test_windows": 3951,
+  "num_classes": 891,
+  "num_train_classes": 651,
+  "input_dim": 3534,
+  "fit_input_dim": 2048,
+  "selected_column_count": 2048,
+  "splits": {
+    "test": {
+      "accuracy": 0.0,
+      "balanced_accuracy": 0.0,
+      "macro_f1": 0.0,
+      "weighted_f1": 0.0,
+      "num_eval_windows": 3951,
+      "num_classes": 891
+    }
+  },
+  "primary_score": 0.0
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/next_subtask_forecast/predictions.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/object_relevance/metrics.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+  "task": "object_relevance",
+  "task_display_name": "Object Relevance Prediction",
+  "task_family": "multi_label",
+  "model_family": "neural_mlp_raw128_multilabel",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "sensor features excluding hashed caption text",
+  "primary_metric": "micro_f1",
+  "metric_direction": "higher",
+  "status": "pass",
+  "device": "cuda",
+  "history": [
+    {
+      "epoch": 1,
+      "loss": 0.3179367709060545
+    },
+    {
+      "epoch": 5,
+      "loss": 0.08152506840292292
+    },
+    {
+      "epoch": 10,
+      "loss": 0.05606942784121547
+    },
+    {
+      "epoch": 15,
+      "loss": 0.04551570554540027
+    },
+    {
+      "epoch": 20,
+      "loss": 0.03935748256850226
+    },
+    {
+      "epoch": 25,
+      "loss": 0.034496653577433256
+    }
+  ],
+  "num_train_windows": 25629,
+  "num_test_windows": 4032,
+  "num_labels": 256,
+  "input_dim": 3534,
+  "fit_input_dim": 2048,
+  "splits": {
+    "test": {
+      "micro_f1": 0.1765890386972509,
+      "macro_f1": 0.026473024044082846,
+      "exact_match": 0.010168650793650794
+    }
+  },
+  "primary_score": 0.1765890386972509
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/object_set_forecast/metrics.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+  "task": "object_set_forecast",
+  "task_display_name": "Object Set Forecast",
+  "task_family": "multi_label",
+  "model_family": "neural_mlp_raw128_multilabel",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "current non-caption features; target object set +100 frames",
+  "primary_metric": "micro_f1",
+  "metric_direction": "higher",
+  "status": "pass",
+  "device": "cuda",
+  "history": [
+    {
+      "epoch": 1,
+      "loss": 0.3173181395106896
+    },
+    {
+      "epoch": 5,
+      "loss": 0.08031858284117332
+    },
+    {
+      "epoch": 10,
+      "loss": 0.056561457963628554
+    },
+    {
+      "epoch": 15,
+      "loss": 0.04601203178259028
+    },
+    {
+      "epoch": 20,
+      "loss": 0.03955884521596166
+    },
+    {
+      "epoch": 25,
+      "loss": 0.03473486830971544
+    }
+  ],
+  "num_train_windows": 25068,
+  "num_test_windows": 3951,
+  "num_labels": 256,
+  "input_dim": 3534,
+  "fit_input_dim": 2048,
+  "splits": {
+    "test": {
+      "micro_f1": 0.17523098630012288,
+      "macro_f1": 0.021405026097435987,
+      "exact_match": 0.0030372057706909645
+    }
+  },
+  "primary_score": 0.17523098630012288
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/temporal_order/metrics.json ADDED Viewed

	@@ -0,0 +1,62 @@

+{
+  "task": "temporal_order",
+  "task_display_name": "Temporal Order Verification",
+  "task_family": "classification",
+  "model_family": "neural_mlp_raw128",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "concatenated adjacent sensor-window pairs",
+  "primary_metric": "macro_f1",
+  "metric_direction": "higher",
+  "status": "pass",
+  "device": "cuda",
+  "history": [
+    {
+      "epoch": 1,
+      "loss": 0.6823423368630226,
+      "train_accuracy": 0.534788566953798
+    },
+    {
+      "epoch": 5,
+      "loss": 0.47532859007268563,
+      "train_accuracy": 0.7526820673453406
+    },
+    {
+      "epoch": 10,
+      "loss": 0.3663804764708412,
+      "train_accuracy": 0.8226507439310885
+    },
+    {
+      "epoch": 15,
+      "loss": 0.30436070449387737,
+      "train_accuracy": 0.85561863743148
+    },
+    {
+      "epoch": 20,
+      "loss": 0.25795707907075516,
+      "train_accuracy": 0.8806382145653876
+    },
+    {
+      "epoch": 25,
+      "loss": 0.2276858064469268,
+      "train_accuracy": 0.8944988253719656
+    }
+  ],
+  "num_train_windows": 51080,
+  "num_test_windows": 8036,
+  "num_classes": 2,
+  "num_train_classes": 2,
+  "input_dim": 7068,
+  "fit_input_dim": 2048,
+  "selected_column_count": 2048,
+  "splits": {
+    "test": {
+      "accuracy": 0.8030114484818317,
+      "balanced_accuracy": 0.8030114484818318,
+      "macro_f1": 0.8030047098504103,
+      "weighted_f1": 0.8030047098504102,
+      "num_eval_windows": 8036,
+      "num_classes": 2
+    }
+  },
+  "primary_score": 0.8030047098504103
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/temporal_order/predictions.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/time_to_transition/metrics.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "task": "time_to_transition",
+  "task_display_name": "Time To Transition",
+  "task_family": "regression",
+  "model_family": "neural_mlp_raw128",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "non-caption sensor features regress frames to next action boundary capped at 200",
+  "primary_metric": "mae",
+  "metric_direction": "lower",
+  "status": "pass",
+  "device": "cuda",
+  "history": [
+    {
+      "epoch": 1,
+      "loss": 0.8273973769419527
+    },
+    {
+      "epoch": 5,
+      "loss": 0.4202246279718631
+    },
+    {
+      "epoch": 10,
+      "loss": 0.26081196071136065
+    },
+    {
+      "epoch": 15,
+      "loss": 0.1965682344275895
+    },
+    {
+      "epoch": 20,
+      "loss": 0.1588804939971577
+    },
+    {
+      "epoch": 25,
+      "loss": 0.13691731317311034
+    }
+  ],
+  "num_train_windows": 25629,
+  "num_test_windows": 4032,
+  "input_dim": 3534,
+  "fit_input_dim": 2048,
+  "target_dim": 1,
+  "splits": {
+    "test": {
+      "mae": 42.374061584472656,
+      "rmse": 55.66938400268555,
+      "r2": -0.23432442537520948,
+      "mean_l2": 42.374061584472656
+    }
+  },
+  "primary_score": 42.374061584472656
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/timeline_action/metrics.json ADDED Viewed

	@@ -0,0 +1,62 @@

+{
+  "task": "timeline_action",
+  "task_display_name": "Action Recognition",
+  "task_family": "classification",
+  "model_family": "neural_mlp_raw128",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "sensor features excluding hashed caption text",
+  "primary_metric": "macro_f1",
+  "metric_direction": "higher",
+  "status": "pass",
+  "device": "cuda",
+  "history": [
+    {
+      "epoch": 1,
+      "loss": 5.34494523035712,
+      "train_accuracy": 0.08946896094268211
+    },
+    {
+      "epoch": 5,
+      "loss": 0.9199241166383841,
+      "train_accuracy": 0.5943267392407039
+    },
+    {
+      "epoch": 10,
+      "loss": 0.44217930797357696,
+      "train_accuracy": 0.7336610870498264
+    },
+    {
+      "epoch": 15,
+      "loss": 0.28310169599762225,
+      "train_accuracy": 0.8029966054079363
+    },
+    {
+      "epoch": 20,
+      "loss": 0.19902630149213452,
+      "train_accuracy": 0.842209996488353
+    },
+    {
+      "epoch": 25,
+      "loss": 0.18476505181807562,
+      "train_accuracy": 0.855359163447657
+    }
+  ],
+  "num_train_windows": 25629,
+  "num_test_windows": 4032,
+  "num_classes": 1222,
+  "num_train_classes": 896,
+  "input_dim": 3534,
+  "fit_input_dim": 2048,
+  "selected_column_count": 2048,
+  "splits": {
+    "test": {
+      "accuracy": 0.001984126984126984,
+      "balanced_accuracy": 0.0015447515447515447,
+      "macro_f1": 0.0014955083181204041,
+      "weighted_f1": 0.0019879946780531578,
+      "num_eval_windows": 4032,
+      "num_classes": 1222
+    }
+  },
+  "primary_score": 0.0014955083181204041
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/timeline_action/predictions.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/timeline_subtask/metrics.json ADDED Viewed

	@@ -0,0 +1,62 @@

+{
+  "task": "timeline_subtask",
+  "task_display_name": "Procedure Step Recognition",
+  "task_family": "classification",
+  "model_family": "neural_mlp_raw128",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "sensor features excluding hashed caption text",
+  "primary_metric": "macro_f1",
+  "metric_direction": "higher",
+  "status": "pass",
+  "device": "cuda",
+  "history": [
+    {
+      "epoch": 1,
+      "loss": 4.781946432307218,
+      "train_accuracy": 0.14272893987280033
+    },
+    {
+      "epoch": 5,
+      "loss": 0.8307986326160719,
+      "train_accuracy": 0.6892972804245191
+    },
+    {
+      "epoch": 10,
+      "loss": 0.3857223062508468,
+      "train_accuracy": 0.8305435249131843
+    },
+    {
+      "epoch": 15,
+      "loss": 0.25177908692243084,
+      "train_accuracy": 0.8828280463537399
+    },
+    {
+      "epoch": 20,
+      "loss": 0.1772773926213155,
+      "train_accuracy": 0.9092044168715128
+    },
+    {
+      "epoch": 25,
+      "loss": 0.1421989650903465,
+      "train_accuracy": 0.9217683093370791
+    }
+  ],
+  "num_train_windows": 25629,
+  "num_test_windows": 4032,
+  "num_classes": 892,
+  "num_train_classes": 652,
+  "input_dim": 3534,
+  "fit_input_dim": 2048,
+  "selected_column_count": 2048,
+  "splits": {
+    "test": {
+      "accuracy": 0.000496031746031746,
+      "balanced_accuracy": 0.0013333333333333333,
+      "macro_f1": 7.35632183908046e-05,
+      "weighted_f1": 2.7367268746579092e-05,
+      "num_eval_windows": 4032,
+      "num_classes": 892
+    }
+  },
+  "primary_score": 7.35632183908046e-05
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/timeline_subtask/predictions.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/transition_detection/metrics.json ADDED Viewed

	@@ -0,0 +1,62 @@

+{
+  "task": "transition_detection",
+  "task_display_name": "Action Boundary Detection",
+  "task_family": "classification",
+  "model_family": "neural_mlp_raw128",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "sensor features excluding hashed caption text",
+  "primary_metric": "macro_f1",
+  "metric_direction": "higher",
+  "status": "pass",
+  "device": "cuda",
+  "history": [
+    {
+      "epoch": 1,
+      "loss": 0.5537091893220953,
+      "train_accuracy": 0.7428303874517148
+    },
+    {
+      "epoch": 5,
+      "loss": 0.19651318897678038,
+      "train_accuracy": 0.9144718873151508
+    },
+    {
+      "epoch": 10,
+      "loss": 0.09844583694868982,
+      "train_accuracy": 0.9596940965312731
+    },
+    {
+      "epoch": 15,
+      "loss": 0.10910748333434252,
+      "train_accuracy": 0.9566506691638378
+    },
+    {
+      "epoch": 20,
+      "loss": 0.07368280102906076,
+      "train_accuracy": 0.9692925982285692
+    },
+    {
+      "epoch": 25,
+      "loss": 0.030949957263201364,
+      "train_accuracy": 0.9879043271294237
+    }
+  ],
+  "num_train_windows": 25629,
+  "num_test_windows": 4032,
+  "num_classes": 2,
+  "num_train_classes": 2,
+  "input_dim": 3534,
+  "fit_input_dim": 2048,
+  "selected_column_count": 2048,
+  "splits": {
+    "test": {
+      "accuracy": 0.9446924603174603,
+      "balanced_accuracy": 0.49010925819436457,
+      "macro_f1": 0.4902206914147213,
+      "weighted_f1": 0.9627185273267364,
+      "num_eval_windows": 4032,
+      "num_classes": 2
+    }
+  },
+  "primary_score": 0.4902206914147213
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/neural_mlp_raw128/transition_detection/predictions.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/run_summary.json ADDED Viewed

	@@ -0,0 +1,43 @@

+{
+  "dataset_jsonl": "results/omni_finetune/xperience10m_qwen3_omni_128ep_multiscale_cap96_v5_full8gpu_lora_dataset/dataset.jsonl",
+  "feature_manifest_json": "results/omni_finetune/xperience10m_qwen3_omni_128ep_multiscale_cap96_v5_full8gpu_lora_dataset_dense_20f_stride10/dataset_manifest.json",
+  "tasks_requested": [
+    "action_object_relation"
+  ],
+  "load_report": {
+    "resolved_npz_files": 357,
+    "loaded_feature_rows": 34269,
+    "input_rows": 34269,
+    "dropped_rows": 0,
+    "missing_path_examples": [],
+    "feature_dim": 4430
+  },
+  "num_result_records": 2,
+  "status_counts": {
+    "pass": 2
+  },
+  "results": [
+    {
+      "task": "action_object_relation",
+      "task_display_name": "Action Object Relation",
+      "model_family": "simple_raw128_centroid",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.0,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "action_object_relation",
+      "task_display_name": "Action Object Relation",
+      "model_family": "neural_mlp_raw128",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.0,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    }
+  ]
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/run_summary_all.json ADDED Viewed

	@@ -0,0 +1,409 @@

+{
+  "num_records": 40,
+  "status_counts": {
+    "pass": 36,
+    "unsupported": 4
+  },
+  "records": [
+    {
+      "task": "action_object_relation",
+      "model_family": "neural_mlp_raw128",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.0,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "action_object_relation",
+      "model_family": "simple_raw128_centroid",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.0,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "camera_view_sync_retrieval",
+      "model_family": "neural_mlp_raw128",
+      "status": "unsupported",
+      "primary_metric": "mrr",
+      "primary_score": null,
+      "metric_direction": "higher",
+      "reason": "128-episode NPZ manifest has camera pose plus audio/depth/caption features, but no two explicit video-view feature blocks for camera-view synchronization",
+      "error": null
+    },
+    {
+      "task": "camera_view_sync_retrieval",
+      "model_family": "simple_raw128_ridge",
+      "status": "unsupported",
+      "primary_metric": "mrr",
+      "primary_score": null,
+      "metric_direction": "higher",
+      "reason": "128-episode NPZ manifest has camera pose plus audio/depth/caption features, but no two explicit video-view feature blocks for camera-view synchronization",
+      "error": null
+    },
+    {
+      "task": "caption_grounding",
+      "model_family": "neural_mlp_raw128",
+      "status": "pass",
+      "primary_metric": "mrr",
+      "primary_score": 0.0063402121886610985,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "caption_grounding",
+      "model_family": "simple_raw128_ridge",
+      "status": "pass",
+      "primary_metric": "mrr",
+      "primary_score": 0.011150892823934555,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "contact_prediction",
+      "model_family": "neural_mlp_raw128",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 1.0,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "contact_prediction",
+      "model_family": "simple_raw128_centroid",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.886990707397193,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "cross_modal_retrieval",
+      "model_family": "neural_mlp_raw128",
+      "status": "pass",
+      "primary_metric": "mrr",
+      "primary_score": 0.002535284962505102,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "cross_modal_retrieval",
+      "model_family": "simple_raw128_ridge",
+      "status": "pass",
+      "primary_metric": "mrr",
+      "primary_score": 0.003459817497059703,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "hand_trajectory_forecast",
+      "model_family": "neural_mlp_raw128",
+      "status": "pass",
+      "primary_metric": "mae",
+      "primary_score": 0.18475216627120972,
+      "metric_direction": "lower",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "hand_trajectory_forecast",
+      "model_family": "simple_raw128_ridge",
+      "status": "pass",
+      "primary_metric": "mae",
+      "primary_score": 0.2729249894618988,
+      "metric_direction": "lower",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "imu_to_hand_pose",
+      "model_family": "neural_mlp_raw128",
+      "status": "pass",
+      "primary_metric": "mae",
+      "primary_score": 0.252998411655426,
+      "metric_direction": "lower",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "imu_to_hand_pose",
+      "model_family": "simple_raw128_ridge",
+      "status": "pass",
+      "primary_metric": "mae",
+      "primary_score": 0.22941437363624573,
+      "metric_direction": "lower",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "interaction_text_prediction",
+      "model_family": "neural_mlp_raw128",
+      "status": "unsupported",
+      "primary_metric": "macro_f1",
+      "primary_score": null,
+      "metric_direction": "higher",
+      "reason": "raw 128-episode annotation.hdf5 interaction text is not present in the JSONL export; only hashed caption_objects_interaction_text features are available",
+      "error": null
+    },
+    {
+      "task": "interaction_text_prediction",
+      "model_family": "simple_raw128_centroid",
+      "status": "unsupported",
+      "primary_metric": "macro_f1",
+      "primary_score": null,
+      "metric_direction": "higher",
+      "reason": "raw 128-episode annotation.hdf5 interaction text is not present in the JSONL export; only hashed caption_objects_interaction_text features are available",
+      "error": null
+    },
+    {
+      "task": "long_horizon_next_action",
+      "model_family": "neural_mlp_raw128",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.001063859887389299,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "long_horizon_next_action",
+      "model_family": "simple_raw128_centroid",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.0024280172369056294,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "misalignment_detection",
+      "model_family": "neural_mlp_raw128",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.8272709077974252,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "misalignment_detection",
+      "model_family": "simple_raw128_centroid",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.4958867673901769,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "modality_reconstruction",
+      "model_family": "neural_mlp_raw128",
+      "status": "pass",
+      "primary_metric": "r2",
+      "primary_score": -1.3974418160502369,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "modality_reconstruction",
+      "model_family": "simple_raw128_ridge",
+      "status": "pass",
+      "primary_metric": "r2",
+      "primary_score": -1.3450960391924882,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "next_action",
+      "model_family": "neural_mlp_raw128",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.0018477984371755407,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "next_action",
+      "model_family": "simple_raw128_centroid",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.003285273363482094,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "next_subtask_forecast",
+      "model_family": "neural_mlp_raw128",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.0,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "next_subtask_forecast",
+      "model_family": "simple_raw128_centroid",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.0,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "object_relevance",
+      "model_family": "neural_mlp_raw128_multilabel",
+      "status": "pass",
+      "primary_metric": "micro_f1",
+      "primary_score": 0.1765890386972509,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "object_relevance",
+      "model_family": "simple_raw128_ridge_multilabel",
+      "status": "pass",
+      "primary_metric": "micro_f1",
+      "primary_score": 0.0655376369662084,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "object_set_forecast",
+      "model_family": "neural_mlp_raw128_multilabel",
+      "status": "pass",
+      "primary_metric": "micro_f1",
+      "primary_score": 0.17523098630012288,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "object_set_forecast",
+      "model_family": "simple_raw128_ridge_multilabel",
+      "status": "pass",
+      "primary_metric": "micro_f1",
+      "primary_score": 0.06469493412657774,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "temporal_order",
+      "model_family": "neural_mlp_raw128",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.8030047098504103,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "temporal_order",
+      "model_family": "simple_raw128_centroid",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.49824413370686593,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "time_to_transition",
+      "model_family": "neural_mlp_raw128",
+      "status": "pass",
+      "primary_metric": "mae",
+      "primary_score": 42.374061584472656,
+      "metric_direction": "lower",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "time_to_transition",
+      "model_family": "simple_raw128_ridge",
+      "status": "pass",
+      "primary_metric": "mae",
+      "primary_score": 52.32759094238281,
+      "metric_direction": "lower",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "timeline_action",
+      "model_family": "neural_mlp_raw128",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.0014955083181204041,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "timeline_action",
+      "model_family": "simple_raw128_centroid",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.002915061325704321,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "timeline_subtask",
+      "model_family": "neural_mlp_raw128",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 7.35632183908046e-05,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "timeline_subtask",
+      "model_family": "simple_raw128_centroid",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.0,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "transition_detection",
+      "model_family": "neural_mlp_raw128",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.4902206914147213,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    },
+    {
+      "task": "transition_detection",
+      "model_family": "simple_raw128_centroid",
+      "status": "pass",
+      "primary_metric": "macro_f1",
+      "primary_score": 0.4203613574238283,
+      "metric_direction": "higher",
+      "reason": null,
+      "error": null
+    }
+  ]
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/simple_raw128/action_object_relation/metrics.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "task": "action_object_relation",
+  "task_display_name": "Action Object Relation",
+  "task_family": "classification",
+  "model_family": "simple_raw128_centroid",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "sensor features excluding hashed caption text",
+  "primary_metric": "macro_f1",
+  "metric_direction": "higher",
+  "status": "pass",
+  "num_train_windows": 25488,
+  "num_val_windows": 4569,
+  "num_test_windows": 4014,
+  "num_classes": 4149,
+  "num_train_classes": 3058,
+  "input_dim": 3534,
+  "fit_input_dim": 2048,
+  "selected_column_count": 2048,
+  "splits": {
+    "val": {
+      "accuracy": 0.0,
+      "balanced_accuracy": 0.0,
+      "macro_f1": 0.0,
+      "weighted_f1": 0.0,
+      "num_eval_windows": 4569,
+      "num_classes": 4149
+    },
+    "test": {
+      "accuracy": 0.0,
+      "balanced_accuracy": 0.0,
+      "macro_f1": 0.0,
+      "weighted_f1": 0.0,
+      "num_eval_windows": 4014,
+      "num_classes": 4149
+    }
+  },
+  "primary_score": 0.0
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/simple_raw128/action_object_relation/predictions.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/simple_raw128/caption_grounding/metrics.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+  "task": "caption_grounding",
+  "task_display_name": "Language Grounding",
+  "task_family": "retrieval",
+  "model_family": "simple_raw128_ridge",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "non-caption sensor blocks projected to hashed caption/object/interaction block",
+  "primary_metric": "mrr",
+  "metric_direction": "higher",
+  "status": "pass",
+  "num_train_windows": 25629,
+  "num_test_windows": 4032,
+  "input_dim": 3534,
+  "fit_input_dim": 2048,
+  "target_dim": 896,
+  "splits": {
+    "test": {
+      "mrr": 0.011150892823934555,
+      "top1": 0.003720238095238095,
+      "median_rank": 786.0,
+      "num_queries": 4032
+    }
+  },
+  "primary_score": 0.011150892823934555
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/simple_raw128/contact_prediction/metrics.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "task": "contact_prediction",
+  "task_display_name": "Contact State Prediction",
+  "task_family": "classification",
+  "model_family": "simple_raw128_centroid",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "sensor features excluding hashed caption text",
+  "primary_metric": "macro_f1",
+  "metric_direction": "higher",
+  "status": "pass",
+  "num_train_windows": 25629,
+  "num_val_windows": 4608,
+  "num_test_windows": 4032,
+  "num_classes": 2,
+  "num_train_classes": 2,
+  "input_dim": 3534,
+  "fit_input_dim": 2048,
+  "selected_column_count": 2048,
+  "splits": {
+    "val": {
+      "accuracy": 0.8932291666666666,
+      "balanced_accuracy": 0.9390938351077,
+      "macro_f1": 0.8166515974696689,
+      "weighted_f1": 0.9058806656743642,
+      "num_eval_windows": 4608,
+      "num_classes": 2
+    },
+    "test": {
+      "accuracy": 0.9109623015873016,
+      "balanced_accuracy": 0.9425416133162612,
+      "macro_f1": 0.886990707397193,
+      "weighted_f1": 0.9155965516219,
+      "num_eval_windows": 4032,
+      "num_classes": 2
+    }
+  },
+  "primary_score": 0.886990707397193
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/simple_raw128/contact_prediction/predictions.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/simple_raw128/cross_modal_retrieval/metrics.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+  "task": "cross_modal_retrieval",
+  "task_display_name": "Cross-Modal Retrieval",
+  "task_family": "retrieval",
+  "model_family": "simple_raw128_ridge",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "all non-depth sensor blocks projected to depth-confidence block",
+  "primary_metric": "mrr",
+  "metric_direction": "higher",
+  "status": "pass",
+  "num_train_windows": 25629,
+  "num_test_windows": 4032,
+  "input_dim": 3450,
+  "fit_input_dim": 2048,
+  "target_dim": 980,
+  "splits": {
+    "test": {
+      "mrr": 0.003459817497059703,
+      "top1": 0.000744047619047619,
+      "median_rank": 1797.5,
+      "num_queries": 4032
+    }
+  },
+  "primary_score": 0.003459817497059703
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/simple_raw128/hand_trajectory_forecast/metrics.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+  "task": "hand_trajectory_forecast",
+  "task_display_name": "Hand Trajectory Forecasting",
+  "task_family": "regression",
+  "model_family": "simple_raw128_ridge",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "current non-hand/non-caption features; target hand joint feature block +20 frames",
+  "primary_metric": "mae",
+  "metric_direction": "lower",
+  "status": "pass",
+  "num_train_windows": 25502,
+  "num_test_windows": 4015,
+  "input_dim": 2652,
+  "fit_input_dim": 2048,
+  "target_dim": 882,
+  "splits": {
+    "test": {
+      "mae": 0.2729249894618988,
+      "rmse": 0.5156853199005127,
+      "r2": -0.21456409310612812,
+      "mean_l2": 13.391268730163574
+    }
+  },
+  "primary_score": 0.2729249894618988
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/simple_raw128/imu_to_hand_pose/metrics.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+  "task": "imu_to_hand_pose",
+  "task_display_name": "Imu To Hand Pose",
+  "task_family": "regression",
+  "model_family": "simple_raw128_ridge",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "IMU acceleration/gyroscope block reconstructs hand-joint blocks",
+  "primary_metric": "mae",
+  "metric_direction": "lower",
+  "status": "pass",
+  "num_train_windows": 25629,
+  "num_test_windows": 4032,
+  "input_dim": 42,
+  "fit_input_dim": 42,
+  "target_dim": 882,
+  "splits": {
+    "test": {
+      "mae": 0.22941437363624573,
+      "rmse": 0.4729202091693878,
+      "r2": -0.018392341461985984,
+      "mean_l2": 11.224305152893066
+    }
+  },
+  "primary_score": 0.22941437363624573
+}

results/omni_finetune/a100_128_raw20_task_baselines_20260616T073954Z/simple_raw128/long_horizon_next_action/metrics.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "task": "long_horizon_next_action",
+  "task_display_name": "Long Horizon Next Action",
+  "task_family": "classification",
+  "model_family": "simple_raw128_centroid",
+  "source": "128_episode_raw_sensor_features",
+  "input_features": "current non-caption features; target action +100 frames",
+  "primary_metric": "macro_f1",
+  "metric_direction": "higher",
+  "status": "pass",
+  "num_train_windows": 25068,
+  "num_val_windows": 4496,
+  "num_test_windows": 3951,
+  "num_classes": 1211,
+  "num_train_classes": 887,
+  "input_dim": 3534,
+  "fit_input_dim": 2048,
+  "selected_column_count": 2048,
+  "splits": {
+    "val": {
+      "accuracy": 0.002224199288256228,
+      "balanced_accuracy": 0.003450987577971705,
+      "macro_f1": 0.0038119991336365605,
+      "weighted_f1": 0.0024887619404382845,
+      "num_eval_windows": 4496,
+      "num_classes": 1211
+    },
+    "test": {
+      "accuracy": 0.0030372057706909645,
+      "balanced_accuracy": 0.003899407470836042,
+      "macro_f1": 0.0024280172369056294,
+      "weighted_f1": 0.0025638705344299727,
+      "num_eval_windows": 3951,
+      "num_classes": 1211
+    }
+  },
+  "primary_score": 0.0024280172369056294
+}