Training in progress, epoch 1

Files changed (4) hide show

README.md CHANGED Viewed

@@ -4,8 +4,8 @@ library_name: transformers
 model_name: medgemma-1.5-4b-it-sft-lora-crc100k
 tags:
 - generated_from_trainer
-- trl
 - sft
 licence: license
 ---
@@ -37,7 +37,7 @@ This model was trained with SFT.
 - TRL: 0.29.0
 - Transformers: 5.2.0
-- Pytorch: 2.10.0
 - Datasets: 4.6.1
 - Tokenizers: 0.22.2

 model_name: medgemma-1.5-4b-it-sft-lora-crc100k
 tags:
 - generated_from_trainer
 - sft
+- trl
 licence: license
 ---
 - TRL: 0.29.0
 - Transformers: 5.2.0
+- Pytorch: 2.11.0+cu126
 - Datasets: 4.6.1
 - Tokenizers: 0.22.2

adapter_config.json CHANGED Viewed

@@ -22,6 +22,7 @@
   "megatron_config": null,
   "megatron_core": "megatron.core",
   "modules_to_save": [
     "lm_head",
     "embed_tokens"
   ],
@@ -32,16 +33,16 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "up_proj",
-    "o_proj",
-    "out_proj",
     "gate_proj",
-    "k_proj",
-    "v_proj",
-    "fc2",
     "fc1",
     "q_proj",
-    "down_proj"
   ],
   "target_parameters": null,
   "task_type": "CAUSAL_LM",

   "megatron_config": null,
   "megatron_core": "megatron.core",
   "modules_to_save": [
+    "multi_modal_projector",
     "lm_head",
     "embed_tokens"
   ],
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "gate_proj",
+    "down_proj",
     "fc1",
+    "v_proj",
     "q_proj",
+    "fc2",
+    "o_proj",
+    "out_proj",
+    "k_proj",
+    "up_proj"
   ],
   "target_parameters": null,
   "task_type": "CAUSAL_LM",

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:899c50d42482169c11f276cb29aec1370a7482fa82e0261eef15f0f358d6365e
-size 2762134176

 version https://git-lfs.github.com/spec/v1
+oid sha256:4b07c2b8b8bb9aba69c37ac6c0dd787dc58b8188e45dbfad8caaa7b098b977c5
+size 2768035008

runs/Apr30_11-32-09_scs10/events.out.tfevents.1777548729.scs10.3193433.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:3b0678acaf159dffdb6c63e294b7b205ee2cb72695ed391c508b490db3c02f74
+size 15417