Training in progress, step 550000

Browse files

Files changed (14) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/rng_state_4.pth +1 -1
last-checkpoint/rng_state_5.pth +1 -1
last-checkpoint/rng_state_6.pth +1 -1
last-checkpoint/rng_state_7.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +311 -3
pytorch_model.bin +1 -1
runs/Nov16_15-57-21_t1v-n-7cb529b4-w-0/events.out.tfevents.1668614313.t1v-n-7cb529b4-w-0.98881.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7c697ac7154ca0894dbb0afd2da257ebb59f2411de70cf1c067437c65e32a47f
 size 2841350745

 version https://git-lfs.github.com/spec/v1
+oid sha256:10c1cc07ef015417fadf62732c34ef9e27cbb3cd66409b4e91a7c9b7ed63de45
 size 2841350745

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1cab8beb3d63cc3776f8bd49c6e31592dc9338d1fc84994b9b9c273599a56db2
 size 1420697771

 version https://git-lfs.github.com/spec/v1
+oid sha256:73d32e670c1a25deab1c7c4e62d918d91ced49b69c4bf7f2580c58cd7bb52ed3
 size 1420697771

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:88474b3a9d3a5ada1378eb9aab1e251f9102d0ca50a7e10d9a053de91e12c052
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:a1500d1fe2b65abcd5681b96da84daebed56ca0b2a7ec9f842129b4aced1c41e
 size 13611

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:88474b3a9d3a5ada1378eb9aab1e251f9102d0ca50a7e10d9a053de91e12c052
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:f512681b5759af541156fd5f082e96f6aa34fd2c86fde1147ba2a2e83124f874
 size 13611

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:88474b3a9d3a5ada1378eb9aab1e251f9102d0ca50a7e10d9a053de91e12c052
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:f8568a3c86e0e22a7c03d27e124df5c47e2f09dfc131671de0230cc4216fda8f
 size 13611

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:88474b3a9d3a5ada1378eb9aab1e251f9102d0ca50a7e10d9a053de91e12c052
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:a1500d1fe2b65abcd5681b96da84daebed56ca0b2a7ec9f842129b4aced1c41e
 size 13611

last-checkpoint/rng_state_4.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:88474b3a9d3a5ada1378eb9aab1e251f9102d0ca50a7e10d9a053de91e12c052
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:a1500d1fe2b65abcd5681b96da84daebed56ca0b2a7ec9f842129b4aced1c41e
 size 13611

last-checkpoint/rng_state_5.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:88474b3a9d3a5ada1378eb9aab1e251f9102d0ca50a7e10d9a053de91e12c052
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:f8568a3c86e0e22a7c03d27e124df5c47e2f09dfc131671de0230cc4216fda8f
 size 13611

last-checkpoint/rng_state_6.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:88474b3a9d3a5ada1378eb9aab1e251f9102d0ca50a7e10d9a053de91e12c052
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:f512681b5759af541156fd5f082e96f6aa34fd2c86fde1147ba2a2e83124f874
 size 13611

last-checkpoint/rng_state_7.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:88474b3a9d3a5ada1378eb9aab1e251f9102d0ca50a7e10d9a053de91e12c052
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:f512681b5759af541156fd5f082e96f6aa34fd2c86fde1147ba2a2e83124f874
 size 13611

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:343c6b635858637988d8e8755a05f1cbe7ddf578dd01d595da23e4248a214be2
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:2b390312ddc1614538c7fd82ca2c4639dfed127a83cb04c40dedde6f67b4e460
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.5,
-  "global_step": 500000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -3086,11 +3086,319 @@
       "eval_samples_per_second": 261.931,
       "eval_steps_per_second": 4.112,
       "step": 500000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
-  "total_flos": 1.4913359314944e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.015997,
+  "global_step": 550000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 261.931,
       "eval_steps_per_second": 4.112,
       "step": 500000
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 5.396416275909779e-05,
+      "loss": 0.905,
+      "step": 501000
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 5.379931489313016e-05,
+      "loss": 0.8947,
+      "step": 502000
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 5.363442547846356e-05,
+      "loss": 0.8928,
+      "step": 503000
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 5.3469496318302204e-05,
+      "loss": 0.8862,
+      "step": 504000
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 5.330452921628497e-05,
+      "loss": 0.8856,
+      "step": 505000
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 5.313952597646568e-05,
+      "loss": 0.8765,
+      "step": 506000
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 5.297448840329329e-05,
+      "loss": 0.895,
+      "step": 507000
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 5.280941830159227e-05,
+      "loss": 0.8952,
+      "step": 508000
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 5.264431747654284e-05,
+      "loss": 0.8737,
+      "step": 509000
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 5.247918773366112e-05,
+      "loss": 0.8797,
+      "step": 510000
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 5.231403087877955e-05,
+      "loss": 0.8925,
+      "step": 511000
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 5.214884871802703e-05,
+      "loss": 0.8906,
+      "step": 512000
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 5.198364305780922e-05,
+      "loss": 0.8923,
+      "step": 513000
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 5.1818415704788725e-05,
+      "loss": 0.8959,
+      "step": 514000
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 5.165316846586541e-05,
+      "loss": 0.8917,
+      "step": 515000
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 5.148790314815663e-05,
+      "loss": 0.8944,
+      "step": 516000
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 5.132262155897739e-05,
+      "loss": 0.896,
+      "step": 517000
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 5.1157325505820694e-05,
+      "loss": 0.8967,
+      "step": 518000
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 5.0992016796337686e-05,
+      "loss": 0.8809,
+      "step": 519000
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 5.0826697238317935e-05,
+      "loss": 0.875,
+      "step": 520000
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 5.066136863966963e-05,
+      "loss": 0.8861,
+      "step": 521000
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 5.0496032808399815e-05,
+      "loss": 0.8731,
+      "step": 522000
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 5.033069155259471e-05,
+      "loss": 0.8644,
+      "step": 523000
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 5.016534668039976e-05,
+      "loss": 0.8874,
+      "step": 524000
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 5e-05,
+      "loss": 0.8767,
+      "step": 525000
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.9834653319600246e-05,
+      "loss": 0.8784,
+      "step": 526000
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.96693084474053e-05,
+      "loss": 0.8803,
+      "step": 527000
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.950396719160018e-05,
+      "loss": 0.8743,
+      "step": 528000
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.93386313603304e-05,
+      "loss": 0.8752,
+      "step": 529000
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.917330276168208e-05,
+      "loss": 0.8542,
+      "step": 530000
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.9007983203662326e-05,
+      "loss": 0.8749,
+      "step": 531000
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.884267449417931e-05,
+      "loss": 0.8713,
+      "step": 532000
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.867737844102261e-05,
+      "loss": 0.8678,
+      "step": 533000
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.851209685184338e-05,
+      "loss": 0.8818,
+      "step": 534000
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 4.834683153413459e-05,
+      "loss": 0.8782,
+      "step": 535000
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 4.818158429521129e-05,
+      "loss": 0.8431,
+      "step": 536000
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 4.801635694219079e-05,
+      "loss": 0.8605,
+      "step": 537000
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 4.785115128197298e-05,
+      "loss": 0.8734,
+      "step": 538000
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 4.7685969121220456e-05,
+      "loss": 0.8778,
+      "step": 539000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 4.7520812266338885e-05,
+      "loss": 0.8858,
+      "step": 540000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 4.735568252345718e-05,
+      "loss": 0.8837,
+      "step": 541000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 4.7190581698407725e-05,
+      "loss": 0.8863,
+      "step": 542000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 4.702551159670672e-05,
+      "loss": 0.89,
+      "step": 543000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 4.6860474023534335e-05,
+      "loss": 0.8921,
+      "step": 544000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 4.669547078371504e-05,
+      "loss": 0.8971,
+      "step": 545000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 4.65305036816978e-05,
+      "loss": 0.8975,
+      "step": 546000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 4.6365574521536445e-05,
+      "loss": 0.8909,
+      "step": 547000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 4.620068510686985e-05,
+      "loss": 0.9122,
+      "step": 548000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 4.60358372409022e-05,
+      "loss": 0.9077,
+      "step": 549000
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 4.5871032726383386e-05,
+      "loss": 0.8997,
+      "step": 550000
+    },
+    {
+      "epoch": 1.02,
+      "eval_loss": 0.6843340396881104,
+      "eval_runtime": 38.2086,
+      "eval_samples_per_second": 261.721,
+      "eval_steps_per_second": 4.109,
+      "step": 550000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
+  "total_flos": 1.6404717616477372e+19,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1cab8beb3d63cc3776f8bd49c6e31592dc9338d1fc84994b9b9c273599a56db2
 size 1420697771

 version https://git-lfs.github.com/spec/v1
+oid sha256:73d32e670c1a25deab1c7c4e62d918d91ced49b69c4bf7f2580c58cd7bb52ed3
 size 1420697771

runs/Nov16_15-57-21_t1v-n-7cb529b4-w-0/events.out.tfevents.1668614313.t1v-n-7cb529b4-w-0.98881.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dbba691a28fa1338ed7aa1729c492a4a4fca8250c123ab66dd7da55b0ef5db76
-size 69942

 version https://git-lfs.github.com/spec/v1
+oid sha256:2ecd2224cb16bcd63e7e63290c4482ec06797281c14cfc3a7f61f066187470ca
+size 78218