Training in progress, step 16578, checkpoint

Browse files

Files changed (5) hide show

last-checkpoint/model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +81 -4

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f53dbd7245e348dee415a2c3edb732728f914a9235424eb142a38b0fcdb4922b
 size 290403936

 version https://git-lfs.github.com/spec/v1
+oid sha256:6d6fe5823dfdfa0755102c0eb6bc2e20653f20acc9d8c12b2a794fe6e3aaf193
 size 290403936

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2c4ef6c5232b5ee02ac43851b59bab6c09b948ea11cd09d00c3480bccc004904
 size 574811514

 version https://git-lfs.github.com/spec/v1
+oid sha256:2054e9edbc564f8fc2b480dd761a14114f25a3409569e10e474e5ef6b53cf40c
 size 574811514

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:575455a76dde8fe52d7ea4902f127e1ac96a955301198cd8f9f854c6f6b225c8
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:7ca0c14548c719bd1dc6b14340ff0cda7af14cb7800c6ddca9bb7602ae76e724
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b1e137e6d7eb503a22b6951a72d7291375278d1d1c16a253949aea8f67d5e881
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:fde6e5d2db511c993b2eaa11f1389bc72ef762a7921595905540728ea4683973
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": 11.473509293967616,
   "best_model_checkpoint": "./Whisper_base_fine_tune_Quran/checkpoint-13600",
-  "epoch": 5.790664013026959,
   "eval_steps": 800,
-  "global_step": 16000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -2447,6 +2447,83 @@
       "eval_steps_per_second": 0.159,
       "eval_wer": 11.635815589133207,
       "step": 16000
     }
   ],
   "logging_steps": 50,
@@ -2461,12 +2538,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": false
       },
       "attributes": {}
     }
   },
-  "total_flos": 6.641663606784e+19,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": 11.473509293967616,
   "best_model_checkpoint": "./Whisper_base_fine_tune_Quran/checkpoint-13600",
+  "epoch": 5.999819070019902,
   "eval_steps": 800,
+  "global_step": 16578,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.159,
       "eval_wer": 11.635815589133207,
       "step": 16000
+    },
+    {
+      "epoch": 5.808757011036729,
+      "grad_norm": 444.3935852050781,
+      "learning_rate": 2.6586324318237375e-07,
+      "loss": 0.0008,
+      "step": 16050
+    },
+    {
+      "epoch": 5.826850009046499,
+      "grad_norm": 8292.3271484375,
+      "learning_rate": 2.179293688860995e-07,
+      "loss": 0.0008,
+      "step": 16100
+    },
+    {
+      "epoch": 5.844943007056269,
+      "grad_norm": 14908.7646484375,
+      "learning_rate": 1.7474715294875654e-07,
+      "loss": 0.0005,
+      "step": 16150
+    },
+    {
+      "epoch": 5.863036005066039,
+      "grad_norm": 7871.6640625,
+      "learning_rate": 1.363207170779035e-07,
+      "loss": 0.0005,
+      "step": 16200
+    },
+    {
+      "epoch": 5.881129003075809,
+      "grad_norm": 12875.3583984375,
+      "learning_rate": 1.026537290457541e-07,
+      "loss": 0.0006,
+      "step": 16250
+    },
+    {
+      "epoch": 5.89922200108558,
+      "grad_norm": 405.7221984863281,
+      "learning_rate": 7.374940233906836e-08,
+      "loss": 0.0006,
+      "step": 16300
+    },
+    {
+      "epoch": 5.91731499909535,
+      "grad_norm": 11683.8515625,
+      "learning_rate": 4.9610495852453476e-08,
+      "loss": 0.0008,
+      "step": 16350
+    },
+    {
+      "epoch": 5.93540799710512,
+      "grad_norm": 29532.91796875,
+      "learning_rate": 3.023931362498566e-08,
+      "loss": 0.0007,
+      "step": 16400
+    },
+    {
+      "epoch": 5.95350099511489,
+      "grad_norm": 11724.4853515625,
+      "learning_rate": 1.563770462034708e-08,
+      "loss": 0.0006,
+      "step": 16450
+    },
+    {
+      "epoch": 5.971593993124661,
+      "grad_norm": 15493.84765625,
+      "learning_rate": 5.80706255029484e-09,
+      "loss": 0.0007,
+      "step": 16500
+    },
+    {
+      "epoch": 5.989686991134431,
+      "grad_norm": 20287.396484375,
+      "learning_rate": 7.483257416562861e-10,
+      "loss": 0.0005,
+      "step": 16550
     }
   ],
   "logging_steps": 50,
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": true
       },
       "attributes": {}
     }
   },
+  "total_flos": 6.881593704579072e+19,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null