Training in progress, step 18600, checkpoint

Browse files

Files changed (5) hide show

last-checkpoint/model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +42 -4

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:03a1ed5c90eda41e8ca9b7169559116cb5239e526627278e8b83429bda1bc450
 size 290403936

 version https://git-lfs.github.com/spec/v1
+oid sha256:836232e2ae3615bdffe832e9aae3bfe8a6a5e3f2341f18775b95bbade3a09e0a
 size 290403936

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a4f8e87f5e4b08e46b3e75649df349d5b4fb594960164f2de19d18140a369834
 size 574811514

 version https://git-lfs.github.com/spec/v1
+oid sha256:b17e9ee1fe06813dba52c72e9bdf75e0ea7b8c7efe03ba060f9eeee01d3e68e8
 size 574811514

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b24b050a4497d2df6e7b62cfcfc4d42779850867386d0439e998a176affdfa5c
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:b1c99a85b3235c08a2f7456fdd3f030b9e3b62228fae9a7361d4c5547a39cb7e
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1f29b82604f7335f435c091689ced5b7937e31a97e2f9451a4908d45d79903d2
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:f628c1b20976013ecb473aea3b4cbce7b25cc3d4915b1feb5ea96f37cfaae9f1
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": 11.398892348386742,
   "best_model_checkpoint": "./Whisper_base_fine_tune_Quran/checkpoint-14800",
-  "epoch": 6.478831088812605,
   "eval_steps": 200,
-  "global_step": 18400,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -3503,6 +3503,44 @@
       "eval_steps_per_second": 0.16,
       "eval_wer": 11.566968836965806,
       "step": 18400
     }
   ],
   "logging_steps": 50,
@@ -3517,12 +3555,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": false
       },
       "attributes": {}
     }
   },
-  "total_flos": 7.6379131478016e+19,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": 11.398892348386742,
   "best_model_checkpoint": "./Whisper_base_fine_tune_Quran/checkpoint-14800",
+  "epoch": 6.549247425402694,
   "eval_steps": 200,
+  "global_step": 18600,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.16,
       "eval_wer": 11.566968836965806,
       "step": 18400
+    },
+    {
+      "epoch": 6.496435172960127,
+      "grad_norm": 6578.0205078125,
+      "learning_rate": 1.694496166129711e-08,
+      "loss": 0.0012,
+      "step": 18450
+    },
+    {
+      "epoch": 6.514039257107649,
+      "grad_norm": 19422.87109375,
+      "learning_rate": 7.53133041307974e-09,
+      "loss": 0.001,
+      "step": 18500
+    },
+    {
+      "epoch": 6.5316433412551715,
+      "grad_norm": 14675.833984375,
+      "learning_rate": 1.8828680551918888e-09,
+      "loss": 0.0013,
+      "step": 18550
+    },
+    {
+      "epoch": 6.549247425402694,
+      "grad_norm": 26447.1796875,
+      "learning_rate": 0.0,
+      "loss": 0.0012,
+      "step": 18600
+    },
+    {
+      "epoch": 6.549247425402694,
+      "eval_cer": 3.793663662027795,
+      "eval_loss": 0.012004045769572258,
+      "eval_runtime": 1511.039,
+      "eval_samples_per_second": 2.559,
+      "eval_steps_per_second": 0.16,
+      "eval_wer": 11.577990246052957,
+      "step": 18600
     }
   ],
   "logging_steps": 50,
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": true
       },
       "attributes": {}
     }
   },
+  "total_flos": 7.7209339428864e+19,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null