Training in progress, step 8400, checkpoint

Browse files

Files changed (5) hide show

last-checkpoint/model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +69 -3

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:51d5619c459155c47bd01aa5955aeaeb352a6ec1ae09efde7465df43001603d7
 size 151061672

 version https://git-lfs.github.com/spec/v1
+oid sha256:ce5bb063a3184a1ee06d2a005f868382df57ecbe893a611919f2268e407868ce
 size 151061672

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:423a50ab52b674fd9e4f747477f47789594de775982c5d8aab3045683afe82c7
 size 297616186

 version https://git-lfs.github.com/spec/v1
+oid sha256:a8f5b1a7c7f8ae2a2c5b75f5dcaa1a5c7f49942782fc234acaf394e7ad4bbd5e
 size 297616186

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:12c95e1a461be3f7576b26df8bd8ff963fbbe816fd5fe47de86343853964a00c
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:f1f14f32dfc7ca77432756f9215cfce2984eed32a406197351b5f81222f88949
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9ee8e101806051a5471b6da8d97d90136d368b9e20f5708864cf5bedf200343a
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:b9b42c9151a92fc141b81f4c111bdd6ed21be543f9f1ff87540b8275dbaeeb5d
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": 13.366213870443335,
   "best_model_checkpoint": "./Whisper_tiny_fine_tune_Quran/checkpoint-8000",
-  "epoch": 2.8168295044450313,
   "eval_steps": 400,
-  "global_step": 8000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1327,6 +1327,72 @@
       "eval_steps_per_second": 0.218,
       "eval_wer": 13.366213870443335,
       "step": 8000
     }
   ],
   "logging_steps": 50,
@@ -1346,7 +1412,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 1.260486918144e+19,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": 13.366213870443335,
   "best_model_checkpoint": "./Whisper_tiny_fine_tune_Quran/checkpoint-8000",
+  "epoch": 2.9576621776252088,
   "eval_steps": 400,
+  "global_step": 8400,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.218,
       "eval_wer": 13.366213870443335,
       "step": 8000
+    },
+    {
+      "epoch": 2.8344335885925536,
+      "grad_norm": 21345.421875,
+      "learning_rate": 8.450057309301873e-07,
+      "loss": 0.003,
+      "step": 8050
+    },
+    {
+      "epoch": 2.852037672740076,
+      "grad_norm": 21389.115234375,
+      "learning_rate": 6.751647633076952e-07,
+      "loss": 0.0027,
+      "step": 8100
+    },
+    {
+      "epoch": 2.869641756887598,
+      "grad_norm": 40714.12890625,
+      "learning_rate": 5.242447386824833e-07,
+      "loss": 0.0032,
+      "step": 8150
+    },
+    {
+      "epoch": 2.8872458410351203,
+      "grad_norm": 13599.498046875,
+      "learning_rate": 3.9230354978077586e-07,
+      "loss": 0.0024,
+      "step": 8200
+    },
+    {
+      "epoch": 2.9048499251826425,
+      "grad_norm": 18847.646484375,
+      "learning_rate": 2.7939180907197717e-07,
+      "loss": 0.0029,
+      "step": 8250
+    },
+    {
+      "epoch": 2.9224540093301647,
+      "grad_norm": 25907.548828125,
+      "learning_rate": 1.855528293537856e-07,
+      "loss": 0.0031,
+      "step": 8300
+    },
+    {
+      "epoch": 2.940058093477687,
+      "grad_norm": 36510.4765625,
+      "learning_rate": 1.108226071374452e-07,
+      "loss": 0.0027,
+      "step": 8350
+    },
+    {
+      "epoch": 2.9576621776252088,
+      "grad_norm": 34380.96875,
+      "learning_rate": 5.522980883952422e-08,
+      "loss": 0.0028,
+      "step": 8400
+    },
+    {
+      "epoch": 2.9576621776252088,
+      "eval_cer": 4.579377261089553,
+      "eval_loss": 0.0121904406696558,
+      "eval_runtime": 1111.3761,
+      "eval_samples_per_second": 3.479,
+      "eval_steps_per_second": 0.218,
+      "eval_wer": 13.553577824924917,
+      "step": 8400
     }
   ],
   "logging_steps": 50,
       "attributes": {}
     }
   },
+  "total_flos": 1.3235112640512e+19,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null