Training in progress, step 800

Browse files

Files changed (6) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +2 -2
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +116 -5
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6f6ab4f5ab496647bd725d368b62f9262efa69dfbf88faa37d634f8baacd29f8
 size 2843370360

 version https://git-lfs.github.com/spec/v1
+oid sha256:5bbc7079009dcb015a118d176ee96ef3fa9f81f5e32596bd48e471250f7cd019
 size 2843370360

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c46f7008e814a57fd863fe4d6b32b204d12bc103e89a9e029c1ec3761a9e6684
 size 1421660981

 version https://git-lfs.github.com/spec/v1
+oid sha256:27d9a7aedcce194e7334bb3ff1bbd48d5ae2a679ca306c2690cc2f3503f52f78
 size 1421660981

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:19f993d576aad282362d3ca490d6b3442b5e729ea10296bb1d19b837eadc6c8f
-size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:37cb7810664b13600938b962e95e12c94aaeb9d2b88cf011246a5ed3f6f5583d
+size 14639

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8636707e906db799535a0e24d8b11f4682008d2f9dce23ea4add566cf191f0eb
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:b31560d2c60ddf21d021e78a5d14bba7dc363334c5f64fc9eb49d0b82d96fc2a
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-  "best_metric": 0.14004634931160595,
-  "best_model_checkpoint": "/home2/s5432073/language-tech-project/results/ltp-roberta-large-defaultltp-roberta-large-default-0/checkpoint-200",
-  "epoch": 1.183431952662722,
-  "global_step": 200,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -43,11 +43,122 @@
       "eval_samples_per_second": 500.363,
       "eval_steps_per_second": 15.834,
       "step": 200
     }
   ],
   "max_steps": 1690,
   "num_train_epochs": 10,
-  "total_flos": 1089807110512800.0,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.35946421270983664,
+  "best_model_checkpoint": "/home2/s5432073/language-tech-project/results/ltp-roberta-large-defaultltp-roberta-large-default-0/checkpoint-800",
+  "epoch": 4.733727810650888,
+  "global_step": 800,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 500.363,
       "eval_steps_per_second": 15.834,
       "step": 200
+    },
+    {
+      "epoch": 2.37,
+      "learning_rate": 8.037383177570094e-06,
+      "loss": 0.3303,
+      "step": 400
+    },
+    {
+      "epoch": 2.37,
+      "eval_f1": 0.26419617591690636,
+      "eval_f1_all": [
+        0.43804034582132567,
+        0.31333333333333335,
+        0.0,
+        0.0,
+        0.616,
+        0.03592814371257485,
+        0.3128491620111732,
+        0.0,
+        0.7331058020477816,
+        0.5398601398601399,
+        0.16580310880829016,
+        0.391025641025641,
+        0.0,
+        0.0,
+        0.13119533527696794,
+        0.0,
+        0.6373056994818653,
+        0.6169154228855722,
+        0.02643171806167401,
+        0.32612966601178783
+      ],
+      "eval_loss": 0.32742321491241455,
+      "eval_runtime": 3.2193,
+      "eval_samples_per_second": 588.954,
+      "eval_steps_per_second": 18.638,
+      "step": 400
+    },
+    {
+      "epoch": 3.55,
+      "learning_rate": 6.791277258566978e-06,
+      "loss": 0.2955,
+      "step": 600
+    },
+    {
+      "epoch": 3.55,
+      "eval_f1": 0.33856925982901875,
+      "eval_f1_all": [
+        0.5025125628140703,
+        0.5899632802937577,
+        0.0,
+        0.07407407407407407,
+        0.6084275436793423,
+        0.0588235294117647,
+        0.3567567567567568,
+        0.0,
+        0.7440944881889764,
+        0.6120481927710844,
+        0.3916666666666666,
+        0.49431818181818177,
+        0.0,
+        0.015625,
+        0.5071868583162218,
+        0.06382978723404255,
+        0.6857597454256166,
+        0.6403940886699507,
+        0.10526315789473682,
+        0.3206412825651303
+      ],
+      "eval_loss": 0.31045234203338623,
+      "eval_runtime": 3.1516,
+      "eval_samples_per_second": 601.599,
+      "eval_steps_per_second": 19.038,
+      "step": 600
+    },
+    {
+      "epoch": 4.73,
+      "learning_rate": 5.545171339563863e-06,
+      "loss": 0.275,
+      "step": 800
+    },
+    {
+      "epoch": 4.73,
+      "eval_f1": 0.35946421270983664,
+      "eval_f1_all": [
+        0.5432692307692307,
+        0.5728770595690748,
+        0.055944055944055944,
+        0.125,
+        0.6434782608695652,
+        0.11891891891891894,
+        0.33513513513513515,
+        0.0,
+        0.7636594663278272,
+        0.638655462184874,
+        0.41071428571428564,
+        0.5251396648044693,
+        0.0,
+        0.015503875968992248,
+        0.5346733668341709,
+        0.07017543859649122,
+        0.657762938230384,
+        0.6666666666666667,
+        0.11244979919678717,
+        0.39926062846580407
+      ],
+      "eval_loss": 0.3056282103061676,
+      "eval_runtime": 3.1101,
+      "eval_samples_per_second": 609.632,
+      "eval_steps_per_second": 19.292,
+      "step": 800
     }
   ],
   "max_steps": 1690,
   "num_train_epochs": 10,
+  "total_flos": 4392119246594136.0,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c46f7008e814a57fd863fe4d6b32b204d12bc103e89a9e029c1ec3761a9e6684
 size 1421660981

 version https://git-lfs.github.com/spec/v1
+oid sha256:27d9a7aedcce194e7334bb3ff1bbd48d5ae2a679ca306c2690cc2f3503f52f78
 size 1421660981