Training in progress, step 1000

Browse files

Files changed (6) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +2 -2
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +153 -5
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e94aa42a134922511d37b0f7b8a3683d5fd7d1d79d9781b3117b09ca7273b936
 size 2843370360

 version https://git-lfs.github.com/spec/v1
+oid sha256:4b9f72aa7b44e7a9ec47f89b7774912f0581af69d82b5930eed4b6eb9f9c9365
 size 2843370360

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a4df99eed370c9cb39b1ec5ed20aac79dc213c5aade1e76816b891752f51827c
 size 1421660981

 version https://git-lfs.github.com/spec/v1
+oid sha256:176173d359247b923d0648004a1d4c4e72a08cb2741671127858595923d9c5d0
 size 1421660981

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:19f993d576aad282362d3ca490d6b3442b5e729ea10296bb1d19b837eadc6c8f
-size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:c61056c1b86433bea751294e0b85aebf024f3ac7d72392effbce9faca4759620
+size 14639

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8636707e906db799535a0e24d8b11f4682008d2f9dce23ea4add566cf191f0eb
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:68a6f395aca12d068a355806ad25a39cc1cf9ac8d7df16949ceeaa9f78f9ba22
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-  "best_metric": 0.13967554851569386,
-  "best_model_checkpoint": "/home2/s5432073/language-tech-project/results/ltp-roberta-large-default/checkpoint-200",
-  "epoch": 1.183431952662722,
-  "global_step": 200,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -43,11 +43,159 @@
       "eval_samples_per_second": 422.907,
       "eval_steps_per_second": 13.383,
       "step": 200
     }
   ],
   "max_steps": 1690,
   "num_train_epochs": 10,
-  "total_flos": 1089865359765408.0,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.3712866943650337,
+  "best_model_checkpoint": "/home2/s5432073/language-tech-project/results/ltp-roberta-large-default/checkpoint-1000",
+  "epoch": 5.9171597633136095,
+  "global_step": 1000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 422.907,
       "eval_steps_per_second": 13.383,
       "step": 200
+    },
+    {
+      "epoch": 2.37,
+      "learning_rate": 8.037383177570094e-06,
+      "loss": 0.3287,
+      "step": 400
+    },
+    {
+      "epoch": 2.37,
+      "eval_f1": 0.26059605664667,
+      "eval_f1_all": [
+        0.4311377245508982,
+        0.33333333333333337,
+        0.0,
+        0.0,
+        0.6143001007049347,
+        0.03592814371257485,
+        0.2823529411764706,
+        0.0,
+        0.7357440890125174,
+        0.55,
+        0.1650485436893204,
+        0.3709677419354839,
+        0.0,
+        0.0,
+        0.11209439528023599,
+        0.0,
+        0.6120218579234973,
+        0.5846153846153846,
+        0.034934497816593885,
+        0.3494423791821561
+      ],
+      "eval_loss": 0.32891085743904114,
+      "eval_runtime": 3.0437,
+      "eval_samples_per_second": 622.918,
+      "eval_steps_per_second": 19.713,
+      "step": 400
+    },
+    {
+      "epoch": 3.55,
+      "learning_rate": 6.791277258566978e-06,
+      "loss": 0.2952,
+      "step": 600
+    },
+    {
+      "epoch": 3.55,
+      "eval_f1": 0.32608326603750615,
+      "eval_f1_all": [
+        0.5166240409207161,
+        0.5852478839177752,
+        0.0,
+        0.0,
+        0.6099585062240663,
+        0.0588235294117647,
+        0.29069767441860467,
+        0.0,
+        0.745417515274949,
+        0.619047619047619,
+        0.3628691983122363,
+        0.4564564564564564,
+        0.0,
+        0.015625,
+        0.49217935349322217,
+        0.04332129963898917,
+        0.6925515055467513,
+        0.6268656716417911,
+        0.05714285714285715,
+        0.3488372093023256
+      ],
+      "eval_loss": 0.31139805912971497,
+      "eval_runtime": 2.9889,
+      "eval_samples_per_second": 634.353,
+      "eval_steps_per_second": 20.074,
+      "step": 600
+    },
+    {
+      "epoch": 4.73,
+      "learning_rate": 5.545171339563863e-06,
+      "loss": 0.2745,
+      "step": 800
+    },
+    {
+      "epoch": 4.73,
+      "eval_f1": 0.35306069701657317,
+      "eval_f1_all": [
+        0.5316455696202532,
+        0.575,
+        0.02857142857142857,
+        0.125,
+        0.6256306760847629,
+        0.1005586592178771,
+        0.32222222222222224,
+        0.0,
+        0.7624595469255664,
+        0.6393442622950821,
+        0.4034334763948497,
+        0.5371900826446281,
+        0.0,
+        0.015503875968992248,
+        0.5170630816959669,
+        0.08304498269896193,
+        0.6463620981387478,
+        0.6822429906542056,
+        0.07407407407407407,
+        0.39186691312384475
+      ],
+      "eval_loss": 0.3067249059677124,
+      "eval_runtime": 2.9637,
+      "eval_samples_per_second": 639.733,
+      "eval_steps_per_second": 20.245,
+      "step": 800
+    },
+    {
+      "epoch": 5.92,
+      "learning_rate": 4.299065420560748e-06,
+      "loss": 0.2575,
+      "step": 1000
+    },
+    {
+      "epoch": 5.92,
+      "eval_f1": 0.3712866943650337,
+      "eval_f1_all": [
+        0.5213032581453635,
+        0.5556978233034571,
+        0.1081081081081081,
+        0.1391304347826087,
+        0.6363636363636365,
+        0.1005586592178771,
+        0.2840909090909091,
+        0.0,
+        0.7576530612244897,
+        0.6426076833527357,
+        0.4453441295546559,
+        0.5411140583554377,
+        0.0,
+        0.015037593984962405,
+        0.5839929639401935,
+        0.1921921921921922,
+        0.641573994867408,
+        0.6936936936936936,
+        0.12648221343873517,
+        0.4407894736842105
+      ],
+      "eval_loss": 0.3082274794578552,
+      "eval_runtime": 2.9599,
+      "eval_samples_per_second": 640.56,
+      "eval_steps_per_second": 20.271,
+      "step": 1000
     }
   ],
   "max_steps": 1690,
   "num_train_epochs": 10,
+  "total_flos": 5502978001057296.0,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a4df99eed370c9cb39b1ec5ed20aac79dc213c5aade1e76816b891752f51827c
 size 1421660981

 version https://git-lfs.github.com/spec/v1
+oid sha256:176173d359247b923d0648004a1d4c4e72a08cb2741671127858595923d9c5d0
 size 1421660981