End of training

Files changed (5) hide show

README.md CHANGED Viewed

@@ -20,9 +20,9 @@ It achieves the following results on the evaluation set:
 - eval_precision: 0.2362
 - eval_recall: 0.1921
 - eval_f1: 0.1788
-- eval_runtime: 1016.7587
-- eval_samples_per_second: 4.878
-- eval_steps_per_second: 1.22
 - step: 0
 ## Model description

 - eval_precision: 0.2362
 - eval_recall: 0.1921
 - eval_f1: 0.1788
+- eval_runtime: 1015.705
+- eval_samples_per_second: 4.883
+- eval_steps_per_second: 1.221
 - step: 0
 ## Model description

all_results.json CHANGED Viewed

@@ -4,7 +4,7 @@
     "eval_loss": 2.501384973526001,
     "eval_precision": 0.23617900665745273,
     "eval_recall": 0.19213899602329576,
-    "eval_runtime": 1016.7587,
-    "eval_samples_per_second": 4.878,
-    "eval_steps_per_second": 1.22
 }

     "eval_loss": 2.501384973526001,
     "eval_precision": 0.23617900665745273,
     "eval_recall": 0.19213899602329576,
+    "eval_runtime": 1015.705,
+    "eval_samples_per_second": 4.883,
+    "eval_steps_per_second": 1.221
 }

runs/Apr02_15-59-10_31ea9200f14f/events.out.tfevents.1712077121.31ea9200f14f.34.1 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:79f0bf8f4b81093e75329c3cd07555cff7a3506e67d0e9d0d0e23cdd32b61b4f
-size 486

 version https://git-lfs.github.com/spec/v1
+oid sha256:3b9597853b5923576c4899cf6fbfd9bd79b43da01554e0650ab24d5c4ed99a05
+size 884

test_results.json CHANGED Viewed

@@ -4,7 +4,7 @@
     "eval_loss": 2.501384973526001,
     "eval_precision": 0.23617900665745273,
     "eval_recall": 0.19213899602329576,
-    "eval_runtime": 1016.7587,
-    "eval_samples_per_second": 4.878,
-    "eval_steps_per_second": 1.22
 }

     "eval_loss": 2.501384973526001,
     "eval_precision": 0.23617900665745273,
     "eval_recall": 0.19213899602329576,
+    "eval_runtime": 1015.705,
+    "eval_samples_per_second": 4.883,
+    "eval_steps_per_second": 1.221
 }

trainer_state.json ADDED Viewed

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": null,
+  "eval_steps": 500,
+  "global_step": 0,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "eval_accuracy": 0.225,
+      "eval_f1": 0.17882905387355633,
+      "eval_loss": 2.501384973526001,
+      "eval_precision": 0.23617900665745273,
+      "eval_recall": 0.19213899602329576,
+      "eval_runtime": 1016.7587,
+      "eval_samples_per_second": 4.878,
+      "eval_steps_per_second": 1.22,
+      "step": 0
+    },
+    {
+      "eval_accuracy": 0.225,
+      "eval_f1": 0.17882905387355633,
+      "eval_loss": 2.501384973526001,
+      "eval_precision": 0.23617900665745273,
+      "eval_recall": 0.19213899602329576,
+      "eval_runtime": 1015.705,
+      "eval_samples_per_second": 4.883,
+      "eval_steps_per_second": 1.221,
+      "step": 0
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 0,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 0,
+  "save_steps": 500,
+  "total_flos": 0,
+  "train_batch_size": null,
+  "trial_name": null,
+  "trial_params": null
+}