Training in progress, step 11500

Browse files

Files changed (13) hide show

{checkpoint-10500 → checkpoint-11500}/config.json +0 -0
{checkpoint-10500 → checkpoint-11500}/optimizer.pt +1 -1
{checkpoint-10500 → checkpoint-11500}/pytorch_model.bin +1 -1
{checkpoint-10500 → checkpoint-11500}/rng_state.pth +1 -1
{checkpoint-10500 → checkpoint-11500}/scheduler.pt +1 -1
{checkpoint-10500 → checkpoint-11500}/special_tokens_map.json +0 -0
{checkpoint-10500 → checkpoint-11500}/tokenizer.json +0 -0
{checkpoint-10500 → checkpoint-11500}/tokenizer_config.json +0 -0
{checkpoint-10500 → checkpoint-11500}/trainer_state.json +55 -3
{checkpoint-10500 → checkpoint-11500}/training_args.bin +0 -0
{checkpoint-10500 → checkpoint-11500}/vocab.txt +0 -0
pytorch_model.bin +1 -1
runs/Jul23_01-08-06_df8adf32a670/events.out.tfevents.1690074496.df8adf32a670.1420.0 +2 -2

{checkpoint-10500 → checkpoint-11500}/config.json RENAMED Viewed

File without changes

{checkpoint-10500 → checkpoint-11500}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:80559c1b1bf97ffea5492c8aafd7dec88753955d7295cfbc08b99df5ce302630
 size 267028677

 version https://git-lfs.github.com/spec/v1
+oid sha256:65fbc3d7ff6af173ca50cc1b3297ec21fc55033dffeff53b04c5f45964710293
 size 267028677

{checkpoint-10500 → checkpoint-11500}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b5b915af613925ecdf2955e1a788f57e0f9ed1146924f573e0789a03c9f5d1fb
 size 133523761

 version https://git-lfs.github.com/spec/v1
+oid sha256:59529ca11cd16e7f3bbb54ae86a9114f2c52ef602c31399728eb28f1e3d1a68e
 size 133523761

{checkpoint-10500 → checkpoint-11500}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:89440c8497ea37eb9574fb3a4b717af648034e96d1e784a5ec340222f778f966
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:34231bee76a320a6cfd5e6a27db2529c2379830303be0641a6b4deb2835a92cc
 size 14575

{checkpoint-10500 → checkpoint-11500}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:59eac2cccdc53a2b511c84a4ecc9b55c72027d8de648a98699746a3948afa715
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:3ddd14bf92e9211d27a39f32668b1a30dde045dcc02bdd949826abb0a7d0f1a2
 size 627

{checkpoint-10500 → checkpoint-11500}/special_tokens_map.json RENAMED Viewed

File without changes

{checkpoint-10500 → checkpoint-11500}/tokenizer.json RENAMED Viewed

File without changes

{checkpoint-10500 → checkpoint-11500}/tokenizer_config.json RENAMED Viewed

File without changes

{checkpoint-10500 → checkpoint-11500}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 4.2,
-  "global_step": 10500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -428,11 +428,63 @@
       "eval_system_ram_total": 83.48074722290039,
       "eval_system_ram_used": 3.8847808837890625,
       "step": 10000
     }
   ],
   "max_steps": 12500,
   "num_train_epochs": 5,
-  "total_flos": 5340484590610176.0,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 4.6,
+  "global_step": 11500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_system_ram_total": 83.48074722290039,
       "eval_system_ram_used": 3.8847808837890625,
       "step": 10000
+    },
+    {
+      "epoch": 4.25,
+      "learning_rate": 3.0064000000000006e-06,
+      "loss": 0.6247,
+      "step": 10625
+    },
+    {
+      "epoch": 4.25,
+      "eval_accuracy": 0.736,
+      "eval_disk_space_total": 78.1898422241211,
+      "eval_disk_space_used": 26.469379425048828,
+      "eval_f1": 0.7332127747065252,
+      "eval_gpu_ram_allocated": 0.39348888397216797,
+      "eval_gpu_ram_cached": 16.05078125,
+      "eval_gpu_ram_total": 39.56402587890625,
+      "eval_gpu_utilization": 32,
+      "eval_loss": 0.8499526381492615,
+      "eval_precision": 0.7324176547179257,
+      "eval_recall": 0.736,
+      "eval_runtime": 15.3802,
+      "eval_samples_per_second": 1300.37,
+      "eval_steps_per_second": 40.637,
+      "eval_system_ram_total": 83.48074722290039,
+      "eval_system_ram_used": 4.0838470458984375,
+      "step": 10625
+    },
+    {
+      "epoch": 4.5,
+      "learning_rate": 2.0064000000000004e-06,
+      "loss": 0.6446,
+      "step": 11250
+    },
+    {
+      "epoch": 4.5,
+      "eval_accuracy": 0.7358,
+      "eval_disk_space_total": 78.1898422241211,
+      "eval_disk_space_used": 26.469707489013672,
+      "eval_f1": 0.7322672918855475,
+      "eval_gpu_ram_allocated": 0.39359617233276367,
+      "eval_gpu_ram_cached": 16.05078125,
+      "eval_gpu_ram_total": 39.56402587890625,
+      "eval_gpu_utilization": 31,
+      "eval_loss": 0.8464106321334839,
+      "eval_precision": 0.7319786149192336,
+      "eval_recall": 0.7358,
+      "eval_runtime": 15.2922,
+      "eval_samples_per_second": 1307.853,
+      "eval_steps_per_second": 40.87,
+      "eval_system_ram_total": 83.48074722290039,
+      "eval_system_ram_used": 3.8687171936035156,
+      "step": 11250
     }
   ],
   "max_steps": 12500,
   "num_train_epochs": 5,
+  "total_flos": 5846801588057472.0,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-10500 → checkpoint-11500}/training_args.bin RENAMED Viewed

File without changes

{checkpoint-10500 → checkpoint-11500}/vocab.txt RENAMED Viewed

File without changes

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6b2d123eec1e3724e36f27638d03c43ed031e88f237dbef0f0139dfab99cb872
 size 133523761

 version https://git-lfs.github.com/spec/v1
+oid sha256:59529ca11cd16e7f3bbb54ae86a9114f2c52ef602c31399728eb28f1e3d1a68e
 size 133523761

runs/Jul23_01-08-06_df8adf32a670/events.out.tfevents.1690074496.df8adf32a670.1420.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f32aec60a58edd33329a0b3ab84d5ac3280b96a5aad80b8e542ed51609be0281
-size 23616

 version https://git-lfs.github.com/spec/v1
+oid sha256:39a09110f783e2e5350e99889528776802102f16699d8374cb32da164aa43612
+size 24718