Training in progress, step 12500

Browse files

Files changed (13) hide show

{checkpoint-11500 → checkpoint-12500}/config.json +0 -0
{checkpoint-11500 → checkpoint-12500}/optimizer.pt +1 -1
{checkpoint-11500 → checkpoint-12500}/pytorch_model.bin +1 -1
{checkpoint-11500 → checkpoint-12500}/rng_state.pth +1 -1
{checkpoint-11500 → checkpoint-12500}/scheduler.pt +1 -1
{checkpoint-11500 → checkpoint-12500}/special_tokens_map.json +0 -0
{checkpoint-11500 → checkpoint-12500}/tokenizer.json +0 -0
{checkpoint-11500 → checkpoint-12500}/tokenizer_config.json +0 -0
{checkpoint-11500 → checkpoint-12500}/trainer_state.json +55 -3
{checkpoint-11500 → checkpoint-12500}/training_args.bin +0 -0
{checkpoint-11500 → checkpoint-12500}/vocab.txt +0 -0
pytorch_model.bin +1 -1
runs/Jul23_01-08-06_df8adf32a670/events.out.tfevents.1690074496.df8adf32a670.1420.0 +2 -2

{checkpoint-11500 → checkpoint-12500}/config.json RENAMED Viewed

File without changes

{checkpoint-11500 → checkpoint-12500}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:65fbc3d7ff6af173ca50cc1b3297ec21fc55033dffeff53b04c5f45964710293
 size 267028677

 version https://git-lfs.github.com/spec/v1
+oid sha256:89abca1d6cacb633e4403dc53e0cdc1d284e1b84592b501d3f79626753ba3457
 size 267028677

{checkpoint-11500 → checkpoint-12500}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:59529ca11cd16e7f3bbb54ae86a9114f2c52ef602c31399728eb28f1e3d1a68e
 size 133523761

 version https://git-lfs.github.com/spec/v1
+oid sha256:d5b4c0a712dff96e0473aeb3857c38177bf768f38bb7b857a8eb2705c05d922a
 size 133523761

{checkpoint-11500 → checkpoint-12500}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:34231bee76a320a6cfd5e6a27db2529c2379830303be0641a6b4deb2835a92cc
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:eef826e9fbe5adfb12188e69aca966a61172da1b2ea910613beab436b85220ac
 size 14575

{checkpoint-11500 → checkpoint-12500}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3ddd14bf92e9211d27a39f32668b1a30dde045dcc02bdd949826abb0a7d0f1a2
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:1dc4ba56ead8bf6047d71926b107227b1dbd8295e34c75548e1702143a342558
 size 627

{checkpoint-11500 → checkpoint-12500}/special_tokens_map.json RENAMED Viewed

File without changes

{checkpoint-11500 → checkpoint-12500}/tokenizer.json RENAMED Viewed

File without changes

{checkpoint-11500 → checkpoint-12500}/tokenizer_config.json RENAMED Viewed

File without changes

{checkpoint-11500 → checkpoint-12500}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 4.6,
-  "global_step": 11500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -480,11 +480,63 @@
       "eval_system_ram_total": 83.48074722290039,
       "eval_system_ram_used": 3.8687171936035156,
       "step": 11250
     }
   ],
   "max_steps": 12500,
   "num_train_epochs": 5,
-  "total_flos": 5846801588057472.0,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 5.0,
+  "global_step": 12500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_system_ram_total": 83.48074722290039,
       "eval_system_ram_used": 3.8687171936035156,
       "step": 11250
+    },
+    {
+      "epoch": 4.75,
+      "learning_rate": 1.0064e-06,
+      "loss": 0.6355,
+      "step": 11875
+    },
+    {
+      "epoch": 4.75,
+      "eval_accuracy": 0.73495,
+      "eval_disk_space_total": 78.1898422241211,
+      "eval_disk_space_used": 26.470008850097656,
+      "eval_f1": 0.7311394674076037,
+      "eval_gpu_ram_allocated": 0.39347314834594727,
+      "eval_gpu_ram_cached": 16.05078125,
+      "eval_gpu_ram_total": 39.56402587890625,
+      "eval_gpu_utilization": 30,
+      "eval_loss": 0.850346565246582,
+      "eval_precision": 0.7308376671248696,
+      "eval_recall": 0.73495,
+      "eval_runtime": 15.2775,
+      "eval_samples_per_second": 1309.111,
+      "eval_steps_per_second": 40.91,
+      "eval_system_ram_total": 83.48074722290039,
+      "eval_system_ram_used": 3.8853225708007812,
+      "step": 11875
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 6.400000000000001e-09,
+      "loss": 0.6396,
+      "step": 12500
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.73565,
+      "eval_disk_space_total": 78.1898422241211,
+      "eval_disk_space_used": 26.47040557861328,
+      "eval_f1": 0.732235722379434,
+      "eval_gpu_ram_allocated": 0.3934931755065918,
+      "eval_gpu_ram_cached": 16.05078125,
+      "eval_gpu_ram_total": 39.56402587890625,
+      "eval_gpu_utilization": 33,
+      "eval_loss": 0.8507665991783142,
+      "eval_precision": 0.7317733808462167,
+      "eval_recall": 0.73565,
+      "eval_runtime": 15.2926,
+      "eval_samples_per_second": 1307.826,
+      "eval_steps_per_second": 40.87,
+      "eval_system_ram_total": 83.48074722290039,
+      "eval_system_ram_used": 3.8995018005371094,
+      "step": 12500
     }
   ],
   "max_steps": 12500,
   "num_train_epochs": 5,
+  "total_flos": 6360760919761920.0,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-11500 → checkpoint-12500}/training_args.bin RENAMED Viewed

File without changes

{checkpoint-11500 → checkpoint-12500}/vocab.txt RENAMED Viewed

File without changes

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f464404bbabf4ffc076175dc0dd64bed9ebbae82e692e4cc0d024912d83b0bf7
 size 133523761

 version https://git-lfs.github.com/spec/v1
+oid sha256:d5b4c0a712dff96e0473aeb3857c38177bf768f38bb7b857a8eb2705c05d922a
 size 133523761

runs/Jul23_01-08-06_df8adf32a670/events.out.tfevents.1690074496.df8adf32a670.1420.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fb8b338480dce9596ce62d102b2c3b4e900091413645f35902e9c12c0c481491
-size 25820

 version https://git-lfs.github.com/spec/v1
+oid sha256:3dbc2d39c4c64c3b5480bd01b1771b4f4940fe7f8922458f8cf510bf6c94e960
+size 26922