polejowska
/

detr-r50-finetuned-mist1-gb-8ah-6l

+---
+license: apache-2.0
+base_model: polejowska/detr-r50-cd45rb-8ah-6l
+tags:
+- generated_from_trainer
+model-index:
+- name: detr-r50-finetuned-mist1-gb-8ah-6l
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# detr-r50-finetuned-mist1-gb-8ah-6l
+This model is a fine-tuned version of [polejowska/detr-r50-cd45rb-8ah-6l](https://huggingface.co/polejowska/detr-r50-cd45rb-8ah-6l) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 1.9224
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 1e-05
+- train_batch_size: 4
+- eval_batch_size: 8
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 50
+- mixed_precision_training: Native AMP
+### Training results
+| Training Loss | Epoch | Step | Validation Loss |
+|:-------------:|:-----:|:----:|:---------------:|
+| 2.5222        | 1.0   | 115  | 2.2563          |
+| 2.3827        | 2.0   | 230  | 2.2211          |
+| 2.3441        | 3.0   | 345  | 2.2602          |
+| 2.2896        | 4.0   | 460  | 2.2359          |
+| 2.2828        | 5.0   | 575  | 2.2431          |
+| 2.2972        | 6.0   | 690  | 2.1629          |
+| 2.3007        | 7.0   | 805  | 2.1545          |
+| 2.2951        | 8.0   | 920  | 2.1153          |
+| 2.2595        | 9.0   | 1035 | 2.1553          |
+| 2.2327        | 10.0  | 1150 | 2.2060          |
+| 2.2023        | 11.0  | 1265 | 2.0452          |
+| 2.2117        | 12.0  | 1380 | 2.0879          |
+| 2.1805        | 13.0  | 1495 | 2.1812          |
+| 2.1344        | 14.0  | 1610 | 2.0992          |
+| 2.1057        | 15.0  | 1725 | 1.9834          |
+| 2.086         | 16.0  | 1840 | 1.9610          |
+| 2.0591        | 17.0  | 1955 | 2.1007          |
+| 2.053         | 18.0  | 2070 | 2.0561          |
+| 2.0387        | 19.0  | 2185 | 2.0596          |
+| 2.0161        | 20.0  | 2300 | 1.9885          |
+| 2.0374        | 21.0  | 2415 | 2.0041          |
+| 2.0233        | 22.0  | 2530 | 2.0103          |
+| 2.0363        | 23.0  | 2645 | 2.0541          |
+| 1.9837        | 24.0  | 2760 | 1.9924          |
+| 1.9943        | 25.0  | 2875 | 2.0558          |
+| 1.9846        | 26.0  | 2990 | 1.9874          |
+| 1.9601        | 27.0  | 3105 | 1.9554          |
+| 1.9837        | 28.0  | 3220 | 1.9989          |
+| 1.9664        | 29.0  | 3335 | 1.9876          |
+| 1.966         | 30.0  | 3450 | 1.9755          |
+| 1.9226        | 31.0  | 3565 | 1.9357          |
+| 1.9405        | 32.0  | 3680 | 1.9240          |
+| 1.9035        | 33.0  | 3795 | 1.9411          |
+| 1.8924        | 34.0  | 3910 | 1.9291          |
+| 1.8801        | 35.0  | 4025 | 1.9661          |
+| 1.8698        | 36.0  | 4140 | 1.9105          |
+| 1.8572        | 37.0  | 4255 | 1.9448          |
+| 1.8756        | 38.0  | 4370 | 1.9675          |
+| 1.8593        | 39.0  | 4485 | 1.9365          |
+| 1.8713        | 40.0  | 4600 | 1.9383          |
+| 1.8436        | 41.0  | 4715 | 1.9671          |
+| 1.83          | 42.0  | 4830 | 1.9527          |
+| 1.857         | 43.0  | 4945 | 1.9448          |
+| 1.8318        | 44.0  | 5060 | 1.9366          |
+| 1.8177        | 45.0  | 5175 | 1.9389          |
+| 1.8034        | 46.0  | 5290 | 1.9050          |
+| 1.8226        | 47.0  | 5405 | 1.9226          |
+| 1.818         | 48.0  | 5520 | 1.9150          |
+| 1.8148        | 49.0  | 5635 | 1.9169          |
+| 1.7984        | 50.0  | 5750 | 1.9224          |
+### Framework versions
+- Transformers 4.35.0
+- Pytorch 2.0.0
+- Datasets 2.1.0
+- Tokenizers 0.14.1

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:024f6dacd05e7b91834780fa85d5258a18778d0c499f7c1ba7292fd35d01fc19
 size 166494824

 version https://git-lfs.github.com/spec/v1
+oid sha256:16625071c6b40408b117b4bd0e310612000d962e8200411ff8bf1eaf82875e69
 size 166494824

trainer_state.json ADDED Viewed

	@@ -0,0 +1,728 @@

+{
+  "best_metric": 1.905003309249878,
+  "best_model_checkpoint": "detr-r50-finetuned-mist1-gb-8ah-6l/checkpoint-5290",
+  "epoch": 50.0,
+  "eval_steps": 500,
+  "global_step": 5750,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 9.812173913043479e-06,
+      "loss": 2.5222,
+      "step": 115
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 2.2562553882598877,
+      "eval_runtime": 5.7546,
+      "eval_samples_per_second": 6.951,
+      "eval_steps_per_second": 0.869,
+      "step": 115
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 9.612173913043479e-06,
+      "loss": 2.3827,
+      "step": 230
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 2.2210755348205566,
+      "eval_runtime": 5.7395,
+      "eval_samples_per_second": 6.969,
+      "eval_steps_per_second": 0.871,
+      "step": 230
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 9.412173913043479e-06,
+      "loss": 2.3441,
+      "step": 345
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 2.2602248191833496,
+      "eval_runtime": 5.7242,
+      "eval_samples_per_second": 6.988,
+      "eval_steps_per_second": 0.873,
+      "step": 345
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 9.21217391304348e-06,
+      "loss": 2.2896,
+      "step": 460
+    },
+    {
+      "epoch": 4.0,
+      "eval_loss": 2.2359230518341064,
+      "eval_runtime": 5.684,
+      "eval_samples_per_second": 7.037,
+      "eval_steps_per_second": 0.88,
+      "step": 460
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 9.013913043478261e-06,
+      "loss": 2.2828,
+      "step": 575
+    },
+    {
+      "epoch": 5.0,
+      "eval_loss": 2.2430644035339355,
+      "eval_runtime": 5.7198,
+      "eval_samples_per_second": 6.993,
+      "eval_steps_per_second": 0.874,
+      "step": 575
+    },
+    {
+      "epoch": 6.0,
+      "learning_rate": 8.813913043478261e-06,
+      "loss": 2.2972,
+      "step": 690
+    },
+    {
+      "epoch": 6.0,
+      "eval_loss": 2.1629228591918945,
+      "eval_runtime": 5.6906,
+      "eval_samples_per_second": 7.029,
+      "eval_steps_per_second": 0.879,
+      "step": 690
+    },
+    {
+      "epoch": 7.0,
+      "learning_rate": 8.615652173913043e-06,
+      "loss": 2.3007,
+      "step": 805
+    },
+    {
+      "epoch": 7.0,
+      "eval_loss": 2.1544721126556396,
+      "eval_runtime": 5.7423,
+      "eval_samples_per_second": 6.966,
+      "eval_steps_per_second": 0.871,
+      "step": 805
+    },
+    {
+      "epoch": 8.0,
+      "learning_rate": 8.417391304347827e-06,
+      "loss": 2.2951,
+      "step": 920
+    },
+    {
+      "epoch": 8.0,
+      "eval_loss": 2.115345001220703,
+      "eval_runtime": 5.7472,
+      "eval_samples_per_second": 6.96,
+      "eval_steps_per_second": 0.87,
+      "step": 920
+    },
+    {
+      "epoch": 9.0,
+      "learning_rate": 8.217391304347827e-06,
+      "loss": 2.2595,
+      "step": 1035
+    },
+    {
+      "epoch": 9.0,
+      "eval_loss": 2.1553213596343994,
+      "eval_runtime": 5.6778,
+      "eval_samples_per_second": 7.045,
+      "eval_steps_per_second": 0.881,
+      "step": 1035
+    },
+    {
+      "epoch": 10.0,
+      "learning_rate": 8.017391304347828e-06,
+      "loss": 2.2327,
+      "step": 1150
+    },
+    {
+      "epoch": 10.0,
+      "eval_loss": 2.205960750579834,
+      "eval_runtime": 5.7224,
+      "eval_samples_per_second": 6.99,
+      "eval_steps_per_second": 0.874,
+      "step": 1150
+    },
+    {
+      "epoch": 11.0,
+      "learning_rate": 7.817391304347826e-06,
+      "loss": 2.2023,
+      "step": 1265
+    },
+    {
+      "epoch": 11.0,
+      "eval_loss": 2.045210599899292,
+      "eval_runtime": 5.6947,
+      "eval_samples_per_second": 7.024,
+      "eval_steps_per_second": 0.878,
+      "step": 1265
+    },
+    {
+      "epoch": 12.0,
+      "learning_rate": 7.617391304347826e-06,
+      "loss": 2.2117,
+      "step": 1380
+    },
+    {
+      "epoch": 12.0,
+      "eval_loss": 2.087853193283081,
+      "eval_runtime": 5.7626,
+      "eval_samples_per_second": 6.941,
+      "eval_steps_per_second": 0.868,
+      "step": 1380
+    },
+    {
+      "epoch": 13.0,
+      "learning_rate": 7.417391304347827e-06,
+      "loss": 2.1805,
+      "step": 1495
+    },
+    {
+      "epoch": 13.0,
+      "eval_loss": 2.1812005043029785,
+      "eval_runtime": 5.7549,
+      "eval_samples_per_second": 6.951,
+      "eval_steps_per_second": 0.869,
+      "step": 1495
+    },
+    {
+      "epoch": 14.0,
+      "learning_rate": 7.217391304347827e-06,
+      "loss": 2.1344,
+      "step": 1610
+    },
+    {
+      "epoch": 14.0,
+      "eval_loss": 2.0991523265838623,
+      "eval_runtime": 5.7805,
+      "eval_samples_per_second": 6.92,
+      "eval_steps_per_second": 0.865,
+      "step": 1610
+    },
+    {
+      "epoch": 15.0,
+      "learning_rate": 7.017391304347827e-06,
+      "loss": 2.1057,
+      "step": 1725
+    },
+    {
+      "epoch": 15.0,
+      "eval_loss": 1.983435869216919,
+      "eval_runtime": 5.7113,
+      "eval_samples_per_second": 7.004,
+      "eval_steps_per_second": 0.875,
+      "step": 1725
+    },
+    {
+      "epoch": 16.0,
+      "learning_rate": 6.817391304347826e-06,
+      "loss": 2.086,
+      "step": 1840
+    },
+    {
+      "epoch": 16.0,
+      "eval_loss": 1.9609792232513428,
+      "eval_runtime": 5.7575,
+      "eval_samples_per_second": 6.947,
+      "eval_steps_per_second": 0.868,
+      "step": 1840
+    },
+    {
+      "epoch": 17.0,
+      "learning_rate": 6.617391304347827e-06,
+      "loss": 2.0591,
+      "step": 1955
+    },
+    {
+      "epoch": 17.0,
+      "eval_loss": 2.100736141204834,
+      "eval_runtime": 5.7633,
+      "eval_samples_per_second": 6.94,
+      "eval_steps_per_second": 0.868,
+      "step": 1955
+    },
+    {
+      "epoch": 18.0,
+      "learning_rate": 6.417391304347827e-06,
+      "loss": 2.053,
+      "step": 2070
+    },
+    {
+      "epoch": 18.0,
+      "eval_loss": 2.056126832962036,
+      "eval_runtime": 5.7709,
+      "eval_samples_per_second": 6.931,
+      "eval_steps_per_second": 0.866,
+      "step": 2070
+    },
+    {
+      "epoch": 19.0,
+      "learning_rate": 6.217391304347826e-06,
+      "loss": 2.0387,
+      "step": 2185
+    },
+    {
+      "epoch": 19.0,
+      "eval_loss": 2.0596375465393066,
+      "eval_runtime": 5.7884,
+      "eval_samples_per_second": 6.91,
+      "eval_steps_per_second": 0.864,
+      "step": 2185
+    },
+    {
+      "epoch": 20.0,
+      "learning_rate": 6.0173913043478264e-06,
+      "loss": 2.0161,
+      "step": 2300
+    },
+    {
+      "epoch": 20.0,
+      "eval_loss": 1.9885139465332031,
+      "eval_runtime": 5.7465,
+      "eval_samples_per_second": 6.961,
+      "eval_steps_per_second": 0.87,
+      "step": 2300
+    },
+    {
+      "epoch": 21.0,
+      "learning_rate": 5.817391304347827e-06,
+      "loss": 2.0374,
+      "step": 2415
+    },
+    {
+      "epoch": 21.0,
+      "eval_loss": 2.0041000843048096,
+      "eval_runtime": 5.7421,
+      "eval_samples_per_second": 6.966,
+      "eval_steps_per_second": 0.871,
+      "step": 2415
+    },
+    {
+      "epoch": 22.0,
+      "learning_rate": 5.617391304347827e-06,
+      "loss": 2.0233,
+      "step": 2530
+    },
+    {
+      "epoch": 22.0,
+      "eval_loss": 2.0102856159210205,
+      "eval_runtime": 5.7047,
+      "eval_samples_per_second": 7.012,
+      "eval_steps_per_second": 0.876,
+      "step": 2530
+    },
+    {
+      "epoch": 23.0,
+      "learning_rate": 5.417391304347826e-06,
+      "loss": 2.0363,
+      "step": 2645
+    },
+    {
+      "epoch": 23.0,
+      "eval_loss": 2.0540664196014404,
+      "eval_runtime": 5.7156,
+      "eval_samples_per_second": 6.998,
+      "eval_steps_per_second": 0.875,
+      "step": 2645
+    },
+    {
+      "epoch": 24.0,
+      "learning_rate": 5.2173913043478265e-06,
+      "loss": 1.9837,
+      "step": 2760
+    },
+    {
+      "epoch": 24.0,
+      "eval_loss": 1.9924190044403076,
+      "eval_runtime": 5.6809,
+      "eval_samples_per_second": 7.041,
+      "eval_steps_per_second": 0.88,
+      "step": 2760
+    },
+    {
+      "epoch": 25.0,
+      "learning_rate": 5.017391304347826e-06,
+      "loss": 1.9943,
+      "step": 2875
+    },
+    {
+      "epoch": 25.0,
+      "eval_loss": 2.0557620525360107,
+      "eval_runtime": 5.7087,
+      "eval_samples_per_second": 7.007,
+      "eval_steps_per_second": 0.876,
+      "step": 2875
+    },
+    {
+      "epoch": 26.0,
+      "learning_rate": 4.817391304347827e-06,
+      "loss": 1.9846,
+      "step": 2990
+    },
+    {
+      "epoch": 26.0,
+      "eval_loss": 1.9873688220977783,
+      "eval_runtime": 5.6682,
+      "eval_samples_per_second": 7.057,
+      "eval_steps_per_second": 0.882,
+      "step": 2990
+    },
+    {
+      "epoch": 27.0,
+      "learning_rate": 4.617391304347826e-06,
+      "loss": 1.9601,
+      "step": 3105
+    },
+    {
+      "epoch": 27.0,
+      "eval_loss": 1.9554007053375244,
+      "eval_runtime": 5.7979,
+      "eval_samples_per_second": 6.899,
+      "eval_steps_per_second": 0.862,
+      "step": 3105
+    },
+    {
+      "epoch": 28.0,
+      "learning_rate": 4.4173913043478265e-06,
+      "loss": 1.9837,
+      "step": 3220
+    },
+    {
+      "epoch": 28.0,
+      "eval_loss": 1.9988619089126587,
+      "eval_runtime": 5.7796,
+      "eval_samples_per_second": 6.921,
+      "eval_steps_per_second": 0.865,
+      "step": 3220
+    },
+    {
+      "epoch": 29.0,
+      "learning_rate": 4.217391304347827e-06,
+      "loss": 1.9664,
+      "step": 3335
+    },
+    {
+      "epoch": 29.0,
+      "eval_loss": 1.9875919818878174,
+      "eval_runtime": 5.7433,
+      "eval_samples_per_second": 6.965,
+      "eval_steps_per_second": 0.871,
+      "step": 3335
+    },
+    {
+      "epoch": 30.0,
+      "learning_rate": 4.017391304347826e-06,
+      "loss": 1.966,
+      "step": 3450
+    },
+    {
+      "epoch": 30.0,
+      "eval_loss": 1.9754610061645508,
+      "eval_runtime": 5.8653,
+      "eval_samples_per_second": 6.82,
+      "eval_steps_per_second": 0.852,
+      "step": 3450
+    },
+    {
+      "epoch": 31.0,
+      "learning_rate": 3.819130434782609e-06,
+      "loss": 1.9226,
+      "step": 3565
+    },
+    {
+      "epoch": 31.0,
+      "eval_loss": 1.9357328414916992,
+      "eval_runtime": 5.765,
+      "eval_samples_per_second": 6.938,
+      "eval_steps_per_second": 0.867,
+      "step": 3565
+    },
+    {
+      "epoch": 32.0,
+      "learning_rate": 3.6191304347826088e-06,
+      "loss": 1.9405,
+      "step": 3680
+    },
+    {
+      "epoch": 32.0,
+      "eval_loss": 1.9239734411239624,
+      "eval_runtime": 5.8194,
+      "eval_samples_per_second": 6.874,
+      "eval_steps_per_second": 0.859,
+      "step": 3680
+    },
+    {
+      "epoch": 33.0,
+      "learning_rate": 3.4191304347826086e-06,
+      "loss": 1.9035,
+      "step": 3795
+    },
+    {
+      "epoch": 33.0,
+      "eval_loss": 1.9410585165023804,
+      "eval_runtime": 5.8097,
+      "eval_samples_per_second": 6.885,
+      "eval_steps_per_second": 0.861,
+      "step": 3795
+    },
+    {
+      "epoch": 34.0,
+      "learning_rate": 3.219130434782609e-06,
+      "loss": 1.8924,
+      "step": 3910
+    },
+    {
+      "epoch": 34.0,
+      "eval_loss": 1.9291362762451172,
+      "eval_runtime": 5.8014,
+      "eval_samples_per_second": 6.895,
+      "eval_steps_per_second": 0.862,
+      "step": 3910
+    },
+    {
+      "epoch": 35.0,
+      "learning_rate": 3.019130434782609e-06,
+      "loss": 1.8801,
+      "step": 4025
+    },
+    {
+      "epoch": 35.0,
+      "eval_loss": 1.9660656452178955,
+      "eval_runtime": 5.7747,
+      "eval_samples_per_second": 6.927,
+      "eval_steps_per_second": 0.866,
+      "step": 4025
+    },
+    {
+      "epoch": 36.0,
+      "learning_rate": 2.819130434782609e-06,
+      "loss": 1.8698,
+      "step": 4140
+    },
+    {
+      "epoch": 36.0,
+      "eval_loss": 1.9104881286621094,
+      "eval_runtime": 5.7592,
+      "eval_samples_per_second": 6.945,
+      "eval_steps_per_second": 0.868,
+      "step": 4140
+    },
+    {
+      "epoch": 37.0,
+      "learning_rate": 2.619130434782609e-06,
+      "loss": 1.8572,
+      "step": 4255
+    },
+    {
+      "epoch": 37.0,
+      "eval_loss": 1.944820761680603,
+      "eval_runtime": 5.7796,
+      "eval_samples_per_second": 6.921,
+      "eval_steps_per_second": 0.865,
+      "step": 4255
+    },
+    {
+      "epoch": 38.0,
+      "learning_rate": 2.419130434782609e-06,
+      "loss": 1.8756,
+      "step": 4370
+    },
+    {
+      "epoch": 38.0,
+      "eval_loss": 1.9674819707870483,
+      "eval_runtime": 5.7301,
+      "eval_samples_per_second": 6.981,
+      "eval_steps_per_second": 0.873,
+      "step": 4370
+    },
+    {
+      "epoch": 39.0,
+      "learning_rate": 2.219130434782609e-06,
+      "loss": 1.8593,
+      "step": 4485
+    },
+    {
+      "epoch": 39.0,
+      "eval_loss": 1.9364864826202393,
+      "eval_runtime": 5.8116,
+      "eval_samples_per_second": 6.883,
+      "eval_steps_per_second": 0.86,
+      "step": 4485
+    },
+    {
+      "epoch": 40.0,
+      "learning_rate": 2.019130434782609e-06,
+      "loss": 1.8713,
+      "step": 4600
+    },
+    {
+      "epoch": 40.0,
+      "eval_loss": 1.9382976293563843,
+      "eval_runtime": 5.7132,
+      "eval_samples_per_second": 7.001,
+      "eval_steps_per_second": 0.875,
+      "step": 4600
+    },
+    {
+      "epoch": 41.0,
+      "learning_rate": 1.8191304347826088e-06,
+      "loss": 1.8436,
+      "step": 4715
+    },
+    {
+      "epoch": 41.0,
+      "eval_loss": 1.967057466506958,
+      "eval_runtime": 5.7284,
+      "eval_samples_per_second": 6.983,
+      "eval_steps_per_second": 0.873,
+      "step": 4715
+    },
+    {
+      "epoch": 42.0,
+      "learning_rate": 1.6191304347826088e-06,
+      "loss": 1.83,
+      "step": 4830
+    },
+    {
+      "epoch": 42.0,
+      "eval_loss": 1.9526548385620117,
+      "eval_runtime": 5.6918,
+      "eval_samples_per_second": 7.028,
+      "eval_steps_per_second": 0.878,
+      "step": 4830
+    },
+    {
+      "epoch": 43.0,
+      "learning_rate": 1.4191304347826089e-06,
+      "loss": 1.857,
+      "step": 4945
+    },
+    {
+      "epoch": 43.0,
+      "eval_loss": 1.944758653640747,
+      "eval_runtime": 5.7519,
+      "eval_samples_per_second": 6.954,
+      "eval_steps_per_second": 0.869,
+      "step": 4945
+    },
+    {
+      "epoch": 44.0,
+      "learning_rate": 1.2191304347826089e-06,
+      "loss": 1.8318,
+      "step": 5060
+    },
+    {
+      "epoch": 44.0,
+      "eval_loss": 1.9366220235824585,
+      "eval_runtime": 5.7436,
+      "eval_samples_per_second": 6.964,
+      "eval_steps_per_second": 0.871,
+      "step": 5060
+    },
+    {
+      "epoch": 45.0,
+      "learning_rate": 1.0191304347826089e-06,
+      "loss": 1.8177,
+      "step": 5175
+    },
+    {
+      "epoch": 45.0,
+      "eval_loss": 1.9388927221298218,
+      "eval_runtime": 5.8021,
+      "eval_samples_per_second": 6.894,
+      "eval_steps_per_second": 0.862,
+      "step": 5175
+    },
+    {
+      "epoch": 46.0,
+      "learning_rate": 8.191304347826088e-07,
+      "loss": 1.8034,
+      "step": 5290
+    },
+    {
+      "epoch": 46.0,
+      "eval_loss": 1.905003309249878,
+      "eval_runtime": 5.7813,
+      "eval_samples_per_second": 6.919,
+      "eval_steps_per_second": 0.865,
+      "step": 5290
+    },
+    {
+      "epoch": 47.0,
+      "learning_rate": 6.191304347826088e-07,
+      "loss": 1.8226,
+      "step": 5405
+    },
+    {
+      "epoch": 47.0,
+      "eval_loss": 1.9226171970367432,
+      "eval_runtime": 5.8014,
+      "eval_samples_per_second": 6.895,
+      "eval_steps_per_second": 0.862,
+      "step": 5405
+    },
+    {
+      "epoch": 48.0,
+      "learning_rate": 4.1913043478260874e-07,
+      "loss": 1.818,
+      "step": 5520
+    },
+    {
+      "epoch": 48.0,
+      "eval_loss": 1.9150111675262451,
+      "eval_runtime": 5.7701,
+      "eval_samples_per_second": 6.932,
+      "eval_steps_per_second": 0.867,
+      "step": 5520
+    },
+    {
+      "epoch": 49.0,
+      "learning_rate": 2.191304347826087e-07,
+      "loss": 1.8148,
+      "step": 5635
+    },
+    {
+      "epoch": 49.0,
+      "eval_loss": 1.9168732166290283,
+      "eval_runtime": 5.7338,
+      "eval_samples_per_second": 6.976,
+      "eval_steps_per_second": 0.872,
+      "step": 5635
+    },
+    {
+      "epoch": 50.0,
+      "learning_rate": 1.91304347826087e-08,
+      "loss": 1.7984,
+      "step": 5750
+    },
+    {
+      "epoch": 50.0,
+      "eval_loss": 1.9223819971084595,
+      "eval_runtime": 5.7595,
+      "eval_samples_per_second": 6.945,
+      "eval_steps_per_second": 0.868,
+      "step": 5750
+    },
+    {
+      "epoch": 50.0,
+      "step": 5750,
+      "total_flos": 1.098949102848e+19,
+      "train_loss": 2.026795845363451,
+      "train_runtime": 4682.5898,
+      "train_samples_per_second": 4.912,
+      "train_steps_per_second": 1.228
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 5750,
+  "num_train_epochs": 50,
+  "save_steps": 500,
+  "total_flos": 1.098949102848e+19,
+  "trial_name": null,
+  "trial_params": null
+}