End of training

Browse files

Files changed (5) hide show

README.md +6 -1
all_results.json +12 -12
eval_results.json +6 -6
train_results.json +7 -7
trainer_state.json +29 -29

README.md CHANGED Viewed

@@ -2,6 +2,8 @@
 license: cc-by-nc-4.0
 library_name: peft
 tags:
 - generated_from_trainer
 base_model: facebook/musicgen-melody-large
 model-index:
@@ -16,7 +18,10 @@ should probably proofread and complete it, then remove this comment. -->
 [<img src="https://raw.githubusercontent.com/wandb/assets/main/wandb-github-badge-28.svg" alt="Visualize in Weights & Biases" width="200" height="32"/>](https://wandb.ai/sanchit-gandhi/black-eyed-peas/runs/axj3xcy3)
 # black-eyed-peas-v1-lower-lr
-This model is a fine-tuned version of [facebook/musicgen-melody-large](https://huggingface.co/facebook/musicgen-melody-large) on an unknown dataset.
 ## Model description

 license: cc-by-nc-4.0
 library_name: peft
 tags:
+- text-to-audio
+- sweet-dreambooths/black-eyed-peas-v1
 - generated_from_trainer
 base_model: facebook/musicgen-melody-large
 model-index:
 [<img src="https://raw.githubusercontent.com/wandb/assets/main/wandb-github-badge-28.svg" alt="Visualize in Weights & Biases" width="200" height="32"/>](https://wandb.ai/sanchit-gandhi/black-eyed-peas/runs/axj3xcy3)
 # black-eyed-peas-v1-lower-lr
+This model is a fine-tuned version of [facebook/musicgen-melody-large](https://huggingface.co/facebook/musicgen-melody-large) on the SWEET-DREAMBOOTHS/BLACK-EYED-PEAS-V1 - DEFAULT dataset.
+It achieves the following results on the evaluation set:
+- Loss: 3.0146
+- Clap: 0.1869
 ## Model description

all_results.json CHANGED Viewed

@@ -1,15 +1,15 @@
 {
-    "epoch": 0.9256198347107438,
-    "eval_clap": 0.15883205831050873,
-    "eval_loss": 3.0003108978271484,
-    "eval_runtime": 151.2253,
     "eval_samples": 8,
-    "eval_samples_per_second": 0.053,
-    "eval_steps_per_second": 0.053,
-    "total_flos": 59812992852240.0,
-    "train_loss": 10.079636437552315,
-    "train_runtime": 297.4065,
-    "train_samples": 121,
-    "train_samples_per_second": 0.407,
-    "train_steps_per_second": 0.024
 }

 {
+    "epoch": 0.896,
+    "eval_clap": 0.18686869740486145,
+    "eval_loss": 3.0145649909973145,
+    "eval_runtime": 154.2457,
     "eval_samples": 8,
+    "eval_samples_per_second": 0.052,
+    "eval_steps_per_second": 0.052,
+    "total_flos": 59562467227728.0,
+    "train_loss": 10.095086097717285,
+    "train_runtime": 284.5172,
+    "train_samples": 125,
+    "train_samples_per_second": 0.439,
+    "train_steps_per_second": 0.025
 }

eval_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-    "epoch": 0.9256198347107438,
-    "eval_clap": 0.15883205831050873,
-    "eval_loss": 3.0003108978271484,
-    "eval_runtime": 151.2253,
     "eval_samples": 8,
-    "eval_samples_per_second": 0.053,
-    "eval_steps_per_second": 0.053
 }

 {
+    "epoch": 0.896,
+    "eval_clap": 0.18686869740486145,
+    "eval_loss": 3.0145649909973145,
+    "eval_runtime": 154.2457,
     "eval_samples": 8,
+    "eval_samples_per_second": 0.052,
+    "eval_steps_per_second": 0.052
 }

train_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-    "epoch": 0.9256198347107438,
-    "total_flos": 59812992852240.0,
-    "train_loss": 10.079636437552315,
-    "train_runtime": 297.4065,
-    "train_samples": 121,
-    "train_samples_per_second": 0.407,
-    "train_steps_per_second": 0.024
 }

 {
+    "epoch": 0.896,
+    "total_flos": 59562467227728.0,
+    "train_loss": 10.095086097717285,
+    "train_runtime": 284.5172,
+    "train_samples": 125,
+    "train_samples_per_second": 0.439,
+    "train_steps_per_second": 0.025
 }

trainer_state.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.9256198347107438,
   "eval_steps": 30,
   "global_step": 7,
   "is_hyper_param_search": false,
@@ -9,62 +9,62 @@
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.1322314049586777,
-      "grad_norm": 1.7518984079360962,
       "learning_rate": 2.5714285714285714e-05,
-      "loss": 10.1004,
       "step": 1
     },
     {
-      "epoch": 0.2644628099173554,
-      "grad_norm": 1.6565409898757935,
       "learning_rate": 2.1428571428571428e-05,
-      "loss": 10.1618,
       "step": 2
     },
     {
-      "epoch": 0.39669421487603307,
-      "grad_norm": 1.7153880596160889,
       "learning_rate": 1.7142857142857142e-05,
-      "loss": 10.1003,
       "step": 3
     },
     {
-      "epoch": 0.5289256198347108,
-      "grad_norm": 2.0842509269714355,
       "learning_rate": 1.2857142857142857e-05,
-      "loss": 10.1771,
       "step": 4
     },
     {
-      "epoch": 0.6611570247933884,
-      "grad_norm": 2.1643295288085938,
       "learning_rate": 8.571428571428571e-06,
-      "loss": 10.0969,
       "step": 5
     },
     {
-      "epoch": 0.7933884297520661,
-      "grad_norm": 1.9889191389083862,
       "learning_rate": 4.2857142857142855e-06,
-      "loss": 9.9853,
       "step": 6
     },
     {
-      "epoch": 0.9256198347107438,
-      "grad_norm": 1.9943231344223022,
       "learning_rate": 0.0,
-      "loss": 9.9356,
       "step": 7
     },
     {
-      "epoch": 0.9256198347107438,
       "step": 7,
-      "total_flos": 59812992852240.0,
-      "train_loss": 10.079636437552315,
-      "train_runtime": 297.4065,
-      "train_samples_per_second": 0.407,
-      "train_steps_per_second": 0.024
     }
   ],
   "logging_steps": 1.0,
@@ -84,7 +84,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 59812992852240.0,
   "train_batch_size": 1,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.896,
   "eval_steps": 30,
   "global_step": 7,
   "is_hyper_param_search": false,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.128,
+      "grad_norm": 1.6912785768508911,
       "learning_rate": 2.5714285714285714e-05,
+      "loss": 10.2062,
       "step": 1
     },
     {
+      "epoch": 0.256,
+      "grad_norm": 1.6357407569885254,
       "learning_rate": 2.1428571428571428e-05,
+      "loss": 10.1211,
       "step": 2
     },
     {
+      "epoch": 0.384,
+      "grad_norm": 1.9014874696731567,
       "learning_rate": 1.7142857142857142e-05,
+      "loss": 10.1014,
       "step": 3
     },
     {
+      "epoch": 0.512,
+      "grad_norm": 1.8140469789505005,
       "learning_rate": 1.2857142857142857e-05,
+      "loss": 10.0723,
       "step": 4
     },
     {
+      "epoch": 0.64,
+      "grad_norm": 1.9242441654205322,
       "learning_rate": 8.571428571428571e-06,
+      "loss": 9.9854,
       "step": 5
     },
     {
+      "epoch": 0.768,
+      "grad_norm": 2.1129188537597656,
       "learning_rate": 4.2857142857142855e-06,
+      "loss": 10.1039,
       "step": 6
     },
     {
+      "epoch": 0.896,
+      "grad_norm": 2.2516403198242188,
       "learning_rate": 0.0,
+      "loss": 10.0753,
       "step": 7
     },
     {
+      "epoch": 0.896,
       "step": 7,
+      "total_flos": 59562467227728.0,
+      "train_loss": 10.095086097717285,
+      "train_runtime": 284.5172,
+      "train_samples_per_second": 0.439,
+      "train_steps_per_second": 0.025
     }
   ],
   "logging_steps": 1.0,
       "attributes": {}
     }
   },
+  "total_flos": 59562467227728.0,
   "train_batch_size": 1,
   "trial_name": null,
   "trial_params": null