{ "best_metric": 0.5533490180969238, "best_model_checkpoint": "./speecht5_vc_finetuned_accent_coach/checkpoint-11250", "epoch": 10.0, "eval_steps": 1125, "global_step": 11250, "is_hyper_param_search": false, "is_local_process_zero": true, "is_world_process_zero": true, "log_history": [ { "epoch": 0, "eval_loss": 2.9400367736816406, "eval_runtime": 69.9619, "eval_samples_per_second": 128.642, "eval_steps_per_second": 2.015, "step": 0 }, { "epoch": 0.3333333333333333, "grad_norm": 3.1737678050994873, "learning_rate": 9.672e-06, "loss": 1.2333, "step": 375 }, { "epoch": 0.6666666666666666, "grad_norm": 1.4934049844741821, "learning_rate": 9.338666666666667e-06, "loss": 0.8764, "step": 750 }, { "epoch": 1.0, "grad_norm": 1.6652963161468506, "learning_rate": 9.005333333333333e-06, "loss": 0.8126, "step": 1125 }, { "epoch": 1.0, "eval_loss": 0.7220967411994934, "eval_runtime": 68.4329, "eval_samples_per_second": 131.516, "eval_steps_per_second": 2.06, "step": 1125 }, { "epoch": 1.3333333333333333, "grad_norm": 11.310417175292969, "learning_rate": 8.672000000000001e-06, "loss": 0.7725, "step": 1500 }, { "epoch": 1.6666666666666665, "grad_norm": 3.000715732574463, "learning_rate": 8.338666666666667e-06, "loss": 0.7515, "step": 1875 }, { "epoch": 2.0, "grad_norm": 2.3815054893493652, "learning_rate": 8.005333333333335e-06, "loss": 0.729, "step": 2250 }, { "epoch": 2.0, "eval_loss": 0.6587032079696655, "eval_runtime": 68.605, "eval_samples_per_second": 131.186, "eval_steps_per_second": 2.055, "step": 2250 }, { "epoch": 2.3333333333333335, "grad_norm": 1.988136649131775, "learning_rate": 7.672e-06, "loss": 0.7126, "step": 2625 }, { "epoch": 2.6666666666666665, "grad_norm": 1.466122031211853, "learning_rate": 7.338666666666667e-06, "loss": 0.6942, "step": 3000 }, { "epoch": 3.0, "grad_norm": 2.005535364151001, "learning_rate": 7.005333333333334e-06, "loss": 0.6862, "step": 3375 }, { "epoch": 3.0, "eval_loss": 0.6193667650222778, "eval_runtime": 68.605, "eval_samples_per_second": 131.186, "eval_steps_per_second": 2.055, "step": 3375 }, { "epoch": 3.3333333333333335, "grad_norm": 1.8763089179992676, "learning_rate": 6.672000000000001e-06, "loss": 0.6717, "step": 3750 }, { "epoch": 3.6666666666666665, "grad_norm": 1.7833861112594604, "learning_rate": 6.338666666666667e-06, "loss": 0.6661, "step": 4125 }, { "epoch": 4.0, "grad_norm": 2.4906442165374756, "learning_rate": 6.005333333333334e-06, "loss": 0.6631, "step": 4500 }, { "epoch": 4.0, "eval_loss": 0.5971269607543945, "eval_runtime": 68.1546, "eval_samples_per_second": 132.053, "eval_steps_per_second": 2.069, "step": 4500 }, { "epoch": 4.333333333333333, "grad_norm": 1.7730635404586792, "learning_rate": 5.672000000000001e-06, "loss": 0.6483, "step": 4875 }, { "epoch": 4.666666666666667, "grad_norm": 1.2480838298797607, "learning_rate": 5.338666666666668e-06, "loss": 0.6501, "step": 5250 }, { "epoch": 5.0, "grad_norm": 1.0484462976455688, "learning_rate": 5.0053333333333344e-06, "loss": 0.6373, "step": 5625 }, { "epoch": 5.0, "eval_loss": 0.5816481113433838, "eval_runtime": 68.7731, "eval_samples_per_second": 130.865, "eval_steps_per_second": 2.05, "step": 5625 }, { "epoch": 5.333333333333333, "grad_norm": 2.0878376960754395, "learning_rate": 4.672e-06, "loss": 0.6345, "step": 6000 }, { "epoch": 5.666666666666667, "grad_norm": 1.4043112993240356, "learning_rate": 4.338666666666667e-06, "loss": 0.6314, "step": 6375 }, { "epoch": 6.0, "grad_norm": 1.7766762971878052, "learning_rate": 4.005333333333334e-06, "loss": 0.627, "step": 6750 }, { "epoch": 6.0, "eval_loss": 0.5740490555763245, "eval_runtime": 68.3164, "eval_samples_per_second": 131.74, "eval_steps_per_second": 2.064, "step": 6750 }, { "epoch": 6.333333333333333, "grad_norm": 1.0316795110702515, "learning_rate": 3.6720000000000006e-06, "loss": 0.6259, "step": 7125 }, { "epoch": 6.666666666666667, "grad_norm": 2.326396942138672, "learning_rate": 3.338666666666667e-06, "loss": 0.6174, "step": 7500 }, { "epoch": 7.0, "grad_norm": 1.200161099433899, "learning_rate": 3.0053333333333332e-06, "loss": 0.6181, "step": 7875 }, { "epoch": 7.0, "eval_loss": 0.5616703033447266, "eval_runtime": 68.7222, "eval_samples_per_second": 130.962, "eval_steps_per_second": 2.052, "step": 7875 }, { "epoch": 7.333333333333333, "grad_norm": 0.9974250197410583, "learning_rate": 2.672e-06, "loss": 0.613, "step": 8250 }, { "epoch": 7.666666666666667, "grad_norm": 1.6518850326538086, "learning_rate": 2.3386666666666668e-06, "loss": 0.614, "step": 8625 }, { "epoch": 8.0, "grad_norm": 1.4014475345611572, "learning_rate": 2.0053333333333335e-06, "loss": 0.6132, "step": 9000 }, { "epoch": 8.0, "eval_loss": 0.5580485463142395, "eval_runtime": 69.1292, "eval_samples_per_second": 130.191, "eval_steps_per_second": 2.04, "step": 9000 }, { "epoch": 8.333333333333334, "grad_norm": 1.365956425666809, "learning_rate": 1.672e-06, "loss": 0.6174, "step": 9375 }, { "epoch": 8.666666666666666, "grad_norm": 1.8123631477355957, "learning_rate": 1.3386666666666668e-06, "loss": 0.6096, "step": 9750 }, { "epoch": 9.0, "grad_norm": 0.9999153017997742, "learning_rate": 1.0053333333333333e-06, "loss": 0.6057, "step": 10125 }, { "epoch": 9.0, "eval_loss": 0.5539405345916748, "eval_runtime": 68.148, "eval_samples_per_second": 132.066, "eval_steps_per_second": 2.069, "step": 10125 }, { "epoch": 9.333333333333334, "grad_norm": 1.523378849029541, "learning_rate": 6.72e-07, "loss": 0.6044, "step": 10500 }, { "epoch": 9.666666666666666, "grad_norm": 1.636662483215332, "learning_rate": 3.3866666666666673e-07, "loss": 0.6054, "step": 10875 }, { "epoch": 10.0, "grad_norm": 1.8990389108657837, "learning_rate": 5.333333333333334e-09, "loss": 0.6128, "step": 11250 }, { "epoch": 10.0, "eval_loss": 0.5533490180969238, "eval_runtime": 68.943, "eval_samples_per_second": 130.543, "eval_steps_per_second": 2.045, "step": 11250 } ], "logging_steps": 375, "max_steps": 11250, "num_input_tokens_seen": 0, "num_train_epochs": 10, "save_steps": 1125, "stateful_callbacks": { "TrainerControl": { "args": { "should_epoch_stop": false, "should_evaluate": false, "should_log": false, "should_save": true, "should_training_stop": true }, "attributes": {} } }, "total_flos": 9.112937353344005e+19, "train_batch_size": 64, "trial_name": null, "trial_params": null }