Training in progress, step 1400

f2fcb6e over 1 year ago

6.71 kB

	{
	"best_metric": 0.40153906255014676,
	"best_model_checkpoint": "/home2/s5432073/language-tech-project/results/ltp-roberta-large-defaultltp-roberta-large-default-0/checkpoint-1200",
	"epoch": 8.284023668639053,
	"global_step": 1400,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 1.18,
	"learning_rate": 9.28348909657321e-06,
	"loss": 0.4442,
	"step": 200
	},
	{
	"epoch": 1.18,
	"eval_f1": 0.14004634931160595,
	"eval_f1_all": [
	0.11111111111111112,
	0.19823008849557522,
	0.0,
	0.0,
	0.5077262693156732,
	0.0,
	0.015037593984962407,
	0.0,
	0.7197452229299364,
	0.6306954436450838,
	0.0,
	0.0,
	0.0,
	0.0,
	0.0,
	0.0,
	0.5973799126637556,
	0.015625,
	0.0,
	0.005376344086021506
	],
	"eval_loss": 0.3573361933231354,
	"eval_runtime": 3.7892,
	"eval_samples_per_second": 500.363,
	"eval_steps_per_second": 15.834,
	"step": 200
	},
	{
	"epoch": 2.37,
	"learning_rate": 8.037383177570094e-06,
	"loss": 0.3303,
	"step": 400
	},
	{
	"epoch": 2.37,
	"eval_f1": 0.26419617591690636,
	"eval_f1_all": [
	0.43804034582132567,
	0.31333333333333335,
	0.0,
	0.0,
	0.616,
	0.03592814371257485,
	0.3128491620111732,
	0.0,
	0.7331058020477816,
	0.5398601398601399,
	0.16580310880829016,
	0.391025641025641,
	0.0,
	0.0,
	0.13119533527696794,
	0.0,
	0.6373056994818653,
	0.6169154228855722,
	0.02643171806167401,
	0.32612966601178783
	],
	"eval_loss": 0.32742321491241455,
	"eval_runtime": 3.2193,
	"eval_samples_per_second": 588.954,
	"eval_steps_per_second": 18.638,
	"step": 400
	},
	{
	"epoch": 3.55,
	"learning_rate": 6.791277258566978e-06,
	"loss": 0.2955,
	"step": 600
	},
	{
	"epoch": 3.55,
	"eval_f1": 0.33856925982901875,
	"eval_f1_all": [
	0.5025125628140703,
	0.5899632802937577,
	0.0,
	0.07407407407407407,
	0.6084275436793423,
	0.0588235294117647,
	0.3567567567567568,
	0.0,
	0.7440944881889764,
	0.6120481927710844,
	0.3916666666666666,
	0.49431818181818177,
	0.0,
	0.015625,
	0.5071868583162218,
	0.06382978723404255,
	0.6857597454256166,
	0.6403940886699507,
	0.10526315789473682,
	0.3206412825651303
	],
	"eval_loss": 0.31045234203338623,
	"eval_runtime": 3.1516,
	"eval_samples_per_second": 601.599,
	"eval_steps_per_second": 19.038,
	"step": 600
	},
	{
	"epoch": 4.73,
	"learning_rate": 5.545171339563863e-06,
	"loss": 0.275,
	"step": 800
	},
	{
	"epoch": 4.73,
	"eval_f1": 0.35946421270983664,
	"eval_f1_all": [
	0.5432692307692307,
	0.5728770595690748,
	0.055944055944055944,
	0.125,
	0.6434782608695652,
	0.11891891891891894,
	0.33513513513513515,
	0.0,
	0.7636594663278272,
	0.638655462184874,
	0.41071428571428564,
	0.5251396648044693,
	0.0,
	0.015503875968992248,
	0.5346733668341709,
	0.07017543859649122,
	0.657762938230384,
	0.6666666666666667,
	0.11244979919678717,
	0.39926062846580407
	],
	"eval_loss": 0.3056282103061676,
	"eval_runtime": 3.1101,
	"eval_samples_per_second": 609.632,
	"eval_steps_per_second": 19.292,
	"step": 800
	},
	{
	"epoch": 5.92,
	"learning_rate": 4.299065420560748e-06,
	"loss": 0.2582,
	"step": 1000
	},
	{
	"epoch": 5.92,
	"eval_f1": 0.3779236416443889,
	"eval_f1_all": [
	0.5119617224880383,
	0.5549872122762148,
	0.09523809523809525,
	0.24793388429752064,
	0.6457739791073124,
	0.10112359550561797,
	0.31351351351351353,
	0.0,
	0.7588785046728972,
	0.6312056737588652,
	0.44999999999999996,
	0.5300546448087431,
	0.0,
	0.015384615384615385,
	0.5868995633187772,
	0.17857142857142858,
	0.6494401378122309,
	0.7022222222222223,
	0.12851405622489961,
	0.45676998368678634
	],
	"eval_loss": 0.30811235308647156,
	"eval_runtime": 3.5499,
	"eval_samples_per_second": 534.102,
	"eval_steps_per_second": 16.902,
	"step": 1000
	},
	{
	"epoch": 7.1,
	"learning_rate": 3.0529595015576325e-06,
	"loss": 0.2446,
	"step": 1200
	},
	{
	"epoch": 7.1,
	"eval_f1": 0.40153906255014676,
	"eval_f1_all": [
	0.5172413793103449,
	0.5871121718377088,
	0.12,
	0.3759398496240602,
	0.630952380952381,
	0.17258883248730966,
	0.3768115942028986,
	0.0,
	0.7563683866753755,
	0.6462513199577613,
	0.4758064516129032,
	0.5527369826435248,
	0.0,
	0.015037593984962405,
	0.5758683729433272,
	0.21203438395415472,
	0.6746794871794872,
	0.7136563876651982,
	0.17777777777777778,
	0.44991789819376027
	],
	"eval_loss": 0.30632713437080383,
	"eval_runtime": 3.2144,
	"eval_samples_per_second": 589.85,
	"eval_steps_per_second": 18.666,
	"step": 1200
	},
	{
	"epoch": 8.28,
	"learning_rate": 1.8068535825545173e-06,
	"loss": 0.2344,
	"step": 1400
	},
	{
	"epoch": 8.28,
	"eval_f1": 0.39818355623683893,
	"eval_f1_all": [
	0.5059665871121718,
	0.6030267753201397,
	0.13071895424836602,
	0.3609022556390977,
	0.6425073457394711,
	0.17616580310880828,
	0.3827751196172249,
	0.0,
	0.7609942638623327,
	0.6363636363636364,
	0.4672131147540983,
	0.5517241379310345,
	0.0,
	0.015151515151515152,
	0.5907099035933392,
	0.14012738853503187,
	0.7006960556844547,
	0.7053571428571428,
	0.1484375,
	0.4448336252189142
	],
	"eval_loss": 0.30558517575263977,
	"eval_runtime": 3.0733,
	"eval_samples_per_second": 616.921,
	"eval_steps_per_second": 19.523,
	"step": 1400
	}
	],
	"max_steps": 1690,
	"num_train_epochs": 10,
	"total_flos": 7696217086325736.0,
	"trial_name": null,
	"trial_params": null
	}