End of training

Browse files

Files changed (5) hide show

all_results.json +8 -0
predict_results_fake-news.txt +241 -0
runs/Jul06_20-31-33_dae342af6226/events.out.tfevents.1688676111.dae342af6226.5479.1 +3 -0
train_results.json +8 -0
trainer_state.json +100 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 5.0,
+    "train_loss": 0.17726608804294042,
+    "train_runtime": 569.136,
+    "train_samples": 1120,
+    "train_samples_per_second": 9.839,
+    "train_steps_per_second": 1.23
+}

predict_results_fake-news.txt ADDED Viewed

	@@ -0,0 +1,241 @@

+index	prediction
+0	1
+1	0
+2	1
+3	1
+4	1
+5	1
+6	1
+7	1
+8	0
+9	0
+10	0
+11	0
+12	0
+13	0
+14	1
+15	0
+16	0
+17	0
+18	1
+19	0
+20	0
+21	1
+22	1
+23	0
+24	1
+25	1
+26	1
+27	1
+28	0
+29	1
+30	0
+31	0
+32	1
+33	1
+34	1
+35	1
+36	0
+37	1
+38	0
+39	0
+40	0
+41	1
+42	0
+43	1
+44	0
+45	0
+46	1
+47	0
+48	0
+49	1
+50	0
+51	1
+52	0
+53	1
+54	1
+55	1
+56	0
+57	1
+58	1
+59	1
+60	1
+61	1
+62	1
+63	0
+64	1
+65	0
+66	1
+67	0
+68	0
+69	1
+70	0
+71	0
+72	1
+73	1
+74	1
+75	0
+76	1
+77	1
+78	0
+79	1
+80	1
+81	0
+82	1
+83	1
+84	1
+85	1
+86	0
+87	1
+88	0
+89	1
+90	0
+91	1
+92	1
+93	1
+94	0
+95	0
+96	1
+97	0
+98	1
+99	1
+100	1
+101	0
+102	0
+103	0
+104	1
+105	1
+106	0
+107	1
+108	0
+109	1
+110	0
+111	0
+112	1
+113	0
+114	1
+115	1
+116	0
+117	0
+118	0
+119	0
+120	0
+121	1
+122	0
+123	1
+124	1
+125	1
+126	0
+127	1
+128	1
+129	0
+130	0
+131	1
+132	0
+133	0
+134	1
+135	1
+136	1
+137	1
+138	0
+139	0
+140	0
+141	0
+142	0
+143	0
+144	1
+145	0
+146	0
+147	1
+148	1
+149	0
+150	0
+151	1
+152	0
+153	1
+154	0
+155	0
+156	1
+157	1
+158	1
+159	1
+160	1
+161	0
+162	0
+163	0
+164	1
+165	1
+166	0
+167	0
+168	0
+169	1
+170	1
+171	1
+172	1
+173	1
+174	1
+175	0
+176	0
+177	1
+178	0
+179	1
+180	0
+181	1
+182	1
+183	0
+184	1
+185	1
+186	0
+187	0
+188	1
+189	0
+190	0
+191	0
+192	0
+193	1
+194	0
+195	1
+196	0
+197	1
+198	0
+199	1
+200	0
+201	1
+202	1
+203	1
+204	0
+205	1
+206	0
+207	0
+208	0
+209	0
+210	1
+211	0
+212	0
+213	0
+214	0
+215	1
+216	0
+217	0
+218	1
+219	1
+220	1
+221	0
+222	1
+223	0
+224	0
+225	0
+226	1
+227	1
+228	0
+229	1
+230	0
+231	0
+232	1
+233	0
+234	1
+235	0
+236	1
+237	0
+238	0
+239	1

runs/Jul06_20-31-33_dae342af6226/events.out.tfevents.1688676111.dae342af6226.5479.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a8aec721ed595bf272940f45ec7ce617eb2057168a25d50e0a6ef009c5761f88
+size 405

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 5.0,
+    "train_loss": 0.17726608804294042,
+    "train_runtime": 569.136,
+    "train_samples": 1120,
+    "train_samples_per_second": 9.839,
+    "train_steps_per_second": 1.23
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,100 @@

+{
+  "best_metric": 0.8968609865470851,
+  "best_model_checkpoint": "models/fake-news-bert-base-spanish-wwm-cased/checkpoint-420",
+  "epoch": 5.0,
+  "global_step": 700,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 1.6000000000000003e-05,
+      "loss": 0.5098,
+      "step": 140
+    },
+    {
+      "epoch": 1.0,
+      "eval_f1": 0.7340425531914895,
+      "eval_loss": 0.49776777625083923,
+      "eval_runtime": 7.7068,
+      "eval_samples_per_second": 31.141,
+      "eval_steps_per_second": 3.893,
+      "step": 140
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 1.2e-05,
+      "loss": 0.2473,
+      "step": 280
+    },
+    {
+      "epoch": 2.0,
+      "eval_f1": 0.8828828828828829,
+      "eval_loss": 0.38877564668655396,
+      "eval_runtime": 7.6671,
+      "eval_samples_per_second": 31.303,
+      "eval_steps_per_second": 3.913,
+      "step": 280
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 8.000000000000001e-06,
+      "loss": 0.0908,
+      "step": 420
+    },
+    {
+      "epoch": 3.0,
+      "eval_f1": 0.8968609865470851,
+      "eval_loss": 0.44203802943229675,
+      "eval_runtime": 7.6262,
+      "eval_samples_per_second": 31.471,
+      "eval_steps_per_second": 3.934,
+      "step": 420
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 4.000000000000001e-06,
+      "loss": 0.0332,
+      "step": 560
+    },
+    {
+      "epoch": 4.0,
+      "eval_f1": 0.8796296296296298,
+      "eval_loss": 0.5603806376457214,
+      "eval_runtime": 7.5746,
+      "eval_samples_per_second": 31.685,
+      "eval_steps_per_second": 3.961,
+      "step": 560
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 0.0,
+      "loss": 0.0052,
+      "step": 700
+    },
+    {
+      "epoch": 5.0,
+      "eval_f1": 0.8956521739130435,
+      "eval_loss": 0.5154075622558594,
+      "eval_runtime": 7.5769,
+      "eval_samples_per_second": 31.675,
+      "eval_steps_per_second": 3.959,
+      "step": 700
+    },
+    {
+      "epoch": 5.0,
+      "step": 700,
+      "total_flos": 1473421910016000.0,
+      "train_loss": 0.17726608804294042,
+      "train_runtime": 569.136,
+      "train_samples_per_second": 9.839,
+      "train_steps_per_second": 1.23
+    }
+  ],
+  "max_steps": 700,
+  "num_train_epochs": 5,
+  "total_flos": 1473421910016000.0,
+  "trial_name": null,
+  "trial_params": null
+}