diff --git "a/last-checkpoint/trainer_state.json" "b/last-checkpoint/trainer_state.json"
--- "a/last-checkpoint/trainer_state.json"
+++ "b/last-checkpoint/trainer_state.json"
@@ -1,9 +1,9 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.12948755300896703,
+  "epoch": 0.388462659026901,
   "eval_steps": 5,
-  "global_step": 500,
+  "global_step": 1500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -5224,6 +5224,10406 @@
       "eval_samples_per_second": 3.051,
       "eval_steps_per_second": 0.139,
       "step": 500
+    },
+    {
+      "epoch": 0.12974652811498494,
+      "grad_norm": 5.434972663555558,
+      "learning_rate": 1.246681703653885e-06,
+      "loss": 0.3905,
+      "step": 501
+    },
+    {
+      "epoch": 0.13000550322100288,
+      "grad_norm": 4.58952122757678,
+      "learning_rate": 1.2466232853035596e-06,
+      "loss": 0.5206,
+      "step": 502
+    },
+    {
+      "epoch": 0.13026447832702082,
+      "grad_norm": 7.372300675268678,
+      "learning_rate": 1.246564358597927e-06,
+      "loss": 0.4235,
+      "step": 503
+    },
+    {
+      "epoch": 0.13052345343303876,
+      "grad_norm": 4.142484155230843,
+      "learning_rate": 1.2465049235851768e-06,
+      "loss": 0.4143,
+      "step": 504
+    },
+    {
+      "epoch": 0.1307824285390567,
+      "grad_norm": 10.4043112649764,
+      "learning_rate": 1.2464449803139142e-06,
+      "loss": 0.4165,
+      "step": 505
+    },
+    {
+      "epoch": 0.1307824285390567,
+      "eval_PRM Accuracy": 0.8018867924528302,
+      "eval_PRM F1": 0.8609271523178808,
+      "eval_PRM F1 AUC": 0.826348873755893,
+      "eval_PRM F1 AUC (fixed)": 0.6356731272917758,
+      "eval_PRM F1 Neg": 0.6557377049180327,
+      "eval_PRM NPV": 0.5263157894736842,
+      "eval_PRM Precision": 0.9558823529411765,
+      "eval_PRM Recall": 0.7831325301204819,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.3677997589111328,
+      "eval_runtime": 15.0664,
+      "eval_samples_per_second": 2.92,
+      "eval_steps_per_second": 0.133,
+      "step": 505
+    },
+    {
+      "epoch": 0.1310414036450746,
+      "grad_norm": 9.922312215454863,
+      "learning_rate": 1.2463845288331596e-06,
+      "loss": 0.3574,
+      "step": 506
+    },
+    {
+      "epoch": 0.13130037875109254,
+      "grad_norm": 6.670265269248358,
+      "learning_rate": 1.2463235691923503e-06,
+      "loss": 0.4276,
+      "step": 507
+    },
+    {
+      "epoch": 0.13155935385711048,
+      "grad_norm": 7.307285016571106,
+      "learning_rate": 1.2462621014413373e-06,
+      "loss": 0.3718,
+      "step": 508
+    },
+    {
+      "epoch": 0.13181832896312842,
+      "grad_norm": 7.0173057930362095,
+      "learning_rate": 1.2462001256303888e-06,
+      "loss": 0.3169,
+      "step": 509
+    },
+    {
+      "epoch": 0.13207730406914636,
+      "grad_norm": 5.3637100732393135,
+      "learning_rate": 1.2461376418101877e-06,
+      "loss": 0.3718,
+      "step": 510
+    },
+    {
+      "epoch": 0.13207730406914636,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.644578313253012,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.323575884103775,
+      "eval_runtime": 14.7572,
+      "eval_samples_per_second": 2.982,
+      "eval_steps_per_second": 0.136,
+      "step": 510
+    },
+    {
+      "epoch": 0.1323362791751643,
+      "grad_norm": 3.949656761693001,
+      "learning_rate": 1.246074650031832e-06,
+      "loss": 0.3234,
+      "step": 511
+    },
+    {
+      "epoch": 0.1325952542811822,
+      "grad_norm": 4.248192544379391,
+      "learning_rate": 1.2460111503468363e-06,
+      "loss": 0.4262,
+      "step": 512
+    },
+    {
+      "epoch": 0.13285422938720015,
+      "grad_norm": 3.891048084630212,
+      "learning_rate": 1.245947142807129e-06,
+      "loss": 0.3222,
+      "step": 513
+    },
+    {
+      "epoch": 0.1331132044932181,
+      "grad_norm": 4.148693831751682,
+      "learning_rate": 1.2458826274650552e-06,
+      "loss": 0.3477,
+      "step": 514
+    },
+    {
+      "epoch": 0.13337217959923603,
+      "grad_norm": 6.540096957578557,
+      "learning_rate": 1.2458176043733744e-06,
+      "loss": 0.3139,
+      "step": 515
+    },
+    {
+      "epoch": 0.13337217959923603,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8930817610062893,
+      "eval_PRM F1 AUC": 0.819015191199581,
+      "eval_PRM F1 AUC (fixed)": 0.6547930853850183,
+      "eval_PRM F1 Neg": 0.6792452830188679,
+      "eval_PRM NPV": 0.6,
+      "eval_PRM Precision": 0.9342105263157895,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.3057812452316284,
+      "eval_runtime": 14.6202,
+      "eval_samples_per_second": 3.01,
+      "eval_steps_per_second": 0.137,
+      "step": 515
+    },
+    {
+      "epoch": 0.13363115470525397,
+      "grad_norm": 4.703165811412571,
+      "learning_rate": 1.2457520735852618e-06,
+      "loss": 0.4059,
+      "step": 516
+    },
+    {
+      "epoch": 0.13389012981127188,
+      "grad_norm": 6.028053885312962,
+      "learning_rate": 1.2456860351543074e-06,
+      "loss": 0.4418,
+      "step": 517
+    },
+    {
+      "epoch": 0.13414910491728982,
+      "grad_norm": 3.816982454189665,
+      "learning_rate": 1.2456194891345167e-06,
+      "loss": 0.3853,
+      "step": 518
+    },
+    {
+      "epoch": 0.13440808002330776,
+      "grad_norm": 4.1845349649740395,
+      "learning_rate": 1.2455524355803102e-06,
+      "loss": 0.3931,
+      "step": 519
+    },
+    {
+      "epoch": 0.1346670551293257,
+      "grad_norm": 5.069175129972723,
+      "learning_rate": 1.2454848745465234e-06,
+      "loss": 0.3706,
+      "step": 520
+    },
+    {
+      "epoch": 0.1346670551293257,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8974358974358975,
+      "eval_PRM F1 AUC": 0.8564693556836039,
+      "eval_PRM F1 AUC (fixed)": 0.6519119958093242,
+      "eval_PRM F1 Neg": 0.7142857142857143,
+      "eval_PRM NPV": 0.6060606060606061,
+      "eval_PRM Precision": 0.958904109589041,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.31878462433815,
+      "eval_runtime": 14.9989,
+      "eval_samples_per_second": 2.934,
+      "eval_steps_per_second": 0.133,
+      "step": 520
+    },
+    {
+      "epoch": 0.13492603023534364,
+      "grad_norm": 5.554389828528387,
+      "learning_rate": 1.2454168060884065e-06,
+      "loss": 0.3495,
+      "step": 521
+    },
+    {
+      "epoch": 0.13518500534136157,
+      "grad_norm": 4.269474285741495,
+      "learning_rate": 1.2453482302616254e-06,
+      "loss": 0.351,
+      "step": 522
+    },
+    {
+      "epoch": 0.1354439804473795,
+      "grad_norm": 4.285143074157683,
+      "learning_rate": 1.2452791471222605e-06,
+      "loss": 0.4821,
+      "step": 523
+    },
+    {
+      "epoch": 0.13570295555339743,
+      "grad_norm": 4.800867083848419,
+      "learning_rate": 1.2452095567268069e-06,
+      "loss": 0.3048,
+      "step": 524
+    },
+    {
+      "epoch": 0.13596193065941536,
+      "grad_norm": 5.37470151118888,
+      "learning_rate": 1.2451394591321747e-06,
+      "loss": 0.4761,
+      "step": 525
+    },
+    {
+      "epoch": 0.13596193065941536,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8930817610062893,
+      "eval_PRM F1 AUC": 0.819015191199581,
+      "eval_PRM F1 AUC (fixed)": 0.6521739130434783,
+      "eval_PRM F1 Neg": 0.6792452830188679,
+      "eval_PRM NPV": 0.6,
+      "eval_PRM Precision": 0.9342105263157895,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.3053739368915558,
+      "eval_runtime": 14.8675,
+      "eval_samples_per_second": 2.959,
+      "eval_steps_per_second": 0.135,
+      "step": 525
+    },
+    {
+      "epoch": 0.1362209057654333,
+      "grad_norm": 4.76701924346624,
+      "learning_rate": 1.2450688543956887e-06,
+      "loss": 0.416,
+      "step": 526
+    },
+    {
+      "epoch": 0.13647988087145124,
+      "grad_norm": 4.626643528344459,
+      "learning_rate": 1.2449977425750886e-06,
+      "loss": 0.3598,
+      "step": 527
+    },
+    {
+      "epoch": 0.13673885597746915,
+      "grad_norm": 8.703126246641308,
+      "learning_rate": 1.244926123728529e-06,
+      "loss": 0.3911,
+      "step": 528
+    },
+    {
+      "epoch": 0.1369978310834871,
+      "grad_norm": 15.454895749771413,
+      "learning_rate": 1.2448539979145786e-06,
+      "loss": 0.4538,
+      "step": 529
+    },
+    {
+      "epoch": 0.13725680618950503,
+      "grad_norm": 3.4674946395586135,
+      "learning_rate": 1.2447813651922208e-06,
+      "loss": 0.34,
+      "step": 530
+    },
+    {
+      "epoch": 0.13725680618950503,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8944099378881988,
+      "eval_PRM F1 AUC": 0.8033001571503404,
+      "eval_PRM F1 AUC (fixed)": 0.6511262441068622,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.6071428571428571,
+      "eval_PRM Precision": 0.9230769230769231,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.7391304347826086,
+      "eval_loss": 0.3079970180988312,
+      "eval_runtime": 14.6555,
+      "eval_samples_per_second": 3.002,
+      "eval_steps_per_second": 0.136,
+      "step": 530
+    },
+    {
+      "epoch": 0.13751578129552297,
+      "grad_norm": 9.901461765314394,
+      "learning_rate": 1.2447082256208538e-06,
+      "loss": 0.4309,
+      "step": 531
+    },
+    {
+      "epoch": 0.1377747564015409,
+      "grad_norm": 8.819595922470516,
+      "learning_rate": 1.2446345792602901e-06,
+      "loss": 0.3939,
+      "step": 532
+    },
+    {
+      "epoch": 0.13803373150755885,
+      "grad_norm": 7.240407887637497,
+      "learning_rate": 1.244560426170757e-06,
+      "loss": 0.426,
+      "step": 533
+    },
+    {
+      "epoch": 0.13829270661357676,
+      "grad_norm": 3.304557932787079,
+      "learning_rate": 1.2444857664128957e-06,
+      "loss": 0.3499,
+      "step": 534
+    },
+    {
+      "epoch": 0.1385516817195947,
+      "grad_norm": 4.779209710817938,
+      "learning_rate": 1.2444106000477619e-06,
+      "loss": 0.3743,
+      "step": 535
+    },
+    {
+      "epoch": 0.1385516817195947,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.6550550026191724,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.331030011177063,
+      "eval_runtime": 14.3834,
+      "eval_samples_per_second": 3.059,
+      "eval_steps_per_second": 0.139,
+      "step": 535
+    },
+    {
+      "epoch": 0.13881065682561264,
+      "grad_norm": 5.984315015375788,
+      "learning_rate": 1.2443349271368257e-06,
+      "loss": 0.2657,
+      "step": 536
+    },
+    {
+      "epoch": 0.13906963193163058,
+      "grad_norm": 8.492618114157318,
+      "learning_rate": 1.2442587477419717e-06,
+      "loss": 0.3658,
+      "step": 537
+    },
+    {
+      "epoch": 0.13932860703764852,
+      "grad_norm": 9.882539638982529,
+      "learning_rate": 1.244182061925498e-06,
+      "loss": 0.4839,
+      "step": 538
+    },
+    {
+      "epoch": 0.13958758214366643,
+      "grad_norm": 4.006257788106991,
+      "learning_rate": 1.2441048697501174e-06,
+      "loss": 0.4156,
+      "step": 539
+    },
+    {
+      "epoch": 0.13984655724968437,
+      "grad_norm": 6.065415435767625,
+      "learning_rate": 1.2440271712789568e-06,
+      "loss": 0.4337,
+      "step": 540
+    },
+    {
+      "epoch": 0.13984655724968437,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8987341772151899,
+      "eval_PRM F1 AUC": 0.8407543216343635,
+      "eval_PRM F1 AUC (fixed)": 0.6665793609219487,
+      "eval_PRM F1 Neg": 0.7037037037037037,
+      "eval_PRM NPV": 0.6129032258064516,
+      "eval_PRM Precision": 0.9466666666666667,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.31409063935279846,
+      "eval_runtime": 14.4095,
+      "eval_samples_per_second": 3.054,
+      "eval_steps_per_second": 0.139,
+      "step": 540
+    },
+    {
+      "epoch": 0.1401055323557023,
+      "grad_norm": 8.055749515946466,
+      "learning_rate": 1.2439489665755566e-06,
+      "loss": 0.4103,
+      "step": 541
+    },
+    {
+      "epoch": 0.14036450746172024,
+      "grad_norm": 3.159244262365573,
+      "learning_rate": 1.243870255703872e-06,
+      "loss": 0.2871,
+      "step": 542
+    },
+    {
+      "epoch": 0.14062348256773818,
+      "grad_norm": 3.3484268018384755,
+      "learning_rate": 1.2437910387282715e-06,
+      "loss": 0.3617,
+      "step": 543
+    },
+    {
+      "epoch": 0.14088245767375612,
+      "grad_norm": 8.017493622586152,
+      "learning_rate": 1.2437113157135375e-06,
+      "loss": 0.344,
+      "step": 544
+    },
+    {
+      "epoch": 0.14114143277977403,
+      "grad_norm": 8.661634985456647,
+      "learning_rate": 1.2436310867248668e-06,
+      "loss": 0.4113,
+      "step": 545
+    },
+    {
+      "epoch": 0.14114143277977403,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8987341772151899,
+      "eval_PRM F1 AUC": 0.8407543216343635,
+      "eval_PRM F1 AUC (fixed)": 0.6678889470927187,
+      "eval_PRM F1 Neg": 0.7037037037037037,
+      "eval_PRM NPV": 0.6129032258064516,
+      "eval_PRM Precision": 0.9466666666666667,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.31337836384773254,
+      "eval_runtime": 14.6079,
+      "eval_samples_per_second": 3.012,
+      "eval_steps_per_second": 0.137,
+      "step": 545
+    },
+    {
+      "epoch": 0.14140040788579197,
+      "grad_norm": 4.4569376746391445,
+      "learning_rate": 1.2435503518278695e-06,
+      "loss": 0.3847,
+      "step": 546
+    },
+    {
+      "epoch": 0.1416593829918099,
+      "grad_norm": 3.5855721585468143,
+      "learning_rate": 1.2434691110885695e-06,
+      "loss": 0.3407,
+      "step": 547
+    },
+    {
+      "epoch": 0.14191835809782785,
+      "grad_norm": 6.692845918255269,
+      "learning_rate": 1.2433873645734042e-06,
+      "loss": 0.5017,
+      "step": 548
+    },
+    {
+      "epoch": 0.1421773332038458,
+      "grad_norm": 4.714823671241315,
+      "learning_rate": 1.243305112349225e-06,
+      "loss": 0.377,
+      "step": 549
+    },
+    {
+      "epoch": 0.1424363083098637,
+      "grad_norm": 10.08925546130851,
+      "learning_rate": 1.2432223544832969e-06,
+      "loss": 0.4127,
+      "step": 550
+    },
+    {
+      "epoch": 0.1424363083098637,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.9,
+      "eval_PRM F1 AUC": 0.8250392875851232,
+      "eval_PRM F1 AUC (fixed)": 0.6571503404924044,
+      "eval_PRM F1 Neg": 0.6923076923076923,
+      "eval_PRM NPV": 0.6206896551724138,
+      "eval_PRM Precision": 0.935064935064935,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.30864760279655457,
+      "eval_runtime": 14.6728,
+      "eval_samples_per_second": 2.999,
+      "eval_steps_per_second": 0.136,
+      "step": 550
+    },
+    {
+      "epoch": 0.14269528341588164,
+      "grad_norm": 9.255856783180022,
+      "learning_rate": 1.2431390910432978e-06,
+      "loss": 0.4187,
+      "step": 551
+    },
+    {
+      "epoch": 0.14295425852189958,
+      "grad_norm": 3.203425763387509,
+      "learning_rate": 1.2430553220973196e-06,
+      "loss": 0.344,
+      "step": 552
+    },
+    {
+      "epoch": 0.14321323362791752,
+      "grad_norm": 7.163800749072193,
+      "learning_rate": 1.2429710477138676e-06,
+      "loss": 0.3816,
+      "step": 553
+    },
+    {
+      "epoch": 0.14347220873393546,
+      "grad_norm": 3.4812956449664845,
+      "learning_rate": 1.24288626796186e-06,
+      "loss": 0.3907,
+      "step": 554
+    },
+    {
+      "epoch": 0.1437311838399534,
+      "grad_norm": 7.383612072825209,
+      "learning_rate": 1.2428009829106288e-06,
+      "loss": 0.438,
+      "step": 555
+    },
+    {
+      "epoch": 0.1437311838399534,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8974358974358975,
+      "eval_PRM F1 AUC": 0.8564693556836039,
+      "eval_PRM F1 AUC (fixed)": 0.6568884232582504,
+      "eval_PRM F1 Neg": 0.7142857142857143,
+      "eval_PRM NPV": 0.6060606060606061,
+      "eval_PRM Precision": 0.958904109589041,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.3244212865829468,
+      "eval_runtime": 14.2781,
+      "eval_samples_per_second": 3.082,
+      "eval_steps_per_second": 0.14,
+      "step": 555
+    },
+    {
+      "epoch": 0.1439901589459713,
+      "grad_norm": 5.631807558276998,
+      "learning_rate": 1.2427151926299187e-06,
+      "loss": 0.3592,
+      "step": 556
+    },
+    {
+      "epoch": 0.14424913405198925,
+      "grad_norm": 5.0220728120088145,
+      "learning_rate": 1.2426288971898881e-06,
+      "loss": 0.4078,
+      "step": 557
+    },
+    {
+      "epoch": 0.1445081091580072,
+      "grad_norm": 9.058383349897746,
+      "learning_rate": 1.2425420966611081e-06,
+      "loss": 0.3206,
+      "step": 558
+    },
+    {
+      "epoch": 0.14476708426402513,
+      "grad_norm": 7.986430368212883,
+      "learning_rate": 1.2424547911145635e-06,
+      "loss": 0.3563,
+      "step": 559
+    },
+    {
+      "epoch": 0.14502605937004306,
+      "grad_norm": 3.5609507470899473,
+      "learning_rate": 1.2423669806216509e-06,
+      "loss": 0.4017,
+      "step": 560
+    },
+    {
+      "epoch": 0.14502605937004306,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.6705081194342588,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.31759682297706604,
+      "eval_runtime": 14.5424,
+      "eval_samples_per_second": 3.026,
+      "eval_steps_per_second": 0.138,
+      "step": 560
+    },
+    {
+      "epoch": 0.14528503447606098,
+      "grad_norm": 9.331894617265462,
+      "learning_rate": 1.242278665254181e-06,
+      "loss": 0.3495,
+      "step": 561
+    },
+    {
+      "epoch": 0.14554400958207891,
+      "grad_norm": 4.2029122364941855,
+      "learning_rate": 1.2421898450843768e-06,
+      "loss": 0.4254,
+      "step": 562
+    },
+    {
+      "epoch": 0.14580298468809685,
+      "grad_norm": 3.7627145658128334,
+      "learning_rate": 1.2421005201848744e-06,
+      "loss": 0.3512,
+      "step": 563
+    },
+    {
+      "epoch": 0.1460619597941148,
+      "grad_norm": 7.780938416484376,
+      "learning_rate": 1.2420106906287224e-06,
+      "loss": 0.3139,
+      "step": 564
+    },
+    {
+      "epoch": 0.14632093490013273,
+      "grad_norm": 5.945589615268719,
+      "learning_rate": 1.2419203564893822e-06,
+      "loss": 0.4031,
+      "step": 565
+    },
+    {
+      "epoch": 0.14632093490013273,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.9079754601226994,
+      "eval_PRM F1 AUC": 0.8153483499214248,
+      "eval_PRM F1 AUC (fixed)": 0.6846516500785752,
+      "eval_PRM F1 Neg": 0.6938775510204082,
+      "eval_PRM NPV": 0.6538461538461539,
+      "eval_PRM Precision": 0.925,
+      "eval_PRM Recall": 0.891566265060241,
+      "eval_PRM Specificty": 0.7391304347826086,
+      "eval_loss": 0.300191730260849,
+      "eval_runtime": 14.3339,
+      "eval_samples_per_second": 3.07,
+      "eval_steps_per_second": 0.14,
+      "step": 565
+    },
+    {
+      "epoch": 0.14657991000615067,
+      "grad_norm": 6.2263899172585955,
+      "learning_rate": 1.241829517840728e-06,
+      "loss": 0.3507,
+      "step": 566
+    },
+    {
+      "epoch": 0.14683888511216858,
+      "grad_norm": 6.387650973352577,
+      "learning_rate": 1.2417381747570464e-06,
+      "loss": 0.3567,
+      "step": 567
+    },
+    {
+      "epoch": 0.14709786021818652,
+      "grad_norm": 6.671960513858668,
+      "learning_rate": 1.2416463273130364e-06,
+      "loss": 0.3629,
+      "step": 568
+    },
+    {
+      "epoch": 0.14735683532420446,
+      "grad_norm": 7.090385235466389,
+      "learning_rate": 1.24155397558381e-06,
+      "loss": 0.4472,
+      "step": 569
+    },
+    {
+      "epoch": 0.1476158104302224,
+      "grad_norm": 5.756477153036491,
+      "learning_rate": 1.2414611196448906e-06,
+      "loss": 0.4065,
+      "step": 570
+    },
+    {
+      "epoch": 0.1476158104302224,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.680460974332111,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.3101547360420227,
+      "eval_runtime": 14.3796,
+      "eval_samples_per_second": 3.06,
+      "eval_steps_per_second": 0.139,
+      "step": 570
+    },
+    {
+      "epoch": 0.14787478553624034,
+      "grad_norm": 9.003905398536311,
+      "learning_rate": 1.2413677595722154e-06,
+      "loss": 0.3899,
+      "step": 571
+    },
+    {
+      "epoch": 0.14813376064225825,
+      "grad_norm": 4.523238842150813,
+      "learning_rate": 1.241273895442132e-06,
+      "loss": 0.3687,
+      "step": 572
+    },
+    {
+      "epoch": 0.1483927357482762,
+      "grad_norm": 4.1866996609752904,
+      "learning_rate": 1.2411795273314025e-06,
+      "loss": 0.33,
+      "step": 573
+    },
+    {
+      "epoch": 0.14865171085429413,
+      "grad_norm": 8.369351825162653,
+      "learning_rate": 1.2410846553171988e-06,
+      "loss": 0.4078,
+      "step": 574
+    },
+    {
+      "epoch": 0.14891068596031207,
+      "grad_norm": 9.110580389178104,
+      "learning_rate": 1.2409892794771066e-06,
+      "loss": 0.4616,
+      "step": 575
+    },
+    {
+      "epoch": 0.14891068596031207,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8846153846153846,
+      "eval_PRM F1 AUC": 0.8287061288632793,
+      "eval_PRM F1 AUC (fixed)": 0.6781037192247249,
+      "eval_PRM F1 Neg": 0.6785714285714286,
+      "eval_PRM NPV": 0.5757575757575758,
+      "eval_PRM Precision": 0.9452054794520548,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.3210476040840149,
+      "eval_runtime": 14.8749,
+      "eval_samples_per_second": 2.958,
+      "eval_steps_per_second": 0.134,
+      "step": 575
+    },
+    {
+      "epoch": 0.14916966106633,
+      "grad_norm": 10.564572190452354,
+      "learning_rate": 1.2408933998891226e-06,
+      "loss": 0.3938,
+      "step": 576
+    },
+    {
+      "epoch": 0.14942863617234795,
+      "grad_norm": 15.194471093181686,
+      "learning_rate": 1.2407970166316562e-06,
+      "loss": 0.4729,
+      "step": 577
+    },
+    {
+      "epoch": 0.14968761127836586,
+      "grad_norm": 9.4388656054538,
+      "learning_rate": 1.2407001297835281e-06,
+      "loss": 0.4167,
+      "step": 578
+    },
+    {
+      "epoch": 0.1499465863843838,
+      "grad_norm": 3.577291285694216,
+      "learning_rate": 1.2406027394239712e-06,
+      "loss": 0.3604,
+      "step": 579
+    },
+    {
+      "epoch": 0.15020556149040173,
+      "grad_norm": 6.76903188686745,
+      "learning_rate": 1.2405048456326302e-06,
+      "loss": 0.3794,
+      "step": 580
+    },
+    {
+      "epoch": 0.15020556149040173,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.9012345679012346,
+      "eval_PRM F1 AUC": 0.8093242535358826,
+      "eval_PRM F1 AUC (fixed)": 0.6901519119958093,
+      "eval_PRM F1 Neg": 0.68,
+      "eval_PRM NPV": 0.6296296296296297,
+      "eval_PRM Precision": 0.9240506329113924,
+      "eval_PRM Recall": 0.8795180722891566,
+      "eval_PRM Specificty": 0.7391304347826086,
+      "eval_loss": 0.30129262804985046,
+      "eval_runtime": 14.3739,
+      "eval_samples_per_second": 3.061,
+      "eval_steps_per_second": 0.139,
+      "step": 580
+    },
+    {
+      "epoch": 0.15046453659641967,
+      "grad_norm": 7.344346715445107,
+      "learning_rate": 1.240406448489561e-06,
+      "loss": 0.4737,
+      "step": 581
+    },
+    {
+      "epoch": 0.1507235117024376,
+      "grad_norm": 7.796548314532856,
+      "learning_rate": 1.2403075480752318e-06,
+      "loss": 0.3963,
+      "step": 582
+    },
+    {
+      "epoch": 0.15098248680845552,
+      "grad_norm": 4.3140902460127695,
+      "learning_rate": 1.2402081444705218e-06,
+      "loss": 0.4505,
+      "step": 583
+    },
+    {
+      "epoch": 0.15124146191447346,
+      "grad_norm": 10.426328309205195,
+      "learning_rate": 1.2401082377567222e-06,
+      "loss": 0.4682,
+      "step": 584
+    },
+    {
+      "epoch": 0.1515004370204914,
+      "grad_norm": 3.1885828757437666,
+      "learning_rate": 1.2400078280155352e-06,
+      "loss": 0.2957,
+      "step": 585
+    },
+    {
+      "epoch": 0.1515004370204914,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8930817610062893,
+      "eval_PRM F1 AUC": 0.819015191199581,
+      "eval_PRM F1 AUC (fixed)": 0.6809848088004191,
+      "eval_PRM F1 Neg": 0.6792452830188679,
+      "eval_PRM NPV": 0.6,
+      "eval_PRM Precision": 0.9342105263157895,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.31476715207099915,
+      "eval_runtime": 14.6253,
+      "eval_samples_per_second": 3.008,
+      "eval_steps_per_second": 0.137,
+      "step": 585
+    },
+    {
+      "epoch": 0.15175941212650934,
+      "grad_norm": 3.149213053009891,
+      "learning_rate": 1.2399069153290748e-06,
+      "loss": 0.2859,
+      "step": 586
+    },
+    {
+      "epoch": 0.15201838723252728,
+      "grad_norm": 4.484121045797467,
+      "learning_rate": 1.2398054997798657e-06,
+      "loss": 0.3807,
+      "step": 587
+    },
+    {
+      "epoch": 0.15227736233854522,
+      "grad_norm": 4.509486231542979,
+      "learning_rate": 1.2397035814508447e-06,
+      "loss": 0.4663,
+      "step": 588
+    },
+    {
+      "epoch": 0.15253633744456313,
+      "grad_norm": 3.8777329311615483,
+      "learning_rate": 1.2396011604253585e-06,
+      "loss": 0.3775,
+      "step": 589
+    },
+    {
+      "epoch": 0.15279531255058107,
+      "grad_norm": 7.543389414522049,
+      "learning_rate": 1.2394982367871663e-06,
+      "loss": 0.2858,
+      "step": 590
+    },
+    {
+      "epoch": 0.15279531255058107,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8903225806451613,
+      "eval_PRM F1 AUC": 0.8504452592980618,
+      "eval_PRM F1 AUC (fixed)": 0.6733892090099528,
+      "eval_PRM F1 Neg": 0.7017543859649122,
+      "eval_PRM NPV": 0.5882352941176471,
+      "eval_PRM Precision": 0.9583333333333334,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.33046090602874756,
+      "eval_runtime": 14.6589,
+      "eval_samples_per_second": 3.002,
+      "eval_steps_per_second": 0.136,
+      "step": 590
+    },
+    {
+      "epoch": 0.153054287656599,
+      "grad_norm": 5.42693700134366,
+      "learning_rate": 1.2393948106204376e-06,
+      "loss": 0.3109,
+      "step": 591
+    },
+    {
+      "epoch": 0.15331326276261695,
+      "grad_norm": 7.0826540601798404,
+      "learning_rate": 1.2392908820097526e-06,
+      "loss": 0.434,
+      "step": 592
+    },
+    {
+      "epoch": 0.1535722378686349,
+      "grad_norm": 4.604182378707424,
+      "learning_rate": 1.2391864510401034e-06,
+      "loss": 0.3272,
+      "step": 593
+    },
+    {
+      "epoch": 0.1538312129746528,
+      "grad_norm": 5.012793342377323,
+      "learning_rate": 1.2390815177968915e-06,
+      "loss": 0.3389,
+      "step": 594
+    },
+    {
+      "epoch": 0.15409018808067074,
+      "grad_norm": 4.471973602793316,
+      "learning_rate": 1.2389760823659305e-06,
+      "loss": 0.3548,
+      "step": 595
+    },
+    {
+      "epoch": 0.15409018808067074,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8930817610062893,
+      "eval_PRM F1 AUC": 0.819015191199581,
+      "eval_PRM F1 AUC (fixed)": 0.6838658983761131,
+      "eval_PRM F1 Neg": 0.6792452830188679,
+      "eval_PRM NPV": 0.6,
+      "eval_PRM Precision": 0.9342105263157895,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.31398123502731323,
+      "eval_runtime": 14.9235,
+      "eval_samples_per_second": 2.948,
+      "eval_steps_per_second": 0.134,
+      "step": 595
+    },
+    {
+      "epoch": 0.15434916318668868,
+      "grad_norm": 5.292384586964645,
+      "learning_rate": 1.2388701448334438e-06,
+      "loss": 0.3323,
+      "step": 596
+    },
+    {
+      "epoch": 0.15460813829270662,
+      "grad_norm": 7.288360954102471,
+      "learning_rate": 1.2387637052860657e-06,
+      "loss": 0.4074,
+      "step": 597
+    },
+    {
+      "epoch": 0.15486711339872455,
+      "grad_norm": 4.833374417379775,
+      "learning_rate": 1.2386567638108412e-06,
+      "loss": 0.3843,
+      "step": 598
+    },
+    {
+      "epoch": 0.1551260885047425,
+      "grad_norm": 10.124157768027903,
+      "learning_rate": 1.238549320495226e-06,
+      "loss": 0.4332,
+      "step": 599
+    },
+    {
+      "epoch": 0.1553850636107604,
+      "grad_norm": 8.37696636780662,
+      "learning_rate": 1.238441375427085e-06,
+      "loss": 0.38,
+      "step": 600
+    },
+    {
+      "epoch": 0.1553850636107604,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.9012345679012346,
+      "eval_PRM F1 AUC": 0.8093242535358826,
+      "eval_PRM F1 AUC (fixed)": 0.6849135673127291,
+      "eval_PRM F1 Neg": 0.68,
+      "eval_PRM NPV": 0.6296296296296297,
+      "eval_PRM Precision": 0.9240506329113924,
+      "eval_PRM Recall": 0.8795180722891566,
+      "eval_PRM Specificty": 0.7391304347826086,
+      "eval_loss": 0.3145059645175934,
+      "eval_runtime": 14.6733,
+      "eval_samples_per_second": 2.999,
+      "eval_steps_per_second": 0.136,
+      "step": 600
+    },
+    {
+      "epoch": 0.15564403871677834,
+      "grad_norm": 10.573652158959245,
+      "learning_rate": 1.2383329286946946e-06,
+      "loss": 0.3895,
+      "step": 601
+    },
+    {
+      "epoch": 0.15590301382279628,
+      "grad_norm": 6.215297625313593,
+      "learning_rate": 1.2382239803867413e-06,
+      "loss": 0.3188,
+      "step": 602
+    },
+    {
+      "epoch": 0.15616198892881422,
+      "grad_norm": 3.8865032915789315,
+      "learning_rate": 1.2381145305923215e-06,
+      "loss": 0.3603,
+      "step": 603
+    },
+    {
+      "epoch": 0.15642096403483216,
+      "grad_norm": 4.305704623668269,
+      "learning_rate": 1.2380045794009416e-06,
+      "loss": 0.415,
+      "step": 604
+    },
+    {
+      "epoch": 0.1566799391408501,
+      "grad_norm": 7.777263912530598,
+      "learning_rate": 1.2378941269025184e-06,
+      "loss": 0.3643,
+      "step": 605
+    },
+    {
+      "epoch": 0.1566799391408501,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8903225806451613,
+      "eval_PRM F1 AUC": 0.8504452592980618,
+      "eval_PRM F1 AUC (fixed)": 0.6843897328444212,
+      "eval_PRM F1 Neg": 0.7017543859649122,
+      "eval_PRM NPV": 0.5882352941176471,
+      "eval_PRM Precision": 0.9583333333333334,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.33305254578590393,
+      "eval_runtime": 14.4625,
+      "eval_samples_per_second": 3.042,
+      "eval_steps_per_second": 0.138,
+      "step": 605
+    },
+    {
+      "epoch": 0.156938914246868,
+      "grad_norm": 13.549319660584498,
+      "learning_rate": 1.2377831731873786e-06,
+      "loss": 0.3611,
+      "step": 606
+    },
+    {
+      "epoch": 0.15719788935288595,
+      "grad_norm": 5.115617377808031,
+      "learning_rate": 1.2376717183462583e-06,
+      "loss": 0.4097,
+      "step": 607
+    },
+    {
+      "epoch": 0.1574568644589039,
+      "grad_norm": 8.064002200115613,
+      "learning_rate": 1.2375597624703042e-06,
+      "loss": 0.3544,
+      "step": 608
+    },
+    {
+      "epoch": 0.15771583956492183,
+      "grad_norm": 8.743740116901071,
+      "learning_rate": 1.2374473056510723e-06,
+      "loss": 0.3979,
+      "step": 609
+    },
+    {
+      "epoch": 0.15797481467093977,
+      "grad_norm": 9.05779305197767,
+      "learning_rate": 1.237334347980528e-06,
+      "loss": 0.3519,
+      "step": 610
+    },
+    {
+      "epoch": 0.15797481467093977,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.6898899947616554,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.30802619457244873,
+      "eval_runtime": 15.0217,
+      "eval_samples_per_second": 2.929,
+      "eval_steps_per_second": 0.133,
+      "step": 610
+    },
+    {
+      "epoch": 0.15823378977695768,
+      "grad_norm": 5.861247610988427,
+      "learning_rate": 1.2372208895510469e-06,
+      "loss": 0.3434,
+      "step": 611
+    },
+    {
+      "epoch": 0.15849276488297562,
+      "grad_norm": 3.670151363461034,
+      "learning_rate": 1.2371069304554133e-06,
+      "loss": 0.3702,
+      "step": 612
+    },
+    {
+      "epoch": 0.15875173998899356,
+      "grad_norm": 8.084637417212509,
+      "learning_rate": 1.2369924707868222e-06,
+      "loss": 0.4298,
+      "step": 613
+    },
+    {
+      "epoch": 0.1590107150950115,
+      "grad_norm": 5.687659548763739,
+      "learning_rate": 1.236877510638877e-06,
+      "loss": 0.3255,
+      "step": 614
+    },
+    {
+      "epoch": 0.15926969020102943,
+      "grad_norm": 7.056523326388455,
+      "learning_rate": 1.23676205010559e-06,
+      "loss": 0.3883,
+      "step": 615
+    },
+    {
+      "epoch": 0.15926969020102943,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8944099378881988,
+      "eval_PRM F1 AUC": 0.8033001571503404,
+      "eval_PRM F1 AUC (fixed)": 0.6964379256155055,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.6071428571428571,
+      "eval_PRM Precision": 0.9230769230769231,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.7391304347826086,
+      "eval_loss": 0.2987489402294159,
+      "eval_runtime": 14.7965,
+      "eval_samples_per_second": 2.974,
+      "eval_steps_per_second": 0.135,
+      "step": 615
+    },
+    {
+      "epoch": 0.15952866530704737,
+      "grad_norm": 8.052724316864127,
+      "learning_rate": 1.2366460892813839e-06,
+      "loss": 0.4153,
+      "step": 616
+    },
+    {
+      "epoch": 0.15978764041306528,
+      "grad_norm": 11.44407409138463,
+      "learning_rate": 1.2365296282610897e-06,
+      "loss": 0.4042,
+      "step": 617
+    },
+    {
+      "epoch": 0.16004661551908322,
+      "grad_norm": 14.598720324528122,
+      "learning_rate": 1.2364126671399477e-06,
+      "loss": 0.4369,
+      "step": 618
+    },
+    {
+      "epoch": 0.16030559062510116,
+      "grad_norm": 5.482057017022813,
+      "learning_rate": 1.236295206013607e-06,
+      "loss": 0.3319,
+      "step": 619
+    },
+    {
+      "epoch": 0.1605645657311191,
+      "grad_norm": 3.3221121701486727,
+      "learning_rate": 1.2361772449781263e-06,
+      "loss": 0.3924,
+      "step": 620
+    },
+    {
+      "epoch": 0.1605645657311191,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8846153846153846,
+      "eval_PRM F1 AUC": 0.8287061288632793,
+      "eval_PRM F1 AUC (fixed)": 0.6783656364588789,
+      "eval_PRM F1 Neg": 0.6785714285714286,
+      "eval_PRM NPV": 0.5757575757575758,
+      "eval_PRM Precision": 0.9452054794520548,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.3130224049091339,
+      "eval_runtime": 14.3415,
+      "eval_samples_per_second": 3.068,
+      "eval_steps_per_second": 0.139,
+      "step": 620
+    },
+    {
+      "epoch": 0.16082354083713704,
+      "grad_norm": 3.3351070027555,
+      "learning_rate": 1.236058784129972e-06,
+      "loss": 0.3507,
+      "step": 621
+    },
+    {
+      "epoch": 0.16108251594315495,
+      "grad_norm": 5.057842166618868,
+      "learning_rate": 1.23593982356602e-06,
+      "loss": 0.344,
+      "step": 622
+    },
+    {
+      "epoch": 0.1613414910491729,
+      "grad_norm": 9.181148751364352,
+      "learning_rate": 1.2358203633835549e-06,
+      "loss": 0.4648,
+      "step": 623
+    },
+    {
+      "epoch": 0.16160046615519083,
+      "grad_norm": 6.083979457492019,
+      "learning_rate": 1.2357004036802695e-06,
+      "loss": 0.2599,
+      "step": 624
+    },
+    {
+      "epoch": 0.16185944126120877,
+      "grad_norm": 4.382520565652978,
+      "learning_rate": 1.2355799445542649e-06,
+      "loss": 0.3058,
+      "step": 625
+    },
+    {
+      "epoch": 0.16185944126120877,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8903225806451613,
+      "eval_PRM F1 AUC": 0.8504452592980618,
+      "eval_PRM F1 AUC (fixed)": 0.6846516500785752,
+      "eval_PRM F1 Neg": 0.7017543859649122,
+      "eval_PRM NPV": 0.5882352941176471,
+      "eval_PRM Precision": 0.9583333333333334,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.3220345973968506,
+      "eval_runtime": 14.5696,
+      "eval_samples_per_second": 3.02,
+      "eval_steps_per_second": 0.137,
+      "step": 625
+    },
+    {
+      "epoch": 0.1621184163672267,
+      "grad_norm": 4.1437604506815955,
+      "learning_rate": 1.2354589861040514e-06,
+      "loss": 0.3002,
+      "step": 626
+    },
+    {
+      "epoch": 0.16237739147324465,
+      "grad_norm": 4.374843106284846,
+      "learning_rate": 1.2353375284285475e-06,
+      "loss": 0.3704,
+      "step": 627
+    },
+    {
+      "epoch": 0.16263636657926256,
+      "grad_norm": 5.608222695272279,
+      "learning_rate": 1.235215571627079e-06,
+      "loss": 0.344,
+      "step": 628
+    },
+    {
+      "epoch": 0.1628953416852805,
+      "grad_norm": 4.8582080854128895,
+      "learning_rate": 1.2350931157993807e-06,
+      "loss": 0.3336,
+      "step": 629
+    },
+    {
+      "epoch": 0.16315431679129844,
+      "grad_norm": 12.482439714954587,
+      "learning_rate": 1.2349701610455959e-06,
+      "loss": 0.5153,
+      "step": 630
+    },
+    {
+      "epoch": 0.16315431679129844,
+      "eval_PRM Accuracy": 0.8113207547169812,
+      "eval_PRM F1": 0.8734177215189873,
+      "eval_PRM F1 AUC": 0.785227867993714,
+      "eval_PRM F1 AUC (fixed)": 0.6856993190151912,
+      "eval_PRM F1 Neg": 0.6296296296296297,
+      "eval_PRM NPV": 0.5483870967741935,
+      "eval_PRM Precision": 0.92,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.7391304347826086,
+      "eval_loss": 0.31282979249954224,
+      "eval_runtime": 14.476,
+      "eval_samples_per_second": 3.04,
+      "eval_steps_per_second": 0.138,
+      "step": 630
+    },
+    {
+      "epoch": 0.16341329189731638,
+      "grad_norm": 2.8269173986313767,
+      "learning_rate": 1.2348467074662746e-06,
+      "loss": 0.3002,
+      "step": 631
+    },
+    {
+      "epoch": 0.16367226700333432,
+      "grad_norm": 9.367758085039979,
+      "learning_rate": 1.234722755162376e-06,
+      "loss": 0.4783,
+      "step": 632
+    },
+    {
+      "epoch": 0.16393124210935223,
+      "grad_norm": 4.360443477858389,
+      "learning_rate": 1.2345983042352668e-06,
+      "loss": 0.3304,
+      "step": 633
+    },
+    {
+      "epoch": 0.16419021721537017,
+      "grad_norm": 4.814617876325908,
+      "learning_rate": 1.2344733547867211e-06,
+      "loss": 0.3975,
+      "step": 634
+    },
+    {
+      "epoch": 0.1644491923213881,
+      "grad_norm": 8.736415057185651,
+      "learning_rate": 1.2343479069189208e-06,
+      "loss": 0.3967,
+      "step": 635
+    },
+    {
+      "epoch": 0.1644491923213881,
+      "eval_PRM Accuracy": 0.8207547169811321,
+      "eval_PRM F1": 0.8789808917197452,
+      "eval_PRM F1 AUC": 0.8069669984284967,
+      "eval_PRM F1 AUC (fixed)": 0.6841278156102671,
+      "eval_PRM F1 Neg": 0.6545454545454545,
+      "eval_PRM NPV": 0.5625,
+      "eval_PRM Precision": 0.9324324324324325,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.32189351320266724,
+      "eval_runtime": 14.5716,
+      "eval_samples_per_second": 3.02,
+      "eval_steps_per_second": 0.137,
+      "step": 635
+    },
+    {
+      "epoch": 0.16470816742740604,
+      "grad_norm": 8.16922264657535,
+      "learning_rate": 1.2342219607344553e-06,
+      "loss": 0.3905,
+      "step": 636
+    },
+    {
+      "epoch": 0.16496714253342398,
+      "grad_norm": 4.102239363110395,
+      "learning_rate": 1.2340955163363223e-06,
+      "loss": 0.3864,
+      "step": 637
+    },
+    {
+      "epoch": 0.16522611763944192,
+      "grad_norm": 6.666667743598508,
+      "learning_rate": 1.2339685738279262e-06,
+      "loss": 0.3439,
+      "step": 638
+    },
+    {
+      "epoch": 0.16548509274545983,
+      "grad_norm": 6.359302938917453,
+      "learning_rate": 1.2338411333130786e-06,
+      "loss": 0.3799,
+      "step": 639
+    },
+    {
+      "epoch": 0.16574406785147777,
+      "grad_norm": 3.4027973170905943,
+      "learning_rate": 1.2337131948959988e-06,
+      "loss": 0.3117,
+      "step": 640
+    },
+    {
+      "epoch": 0.16574406785147777,
+      "eval_PRM Accuracy": 0.8113207547169812,
+      "eval_PRM F1": 0.8734177215189873,
+      "eval_PRM F1 AUC": 0.785227867993714,
+      "eval_PRM F1 AUC (fixed)": 0.6901519119958093,
+      "eval_PRM F1 Neg": 0.6296296296296297,
+      "eval_PRM NPV": 0.5483870967741935,
+      "eval_PRM Precision": 0.92,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.7391304347826086,
+      "eval_loss": 0.3099837303161621,
+      "eval_runtime": 14.876,
+      "eval_samples_per_second": 2.958,
+      "eval_steps_per_second": 0.134,
+      "step": 640
+    },
+    {
+      "epoch": 0.1660030429574957,
+      "grad_norm": 4.065907555813363,
+      "learning_rate": 1.2335847586813134e-06,
+      "loss": 0.359,
+      "step": 641
+    },
+    {
+      "epoch": 0.16626201806351365,
+      "grad_norm": 9.506205075827122,
+      "learning_rate": 1.2334558247740555e-06,
+      "loss": 0.3711,
+      "step": 642
+    },
+    {
+      "epoch": 0.1665209931695316,
+      "grad_norm": 5.585007233460523,
+      "learning_rate": 1.2333263932796658e-06,
+      "loss": 0.3794,
+      "step": 643
+    },
+    {
+      "epoch": 0.1667799682755495,
+      "grad_norm": 6.2824853591678895,
+      "learning_rate": 1.2331964643039914e-06,
+      "loss": 0.3819,
+      "step": 644
+    },
+    {
+      "epoch": 0.16703894338156744,
+      "grad_norm": 3.0945268049557955,
+      "learning_rate": 1.233066037953287e-06,
+      "loss": 0.2563,
+      "step": 645
+    },
+    {
+      "epoch": 0.16703894338156744,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8860759493670886,
+      "eval_PRM F1 AUC": 0.8129910948140389,
+      "eval_PRM F1 AUC (fixed)": 0.7008905185961236,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5806451612903226,
+      "eval_PRM Precision": 0.9333333333333333,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2902960777282715,
+      "eval_runtime": 14.3898,
+      "eval_samples_per_second": 3.058,
+      "eval_steps_per_second": 0.139,
+      "step": 645
+    },
+    {
+      "epoch": 0.16729791848758538,
+      "grad_norm": 8.26070229351453,
+      "learning_rate": 1.2329351143342127e-06,
+      "loss": 0.4367,
+      "step": 646
+    },
+    {
+      "epoch": 0.16755689359360332,
+      "grad_norm": 3.5692756270657853,
+      "learning_rate": 1.232803693553837e-06,
+      "loss": 0.3088,
+      "step": 647
+    },
+    {
+      "epoch": 0.16781586869962126,
+      "grad_norm": 6.322229970930503,
+      "learning_rate": 1.2326717757196335e-06,
+      "loss": 0.3815,
+      "step": 648
+    },
+    {
+      "epoch": 0.1680748438056392,
+      "grad_norm": 5.4301781501602955,
+      "learning_rate": 1.232539360939483e-06,
+      "loss": 0.4233,
+      "step": 649
+    },
+    {
+      "epoch": 0.1683338189116571,
+      "grad_norm": 4.037554188342987,
+      "learning_rate": 1.2324064493216729e-06,
+      "loss": 0.4186,
+      "step": 650
+    },
+    {
+      "epoch": 0.1683338189116571,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8846153846153846,
+      "eval_PRM F1 AUC": 0.8287061288632793,
+      "eval_PRM F1 AUC (fixed)": 0.7037716081718176,
+      "eval_PRM F1 Neg": 0.6785714285714286,
+      "eval_PRM NPV": 0.5757575757575758,
+      "eval_PRM Precision": 0.9452054794520548,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.3051375150680542,
+      "eval_runtime": 14.6736,
+      "eval_samples_per_second": 2.999,
+      "eval_steps_per_second": 0.136,
+      "step": 650
+    },
+    {
+      "epoch": 0.16859279401767505,
+      "grad_norm": 5.903651242662739,
+      "learning_rate": 1.2322730409748958e-06,
+      "loss": 0.4349,
+      "step": 651
+    },
+    {
+      "epoch": 0.16885176912369299,
+      "grad_norm": 4.79677556638012,
+      "learning_rate": 1.2321391360082521e-06,
+      "loss": 0.3621,
+      "step": 652
+    },
+    {
+      "epoch": 0.16911074422971092,
+      "grad_norm": 5.0682489678833536,
+      "learning_rate": 1.2320047345312468e-06,
+      "loss": 0.4286,
+      "step": 653
+    },
+    {
+      "epoch": 0.16936971933572886,
+      "grad_norm": 10.204257727871076,
+      "learning_rate": 1.2318698366537924e-06,
+      "loss": 0.418,
+      "step": 654
+    },
+    {
+      "epoch": 0.16962869444174677,
+      "grad_norm": 5.9807619771124845,
+      "learning_rate": 1.2317344424862062e-06,
+      "loss": 0.4272,
+      "step": 655
+    },
+    {
+      "epoch": 0.16962869444174677,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8846153846153846,
+      "eval_PRM F1 AUC": 0.8287061288632793,
+      "eval_PRM F1 AUC (fixed)": 0.7003666841278156,
+      "eval_PRM F1 Neg": 0.6785714285714286,
+      "eval_PRM NPV": 0.5757575757575758,
+      "eval_PRM Precision": 0.9452054794520548,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.3076668977737427,
+      "eval_runtime": 14.5657,
+      "eval_samples_per_second": 3.021,
+      "eval_steps_per_second": 0.137,
+      "step": 655
+    },
+    {
+      "epoch": 0.1698876695477647,
+      "grad_norm": 8.183477991339371,
+      "learning_rate": 1.2315985521392116e-06,
+      "loss": 0.3848,
+      "step": 656
+    },
+    {
+      "epoch": 0.17014664465378265,
+      "grad_norm": 4.350350964575722,
+      "learning_rate": 1.2314621657239382e-06,
+      "loss": 0.4005,
+      "step": 657
+    },
+    {
+      "epoch": 0.1704056197598006,
+      "grad_norm": 3.8484281205534305,
+      "learning_rate": 1.2313252833519207e-06,
+      "loss": 0.3491,
+      "step": 658
+    },
+    {
+      "epoch": 0.17066459486581853,
+      "grad_norm": 3.8215249184870355,
+      "learning_rate": 1.2311879051351e-06,
+      "loss": 0.365,
+      "step": 659
+    },
+    {
+      "epoch": 0.17092356997183647,
+      "grad_norm": 3.8839060530983347,
+      "learning_rate": 1.2310500311858224e-06,
+      "loss": 0.3976,
+      "step": 660
+    },
+    {
+      "epoch": 0.17092356997183647,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.6909376636982713,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.2925107777118683,
+      "eval_runtime": 14.7018,
+      "eval_samples_per_second": 2.993,
+      "eval_steps_per_second": 0.136,
+      "step": 660
+    },
+    {
+      "epoch": 0.17118254507785438,
+      "grad_norm": 3.2291152137659855,
+      "learning_rate": 1.2309116616168388e-06,
+      "loss": 0.3187,
+      "step": 661
+    },
+    {
+      "epoch": 0.17144152018387232,
+      "grad_norm": 3.6725860645126867,
+      "learning_rate": 1.2307727965413063e-06,
+      "loss": 0.3757,
+      "step": 662
+    },
+    {
+      "epoch": 0.17170049528989026,
+      "grad_norm": 3.1002808823226986,
+      "learning_rate": 1.230633436072787e-06,
+      "loss": 0.3074,
+      "step": 663
+    },
+    {
+      "epoch": 0.1719594703959082,
+      "grad_norm": 8.746795861527746,
+      "learning_rate": 1.2304935803252479e-06,
+      "loss": 0.4095,
+      "step": 664
+    },
+    {
+      "epoch": 0.17221844550192614,
+      "grad_norm": 10.82989204467529,
+      "learning_rate": 1.2303532294130613e-06,
+      "loss": 0.4814,
+      "step": 665
+    },
+    {
+      "epoch": 0.17221844550192614,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8930817610062893,
+      "eval_PRM F1 AUC": 0.819015191199581,
+      "eval_PRM F1 AUC (fixed)": 0.6875327396542692,
+      "eval_PRM F1 Neg": 0.6792452830188679,
+      "eval_PRM NPV": 0.6,
+      "eval_PRM Precision": 0.9342105263157895,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.30050474405288696,
+      "eval_runtime": 14.9203,
+      "eval_samples_per_second": 2.949,
+      "eval_steps_per_second": 0.134,
+      "step": 665
+    },
+    {
+      "epoch": 0.17247742060794405,
+      "grad_norm": 8.264683855258928,
+      "learning_rate": 1.2302123834510042e-06,
+      "loss": 0.4312,
+      "step": 666
+    },
+    {
+      "epoch": 0.172736395713962,
+      "grad_norm": 4.929731323927467,
+      "learning_rate": 1.2300710425542586e-06,
+      "loss": 0.3498,
+      "step": 667
+    },
+    {
+      "epoch": 0.17299537081997993,
+      "grad_norm": 4.665278640952237,
+      "learning_rate": 1.2299292068384114e-06,
+      "loss": 0.3288,
+      "step": 668
+    },
+    {
+      "epoch": 0.17325434592599787,
+      "grad_norm": 4.455799796574909,
+      "learning_rate": 1.2297868764194538e-06,
+      "loss": 0.3569,
+      "step": 669
+    },
+    {
+      "epoch": 0.1735133210320158,
+      "grad_norm": 3.97792111313062,
+      "learning_rate": 1.2296440514137816e-06,
+      "loss": 0.3906,
+      "step": 670
+    },
+    {
+      "epoch": 0.1735133210320158,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8903225806451613,
+      "eval_PRM F1 AUC": 0.8504452592980618,
+      "eval_PRM F1 AUC (fixed)": 0.6836039811419592,
+      "eval_PRM F1 Neg": 0.7017543859649122,
+      "eval_PRM NPV": 0.5882352941176471,
+      "eval_PRM Precision": 0.9583333333333334,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.32599514722824097,
+      "eval_runtime": 14.7092,
+      "eval_samples_per_second": 2.991,
+      "eval_steps_per_second": 0.136,
+      "step": 670
+    },
+    {
+      "epoch": 0.17377229613803374,
+      "grad_norm": 8.57169595641781,
+      "learning_rate": 1.2295007319381956e-06,
+      "loss": 0.3743,
+      "step": 671
+    },
+    {
+      "epoch": 0.17403127124405166,
+      "grad_norm": 9.193160162768763,
+      "learning_rate": 1.2293569181099002e-06,
+      "loss": 0.5468,
+      "step": 672
+    },
+    {
+      "epoch": 0.1742902463500696,
+      "grad_norm": 7.97975844919332,
+      "learning_rate": 1.2292126100465047e-06,
+      "loss": 0.4063,
+      "step": 673
+    },
+    {
+      "epoch": 0.17454922145608753,
+      "grad_norm": 3.8452977252610747,
+      "learning_rate": 1.229067807866022e-06,
+      "loss": 0.3421,
+      "step": 674
+    },
+    {
+      "epoch": 0.17480819656210547,
+      "grad_norm": 10.931204111910318,
+      "learning_rate": 1.2289225116868696e-06,
+      "loss": 0.3536,
+      "step": 675
+    },
+    {
+      "epoch": 0.17480819656210547,
+      "eval_PRM Accuracy": 0.8113207547169812,
+      "eval_PRM F1": 0.8734177215189873,
+      "eval_PRM F1 AUC": 0.785227867993714,
+      "eval_PRM F1 AUC (fixed)": 0.6864850707176532,
+      "eval_PRM F1 Neg": 0.6296296296296297,
+      "eval_PRM NPV": 0.5483870967741935,
+      "eval_PRM Precision": 0.92,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.7391304347826086,
+      "eval_loss": 0.32675302028656006,
+      "eval_runtime": 14.7963,
+      "eval_samples_per_second": 2.974,
+      "eval_steps_per_second": 0.135,
+      "step": 675
+    },
+    {
+      "epoch": 0.1750671716681234,
+      "grad_norm": 5.2549991101724425,
+      "learning_rate": 1.228776721627869e-06,
+      "loss": 0.4517,
+      "step": 676
+    },
+    {
+      "epoch": 0.17532614677414132,
+      "grad_norm": 5.623571928637202,
+      "learning_rate": 1.2286304378082454e-06,
+      "loss": 0.403,
+      "step": 677
+    },
+    {
+      "epoch": 0.17558512188015926,
+      "grad_norm": 7.871866515710695,
+      "learning_rate": 1.2284836603476272e-06,
+      "loss": 0.3853,
+      "step": 678
+    },
+    {
+      "epoch": 0.1758440969861772,
+      "grad_norm": 3.150820890154312,
+      "learning_rate": 1.2283363893660478e-06,
+      "loss": 0.3173,
+      "step": 679
+    },
+    {
+      "epoch": 0.17610307209219514,
+      "grad_norm": 4.865805406292621,
+      "learning_rate": 1.2281886249839429e-06,
+      "loss": 0.3076,
+      "step": 680
+    },
+    {
+      "epoch": 0.17610307209219514,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8860759493670886,
+      "eval_PRM F1 AUC": 0.8129910948140389,
+      "eval_PRM F1 AUC (fixed)": 0.6946045049764276,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5806451612903226,
+      "eval_PRM Precision": 0.9333333333333333,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.30507519841194153,
+      "eval_runtime": 15.0032,
+      "eval_samples_per_second": 2.933,
+      "eval_steps_per_second": 0.133,
+      "step": 680
+    },
+    {
+      "epoch": 0.17636204719821308,
+      "grad_norm": 3.6089302563745327,
+      "learning_rate": 1.2280403673221522e-06,
+      "loss": 0.3024,
+      "step": 681
+    },
+    {
+      "epoch": 0.17662102230423102,
+      "grad_norm": 6.5551214656445485,
+      "learning_rate": 1.2278916165019195e-06,
+      "loss": 0.395,
+      "step": 682
+    },
+    {
+      "epoch": 0.17687999741024893,
+      "grad_norm": 3.729361087732829,
+      "learning_rate": 1.2277423726448905e-06,
+      "loss": 0.3875,
+      "step": 683
+    },
+    {
+      "epoch": 0.17713897251626687,
+      "grad_norm": 5.2636108819488365,
+      "learning_rate": 1.2275926358731156e-06,
+      "loss": 0.3809,
+      "step": 684
+    },
+    {
+      "epoch": 0.1773979476222848,
+      "grad_norm": 3.124690927806883,
+      "learning_rate": 1.227442406309047e-06,
+      "loss": 0.3772,
+      "step": 685
+    },
+    {
+      "epoch": 0.1773979476222848,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8860759493670886,
+      "eval_PRM F1 AUC": 0.8129910948140389,
+      "eval_PRM F1 AUC (fixed)": 0.7019381875327396,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5806451612903226,
+      "eval_PRM Precision": 0.9333333333333333,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.29255253076553345,
+      "eval_runtime": 14.5029,
+      "eval_samples_per_second": 3.034,
+      "eval_steps_per_second": 0.138,
+      "step": 685
+    },
+    {
+      "epoch": 0.17765692272830275,
+      "grad_norm": 6.064065924164856,
+      "learning_rate": 1.227291684075541e-06,
+      "loss": 0.4751,
+      "step": 686
+    },
+    {
+      "epoch": 0.17791589783432069,
+      "grad_norm": 3.8170721320489993,
+      "learning_rate": 1.2271404692958553e-06,
+      "loss": 0.327,
+      "step": 687
+    },
+    {
+      "epoch": 0.1781748729403386,
+      "grad_norm": 6.515137825706018,
+      "learning_rate": 1.2269887620936524e-06,
+      "loss": 0.3708,
+      "step": 688
+    },
+    {
+      "epoch": 0.17843384804635654,
+      "grad_norm": 2.9103376080730987,
+      "learning_rate": 1.2268365625929956e-06,
+      "loss": 0.3284,
+      "step": 689
+    },
+    {
+      "epoch": 0.17869282315237447,
+      "grad_norm": 4.771365939250701,
+      "learning_rate": 1.2266838709183523e-06,
+      "loss": 0.4002,
+      "step": 690
+    },
+    {
+      "epoch": 0.17869282315237447,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8860759493670886,
+      "eval_PRM F1 AUC": 0.8129910948140389,
+      "eval_PRM F1 AUC (fixed)": 0.6938187532739654,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5806451612903226,
+      "eval_PRM Precision": 0.9333333333333333,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.29877424240112305,
+      "eval_runtime": 14.538,
+      "eval_samples_per_second": 3.027,
+      "eval_steps_per_second": 0.138,
+      "step": 690
+    },
+    {
+      "epoch": 0.1789517982583924,
+      "grad_norm": 6.18545393540289,
+      "learning_rate": 1.2265306871945913e-06,
+      "loss": 0.2963,
+      "step": 691
+    },
+    {
+      "epoch": 0.17921077336441035,
+      "grad_norm": 3.6651890147345014,
+      "learning_rate": 1.2263770115469844e-06,
+      "loss": 0.3844,
+      "step": 692
+    },
+    {
+      "epoch": 0.1794697484704283,
+      "grad_norm": 3.0288719572638274,
+      "learning_rate": 1.2262228441012055e-06,
+      "loss": 0.3152,
+      "step": 693
+    },
+    {
+      "epoch": 0.1797287235764462,
+      "grad_norm": 4.805350206780974,
+      "learning_rate": 1.2260681849833307e-06,
+      "loss": 0.4042,
+      "step": 694
+    },
+    {
+      "epoch": 0.17998769868246414,
+      "grad_norm": 4.11172461983298,
+      "learning_rate": 1.2259130343198382e-06,
+      "loss": 0.3348,
+      "step": 695
+    },
+    {
+      "epoch": 0.17998769868246414,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8930817610062893,
+      "eval_PRM F1 AUC": 0.819015191199581,
+      "eval_PRM F1 AUC (fixed)": 0.6953902566788894,
+      "eval_PRM F1 Neg": 0.6792452830188679,
+      "eval_PRM NPV": 0.6,
+      "eval_PRM Precision": 0.9342105263157895,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.298240065574646,
+      "eval_runtime": 14.723,
+      "eval_samples_per_second": 2.989,
+      "eval_steps_per_second": 0.136,
+      "step": 695
+    },
+    {
+      "epoch": 0.18024667378848208,
+      "grad_norm": 4.577272985951415,
+      "learning_rate": 1.2257573922376082e-06,
+      "loss": 0.3048,
+      "step": 696
+    },
+    {
+      "epoch": 0.18050564889450002,
+      "grad_norm": 6.9027920443285655,
+      "learning_rate": 1.2256012588639224e-06,
+      "loss": 0.4526,
+      "step": 697
+    },
+    {
+      "epoch": 0.18076462400051796,
+      "grad_norm": 6.007320601254431,
+      "learning_rate": 1.2254446343264652e-06,
+      "loss": 0.4382,
+      "step": 698
+    },
+    {
+      "epoch": 0.18102359910653587,
+      "grad_norm": 6.4059971503781705,
+      "learning_rate": 1.2252875187533216e-06,
+      "loss": 0.2843,
+      "step": 699
+    },
+    {
+      "epoch": 0.1812825742125538,
+      "grad_norm": 4.816960316434854,
+      "learning_rate": 1.2251299122729788e-06,
+      "loss": 0.3413,
+      "step": 700
+    },
+    {
+      "epoch": 0.1812825742125538,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.6927710843373494,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.309047669172287,
+      "eval_runtime": 14.3751,
+      "eval_samples_per_second": 3.061,
+      "eval_steps_per_second": 0.139,
+      "step": 700
+    },
+    {
+      "epoch": 0.18154154931857175,
+      "grad_norm": 5.101486987466127,
+      "learning_rate": 1.2249718150143253e-06,
+      "loss": 0.3951,
+      "step": 701
+    },
+    {
+      "epoch": 0.1818005244245897,
+      "grad_norm": 8.502311209246374,
+      "learning_rate": 1.224813227106651e-06,
+      "loss": 0.4991,
+      "step": 702
+    },
+    {
+      "epoch": 0.18205949953060763,
+      "grad_norm": 5.728862100407766,
+      "learning_rate": 1.2246541486796468e-06,
+      "loss": 0.3105,
+      "step": 703
+    },
+    {
+      "epoch": 0.18231847463662557,
+      "grad_norm": 10.721025982358185,
+      "learning_rate": 1.2244945798634053e-06,
+      "loss": 0.5076,
+      "step": 704
+    },
+    {
+      "epoch": 0.18257744974264348,
+      "grad_norm": 7.180199889514728,
+      "learning_rate": 1.2243345207884193e-06,
+      "loss": 0.3735,
+      "step": 705
+    },
+    {
+      "epoch": 0.18257744974264348,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8944099378881988,
+      "eval_PRM F1 AUC": 0.8033001571503404,
+      "eval_PRM F1 AUC (fixed)": 0.6888423258250393,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.6071428571428571,
+      "eval_PRM Precision": 0.9230769230769231,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.7391304347826086,
+      "eval_loss": 0.30524346232414246,
+      "eval_runtime": 14.8186,
+      "eval_samples_per_second": 2.969,
+      "eval_steps_per_second": 0.135,
+      "step": 705
+    },
+    {
+      "epoch": 0.18283642484866142,
+      "grad_norm": 4.033301201721461,
+      "learning_rate": 1.2241739715855833e-06,
+      "loss": 0.3323,
+      "step": 706
+    },
+    {
+      "epoch": 0.18309539995467936,
+      "grad_norm": 7.540320350893967,
+      "learning_rate": 1.2240129323861923e-06,
+      "loss": 0.4018,
+      "step": 707
+    },
+    {
+      "epoch": 0.1833543750606973,
+      "grad_norm": 4.023342552193731,
+      "learning_rate": 1.223851403321942e-06,
+      "loss": 0.4608,
+      "step": 708
+    },
+    {
+      "epoch": 0.18361335016671523,
+      "grad_norm": 3.4906951118001435,
+      "learning_rate": 1.2236893845249286e-06,
+      "loss": 0.3207,
+      "step": 709
+    },
+    {
+      "epoch": 0.18387232527273314,
+      "grad_norm": 3.516295428942307,
+      "learning_rate": 1.2235268761276492e-06,
+      "loss": 0.4116,
+      "step": 710
+    },
+    {
+      "epoch": 0.18387232527273314,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.9,
+      "eval_PRM F1 AUC": 0.8250392875851232,
+      "eval_PRM F1 AUC (fixed)": 0.6888423258250392,
+      "eval_PRM F1 Neg": 0.6923076923076923,
+      "eval_PRM NPV": 0.6206896551724138,
+      "eval_PRM Precision": 0.935064935064935,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2983972430229187,
+      "eval_runtime": 14.7691,
+      "eval_samples_per_second": 2.979,
+      "eval_steps_per_second": 0.135,
+      "step": 710
+    },
+    {
+      "epoch": 0.18413130037875108,
+      "grad_norm": 6.3107471370478345,
+      "learning_rate": 1.2233638782630008e-06,
+      "loss": 0.3446,
+      "step": 711
+    },
+    {
+      "epoch": 0.18439027548476902,
+      "grad_norm": 4.766463349421268,
+      "learning_rate": 1.223200391064281e-06,
+      "loss": 0.4559,
+      "step": 712
+    },
+    {
+      "epoch": 0.18464925059078696,
+      "grad_norm": 4.079425145872921,
+      "learning_rate": 1.2230364146651874e-06,
+      "loss": 0.3296,
+      "step": 713
+    },
+    {
+      "epoch": 0.1849082256968049,
+      "grad_norm": 3.558588858327177,
+      "learning_rate": 1.2228719491998178e-06,
+      "loss": 0.3722,
+      "step": 714
+    },
+    {
+      "epoch": 0.18516720080282284,
+      "grad_norm": 3.6740128427409187,
+      "learning_rate": 1.22270699480267e-06,
+      "loss": 0.3337,
+      "step": 715
+    },
+    {
+      "epoch": 0.18516720080282284,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8831168831168831,
+      "eval_PRM F1 AUC": 0.8444211629125196,
+      "eval_PRM F1 AUC (fixed)": 0.6893661602933473,
+      "eval_PRM F1 Neg": 0.6896551724137931,
+      "eval_PRM NPV": 0.5714285714285714,
+      "eval_PRM Precision": 0.9577464788732394,
+      "eval_PRM Recall": 0.8192771084337349,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.3114849328994751,
+      "eval_runtime": 14.6726,
+      "eval_samples_per_second": 2.999,
+      "eval_steps_per_second": 0.136,
+      "step": 715
+    },
+    {
+      "epoch": 0.18542617590884075,
+      "grad_norm": 6.842617200338519,
+      "learning_rate": 1.222541551608641e-06,
+      "loss": 0.4139,
+      "step": 716
+    },
+    {
+      "epoch": 0.1856851510148587,
+      "grad_norm": 8.077453143122918,
+      "learning_rate": 1.2223756197530287e-06,
+      "loss": 0.4138,
+      "step": 717
+    },
+    {
+      "epoch": 0.18594412612087663,
+      "grad_norm": 10.71942617315954,
+      "learning_rate": 1.2222091993715296e-06,
+      "loss": 0.3837,
+      "step": 718
+    },
+    {
+      "epoch": 0.18620310122689457,
+      "grad_norm": 5.7851074969807526,
+      "learning_rate": 1.2220422906002402e-06,
+      "loss": 0.4341,
+      "step": 719
+    },
+    {
+      "epoch": 0.1864620763329125,
+      "grad_norm": 4.993275457162052,
+      "learning_rate": 1.2218748935756563e-06,
+      "loss": 0.4591,
+      "step": 720
+    },
+    {
+      "epoch": 0.1864620763329125,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.6901519119958094,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.30387333035469055,
+      "eval_runtime": 15.0727,
+      "eval_samples_per_second": 2.919,
+      "eval_steps_per_second": 0.133,
+      "step": 720
+    },
+    {
+      "epoch": 0.18672105143893045,
+      "grad_norm": 9.287087083955917,
+      "learning_rate": 1.221707008434673e-06,
+      "loss": 0.3178,
+      "step": 721
+    },
+    {
+      "epoch": 0.18698002654494836,
+      "grad_norm": 8.33504855523225,
+      "learning_rate": 1.2215386353145848e-06,
+      "loss": 0.3372,
+      "step": 722
+    },
+    {
+      "epoch": 0.1872390016509663,
+      "grad_norm": 3.0068926378723506,
+      "learning_rate": 1.2213697743530841e-06,
+      "loss": 0.3144,
+      "step": 723
+    },
+    {
+      "epoch": 0.18749797675698424,
+      "grad_norm": 4.173934848386845,
+      "learning_rate": 1.2212004256882643e-06,
+      "loss": 0.4498,
+      "step": 724
+    },
+    {
+      "epoch": 0.18775695186300217,
+      "grad_norm": 3.919799887702488,
+      "learning_rate": 1.2210305894586158e-06,
+      "loss": 0.3239,
+      "step": 725
+    },
+    {
+      "epoch": 0.18775695186300217,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8860759493670886,
+      "eval_PRM F1 AUC": 0.8129910948140389,
+      "eval_PRM F1 AUC (fixed)": 0.6930330015715034,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5806451612903226,
+      "eval_PRM Precision": 0.9333333333333333,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.3035014569759369,
+      "eval_runtime": 14.3599,
+      "eval_samples_per_second": 3.064,
+      "eval_steps_per_second": 0.139,
+      "step": 725
+    },
+    {
+      "epoch": 0.18801592696902011,
+      "grad_norm": 3.465868954032309,
+      "learning_rate": 1.2208602658030287e-06,
+      "loss": 0.3427,
+      "step": 726
+    },
+    {
+      "epoch": 0.18827490207503803,
+      "grad_norm": 3.9040806750182657,
+      "learning_rate": 1.2206894548607914e-06,
+      "loss": 0.3492,
+      "step": 727
+    },
+    {
+      "epoch": 0.18853387718105596,
+      "grad_norm": 4.379059220952106,
+      "learning_rate": 1.2205181567715905e-06,
+      "loss": 0.4384,
+      "step": 728
+    },
+    {
+      "epoch": 0.1887928522870739,
+      "grad_norm": 4.134944823065672,
+      "learning_rate": 1.2203463716755117e-06,
+      "loss": 0.2962,
+      "step": 729
+    },
+    {
+      "epoch": 0.18905182739309184,
+      "grad_norm": 4.76895358133757,
+      "learning_rate": 1.2201740997130388e-06,
+      "loss": 0.4152,
+      "step": 730
+    },
+    {
+      "epoch": 0.18905182739309184,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8930817610062893,
+      "eval_PRM F1 AUC": 0.819015191199581,
+      "eval_PRM F1 AUC (fixed)": 0.6951283394447355,
+      "eval_PRM F1 Neg": 0.6792452830188679,
+      "eval_PRM NPV": 0.6,
+      "eval_PRM Precision": 0.9342105263157895,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.29401424527168274,
+      "eval_runtime": 14.755,
+      "eval_samples_per_second": 2.982,
+      "eval_steps_per_second": 0.136,
+      "step": 730
+    },
+    {
+      "epoch": 0.18931080249910978,
+      "grad_norm": 3.5289293203995435,
+      "learning_rate": 1.2200013410250528e-06,
+      "loss": 0.3676,
+      "step": 731
+    },
+    {
+      "epoch": 0.18956977760512772,
+      "grad_norm": 3.544637575803375,
+      "learning_rate": 1.219828095752834e-06,
+      "loss": 0.3552,
+      "step": 732
+    },
+    {
+      "epoch": 0.18982875271114563,
+      "grad_norm": 8.342332576696858,
+      "learning_rate": 1.2196543640380601e-06,
+      "loss": 0.4627,
+      "step": 733
+    },
+    {
+      "epoch": 0.19008772781716357,
+      "grad_norm": 6.969226338650388,
+      "learning_rate": 1.2194801460228063e-06,
+      "loss": 0.4385,
+      "step": 734
+    },
+    {
+      "epoch": 0.1903467029231815,
+      "grad_norm": 4.161712948947366,
+      "learning_rate": 1.219305441849546e-06,
+      "loss": 0.3898,
+      "step": 735
+    },
+    {
+      "epoch": 0.1903467029231815,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8944099378881988,
+      "eval_PRM F1 AUC": 0.8033001571503404,
+      "eval_PRM F1 AUC (fixed)": 0.6938187532739655,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.6071428571428571,
+      "eval_PRM Precision": 0.9230769230769231,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.7391304347826086,
+      "eval_loss": 0.2999347448348999,
+      "eval_runtime": 15.0306,
+      "eval_samples_per_second": 2.927,
+      "eval_steps_per_second": 0.133,
+      "step": 735
+    },
+    {
+      "epoch": 0.19060567802919945,
+      "grad_norm": 6.84476769969144,
+      "learning_rate": 1.21913025166115e-06,
+      "loss": 0.4164,
+      "step": 736
+    },
+    {
+      "epoch": 0.1908646531352174,
+      "grad_norm": 5.136634266840099,
+      "learning_rate": 1.2189545756008864e-06,
+      "loss": 0.3763,
+      "step": 737
+    },
+    {
+      "epoch": 0.1911236282412353,
+      "grad_norm": 7.2580426628791255,
+      "learning_rate": 1.2187784138124207e-06,
+      "loss": 0.3112,
+      "step": 738
+    },
+    {
+      "epoch": 0.19138260334725324,
+      "grad_norm": 5.718167380444347,
+      "learning_rate": 1.2186017664398158e-06,
+      "loss": 0.3891,
+      "step": 739
+    },
+    {
+      "epoch": 0.19164157845327118,
+      "grad_norm": 6.763967879398377,
+      "learning_rate": 1.218424633627532e-06,
+      "loss": 0.342,
+      "step": 740
+    },
+    {
+      "epoch": 0.19164157845327118,
+      "eval_PRM Accuracy": 0.8679245283018868,
+      "eval_PRM F1": 0.9135802469135802,
+      "eval_PRM F1 AUC": 0.8370874803562075,
+      "eval_PRM F1 AUC (fixed)": 0.6940806705081194,
+      "eval_PRM F1 Neg": 0.72,
+      "eval_PRM NPV": 0.6666666666666666,
+      "eval_PRM Precision": 0.9367088607594937,
+      "eval_PRM Recall": 0.891566265060241,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2982929050922394,
+      "eval_runtime": 14.3814,
+      "eval_samples_per_second": 3.06,
+      "eval_steps_per_second": 0.139,
+      "step": 740
+    },
+    {
+      "epoch": 0.19190055355928912,
+      "grad_norm": 4.5433183235959005,
+      "learning_rate": 1.2182470155204253e-06,
+      "loss": 0.3741,
+      "step": 741
+    },
+    {
+      "epoch": 0.19215952866530706,
+      "grad_norm": 5.452456164324737,
+      "learning_rate": 1.2180689122637499e-06,
+      "loss": 0.397,
+      "step": 742
+    },
+    {
+      "epoch": 0.192418503771325,
+      "grad_norm": 3.4223013167649468,
+      "learning_rate": 1.2178903240031563e-06,
+      "loss": 0.2803,
+      "step": 743
+    },
+    {
+      "epoch": 0.1926774788773429,
+      "grad_norm": 5.385205369812769,
+      "learning_rate": 1.217711250884692e-06,
+      "loss": 0.3934,
+      "step": 744
+    },
+    {
+      "epoch": 0.19293645398336084,
+      "grad_norm": 6.183148792048128,
+      "learning_rate": 1.2175316930547997e-06,
+      "loss": 0.4244,
+      "step": 745
+    },
+    {
+      "epoch": 0.19293645398336084,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.906832298136646,
+      "eval_PRM F1 AUC": 0.8310633839706653,
+      "eval_PRM F1 AUC (fixed)": 0.6911995809324253,
+      "eval_PRM F1 Neg": 0.7058823529411765,
+      "eval_PRM NPV": 0.6428571428571429,
+      "eval_PRM Precision": 0.9358974358974359,
+      "eval_PRM Recall": 0.8795180722891566,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.29950782656669617,
+      "eval_runtime": 14.3784,
+      "eval_samples_per_second": 3.06,
+      "eval_steps_per_second": 0.139,
+      "step": 745
+    },
+    {
+      "epoch": 0.19319542908937878,
+      "grad_norm": 3.935237830232094,
+      "learning_rate": 1.2173516506603203e-06,
+      "loss": 0.3224,
+      "step": 746
+    },
+    {
+      "epoch": 0.19345440419539672,
+      "grad_norm": 4.276810366583379,
+      "learning_rate": 1.2171711238484896e-06,
+      "loss": 0.3685,
+      "step": 747
+    },
+    {
+      "epoch": 0.19371337930141466,
+      "grad_norm": 8.221097875723666,
+      "learning_rate": 1.2169901127669401e-06,
+      "loss": 0.4421,
+      "step": 748
+    },
+    {
+      "epoch": 0.19397235440743257,
+      "grad_norm": 3.1276241732515877,
+      "learning_rate": 1.2168086175637006e-06,
+      "loss": 0.3708,
+      "step": 749
+    },
+    {
+      "epoch": 0.1942313295134505,
+      "grad_norm": 5.711025740988542,
+      "learning_rate": 1.216626638387195e-06,
+      "loss": 0.3505,
+      "step": 750
+    },
+    {
+      "epoch": 0.1942313295134505,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.6893661602933472,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.3052200376987457,
+      "eval_runtime": 14.9201,
+      "eval_samples_per_second": 2.949,
+      "eval_steps_per_second": 0.134,
+      "step": 750
+    },
+    {
+      "epoch": 0.19449030461946845,
+      "grad_norm": 4.218636733039021,
+      "learning_rate": 1.2164441753862438e-06,
+      "loss": 0.3969,
+      "step": 751
+    },
+    {
+      "epoch": 0.1947492797254864,
+      "grad_norm": 6.769566136370222,
+      "learning_rate": 1.2162612287100627e-06,
+      "loss": 0.3348,
+      "step": 752
+    },
+    {
+      "epoch": 0.19500825483150433,
+      "grad_norm": 3.4857801672629707,
+      "learning_rate": 1.216077798508263e-06,
+      "loss": 0.3256,
+      "step": 753
+    },
+    {
+      "epoch": 0.19526722993752227,
+      "grad_norm": 9.174244423244135,
+      "learning_rate": 1.2158938849308519e-06,
+      "loss": 0.368,
+      "step": 754
+    },
+    {
+      "epoch": 0.19552620504354018,
+      "grad_norm": 9.747075045547675,
+      "learning_rate": 1.2157094881282308e-06,
+      "loss": 0.336,
+      "step": 755
+    },
+    {
+      "epoch": 0.19552620504354018,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.6990570979570455,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.2928756773471832,
+      "eval_runtime": 14.2527,
+      "eval_samples_per_second": 3.087,
+      "eval_steps_per_second": 0.14,
+      "step": 755
+    },
+    {
+      "epoch": 0.19578518014955812,
+      "grad_norm": 3.251806890809459,
+      "learning_rate": 1.2155246082511975e-06,
+      "loss": 0.2617,
+      "step": 756
+    },
+    {
+      "epoch": 0.19604415525557606,
+      "grad_norm": 4.98149048932274,
+      "learning_rate": 1.2153392454509442e-06,
+      "loss": 0.3699,
+      "step": 757
+    },
+    {
+      "epoch": 0.196303130361594,
+      "grad_norm": 3.9074566654750433,
+      "learning_rate": 1.2151533998790583e-06,
+      "loss": 0.4173,
+      "step": 758
+    },
+    {
+      "epoch": 0.19656210546761194,
+      "grad_norm": 3.752364680965662,
+      "learning_rate": 1.2149670716875215e-06,
+      "loss": 0.3821,
+      "step": 759
+    },
+    {
+      "epoch": 0.19682108057362985,
+      "grad_norm": 5.348304560974054,
+      "learning_rate": 1.2147802610287107e-06,
+      "loss": 0.3873,
+      "step": 760
+    },
+    {
+      "epoch": 0.19682108057362985,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8860759493670886,
+      "eval_PRM F1 AUC": 0.8129910948140389,
+      "eval_PRM F1 AUC (fixed)": 0.711629125196438,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5806451612903226,
+      "eval_PRM Precision": 0.9333333333333333,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.28274041414260864,
+      "eval_runtime": 14.5446,
+      "eval_samples_per_second": 3.025,
+      "eval_steps_per_second": 0.138,
+      "step": 760
+    },
+    {
+      "epoch": 0.1970800556796478,
+      "grad_norm": 7.55785178982506,
+      "learning_rate": 1.2145929680553973e-06,
+      "loss": 0.324,
+      "step": 761
+    },
+    {
+      "epoch": 0.19733903078566573,
+      "grad_norm": 3.0868830616823852,
+      "learning_rate": 1.2144051929207466e-06,
+      "loss": 0.2994,
+      "step": 762
+    },
+    {
+      "epoch": 0.19759800589168366,
+      "grad_norm": 3.5417146803588118,
+      "learning_rate": 1.2142169357783194e-06,
+      "loss": 0.3483,
+      "step": 763
+    },
+    {
+      "epoch": 0.1978569809977016,
+      "grad_norm": 4.0208469768721224,
+      "learning_rate": 1.214028196782069e-06,
+      "loss": 0.4194,
+      "step": 764
+    },
+    {
+      "epoch": 0.19811595610371954,
+      "grad_norm": 3.8431699488974886,
+      "learning_rate": 1.2138389760863443e-06,
+      "loss": 0.3649,
+      "step": 765
+    },
+    {
+      "epoch": 0.19811595610371954,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8930817610062893,
+      "eval_PRM F1 AUC": 0.819015191199581,
+      "eval_PRM F1 AUC (fixed)": 0.7257726558407543,
+      "eval_PRM F1 Neg": 0.6792452830188679,
+      "eval_PRM NPV": 0.6,
+      "eval_PRM Precision": 0.9342105263157895,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.274412602186203,
+      "eval_runtime": 14.9209,
+      "eval_samples_per_second": 2.949,
+      "eval_steps_per_second": 0.134,
+      "step": 765
+    },
+    {
+      "epoch": 0.19837493120973745,
+      "grad_norm": 4.5792155524540386,
+      "learning_rate": 1.2136492738458874e-06,
+      "loss": 0.3576,
+      "step": 766
+    },
+    {
+      "epoch": 0.1986339063157554,
+      "grad_norm": 8.636004621584396,
+      "learning_rate": 1.2134590902158339e-06,
+      "loss": 0.4316,
+      "step": 767
+    },
+    {
+      "epoch": 0.19889288142177333,
+      "grad_norm": 4.140044364503692,
+      "learning_rate": 1.213268425351714e-06,
+      "loss": 0.3677,
+      "step": 768
+    },
+    {
+      "epoch": 0.19915185652779127,
+      "grad_norm": 5.324756102689371,
+      "learning_rate": 1.2130772794094504e-06,
+      "loss": 0.3403,
+      "step": 769
+    },
+    {
+      "epoch": 0.1994108316338092,
+      "grad_norm": 8.4411250018076,
+      "learning_rate": 1.21288565254536e-06,
+      "loss": 0.391,
+      "step": 770
+    },
+    {
+      "epoch": 0.1994108316338092,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8930817610062893,
+      "eval_PRM F1 AUC": 0.819015191199581,
+      "eval_PRM F1 AUC (fixed)": 0.7247249869041383,
+      "eval_PRM F1 Neg": 0.6792452830188679,
+      "eval_PRM NPV": 0.6,
+      "eval_PRM Precision": 0.9342105263157895,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2825393080711365,
+      "eval_runtime": 15.1448,
+      "eval_samples_per_second": 2.905,
+      "eval_steps_per_second": 0.132,
+      "step": 770
+    },
+    {
+      "epoch": 0.19966980673982712,
+      "grad_norm": 7.501946899653349,
+      "learning_rate": 1.2126935449161529e-06,
+      "loss": 0.3256,
+      "step": 771
+    },
+    {
+      "epoch": 0.19992878184584506,
+      "grad_norm": 5.065470925957987,
+      "learning_rate": 1.2125009566789318e-06,
+      "loss": 0.3201,
+      "step": 772
+    },
+    {
+      "epoch": 0.200187756951863,
+      "grad_norm": 3.8048849885969136,
+      "learning_rate": 1.2123078879911928e-06,
+      "loss": 0.3268,
+      "step": 773
+    },
+    {
+      "epoch": 0.20044673205788094,
+      "grad_norm": 7.635096076804379,
+      "learning_rate": 1.2121143390108253e-06,
+      "loss": 0.4506,
+      "step": 774
+    },
+    {
+      "epoch": 0.20070570716389888,
+      "grad_norm": 3.4186284893273022,
+      "learning_rate": 1.2119203098961107e-06,
+      "loss": 0.3222,
+      "step": 775
+    },
+    {
+      "epoch": 0.20070570716389888,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8974358974358975,
+      "eval_PRM F1 AUC": 0.8564693556836039,
+      "eval_PRM F1 AUC (fixed)": 0.714772132006286,
+      "eval_PRM F1 Neg": 0.7142857142857143,
+      "eval_PRM NPV": 0.6060606060606061,
+      "eval_PRM Precision": 0.958904109589041,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.2990555763244629,
+      "eval_runtime": 14.5907,
+      "eval_samples_per_second": 3.016,
+      "eval_steps_per_second": 0.137,
+      "step": 775
+    },
+    {
+      "epoch": 0.20096468226991682,
+      "grad_norm": 5.857241588906598,
+      "learning_rate": 1.211725800805724e-06,
+      "loss": 0.412,
+      "step": 776
+    },
+    {
+      "epoch": 0.20122365737593473,
+      "grad_norm": 8.636257256129669,
+      "learning_rate": 1.2115308118987314e-06,
+      "loss": 0.3583,
+      "step": 777
+    },
+    {
+      "epoch": 0.20148263248195267,
+      "grad_norm": 4.001799400777121,
+      "learning_rate": 1.2113353433345928e-06,
+      "loss": 0.4281,
+      "step": 778
+    },
+    {
+      "epoch": 0.2017416075879706,
+      "grad_norm": 5.457582326684946,
+      "learning_rate": 1.2111393952731599e-06,
+      "loss": 0.426,
+      "step": 779
+    },
+    {
+      "epoch": 0.20200058269398855,
+      "grad_norm": 5.88931960974729,
+      "learning_rate": 1.2109429678746757e-06,
+      "loss": 0.3624,
+      "step": 780
+    },
+    {
+      "epoch": 0.20200058269398855,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8987341772151899,
+      "eval_PRM F1 AUC": 0.8407543216343635,
+      "eval_PRM F1 AUC (fixed)": 0.7197485594552121,
+      "eval_PRM F1 Neg": 0.7037037037037037,
+      "eval_PRM NPV": 0.6129032258064516,
+      "eval_PRM Precision": 0.9466666666666667,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.2832641005516052,
+      "eval_runtime": 15.2286,
+      "eval_samples_per_second": 2.889,
+      "eval_steps_per_second": 0.131,
+      "step": 780
+    },
+    {
+      "epoch": 0.20225955780000648,
+      "grad_norm": 4.5606319970193905,
+      "learning_rate": 1.2107460612997768e-06,
+      "loss": 0.4612,
+      "step": 781
+    },
+    {
+      "epoch": 0.2025185329060244,
+      "grad_norm": 10.640629778364074,
+      "learning_rate": 1.2105486757094902e-06,
+      "loss": 0.3714,
+      "step": 782
+    },
+    {
+      "epoch": 0.20277750801204233,
+      "grad_norm": 10.81610998670503,
+      "learning_rate": 1.2103508112652357e-06,
+      "loss": 0.4135,
+      "step": 783
+    },
+    {
+      "epoch": 0.20303648311806027,
+      "grad_norm": 5.278795898437136,
+      "learning_rate": 1.2101524681288238e-06,
+      "loss": 0.4048,
+      "step": 784
+    },
+    {
+      "epoch": 0.2032954582240782,
+      "grad_norm": 9.07962614012763,
+      "learning_rate": 1.209953646462457e-06,
+      "loss": 0.3948,
+      "step": 785
+    },
+    {
+      "epoch": 0.2032954582240782,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.9056603773584906,
+      "eval_PRM F1 AUC": 0.8467784180199058,
+      "eval_PRM F1 AUC (fixed)": 0.7100576217915139,
+      "eval_PRM F1 Neg": 0.7169811320754716,
+      "eval_PRM NPV": 0.6333333333333333,
+      "eval_PRM Precision": 0.9473684210526315,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.28009822964668274,
+      "eval_runtime": 14.868,
+      "eval_samples_per_second": 2.959,
+      "eval_steps_per_second": 0.135,
+      "step": 785
+    },
+    {
+      "epoch": 0.20355443333009615,
+      "grad_norm": 4.945794786482562,
+      "learning_rate": 1.2097543464287291e-06,
+      "loss": 0.3626,
+      "step": 786
+    },
+    {
+      "epoch": 0.2038134084361141,
+      "grad_norm": 4.210535900275439,
+      "learning_rate": 1.2095545681906252e-06,
+      "loss": 0.4574,
+      "step": 787
+    },
+    {
+      "epoch": 0.204072383542132,
+      "grad_norm": 7.8934875649755885,
+      "learning_rate": 1.2093543119115211e-06,
+      "loss": 0.4204,
+      "step": 788
+    },
+    {
+      "epoch": 0.20433135864814994,
+      "grad_norm": 5.9298063027561705,
+      "learning_rate": 1.2091535777551837e-06,
+      "loss": 0.3544,
+      "step": 789
+    },
+    {
+      "epoch": 0.20459033375416788,
+      "grad_norm": 4.61640368794494,
+      "learning_rate": 1.2089523658857708e-06,
+      "loss": 0.3672,
+      "step": 790
+    },
+    {
+      "epoch": 0.20459033375416788,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8831168831168831,
+      "eval_PRM F1 AUC": 0.8444211629125196,
+      "eval_PRM F1 AUC (fixed)": 0.6946045049764275,
+      "eval_PRM F1 Neg": 0.6896551724137931,
+      "eval_PRM NPV": 0.5714285714285714,
+      "eval_PRM Precision": 0.9577464788732394,
+      "eval_PRM Recall": 0.8192771084337349,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.30553391575813293,
+      "eval_runtime": 14.5411,
+      "eval_samples_per_second": 3.026,
+      "eval_steps_per_second": 0.138,
+      "step": 790
+    },
+    {
+      "epoch": 0.20484930886018582,
+      "grad_norm": 3.8906893870399473,
+      "learning_rate": 1.2087506764678309e-06,
+      "loss": 0.3811,
+      "step": 791
+    },
+    {
+      "epoch": 0.20510828396620376,
+      "grad_norm": 5.048510996715175,
+      "learning_rate": 1.2085485096663026e-06,
+      "loss": 0.5011,
+      "step": 792
+    },
+    {
+      "epoch": 0.20536725907222167,
+      "grad_norm": 11.837946428436359,
+      "learning_rate": 1.2083458656465159e-06,
+      "loss": 0.3957,
+      "step": 793
+    },
+    {
+      "epoch": 0.2056262341782396,
+      "grad_norm": 11.305888044956315,
+      "learning_rate": 1.2081427445741896e-06,
+      "loss": 0.3496,
+      "step": 794
+    },
+    {
+      "epoch": 0.20588520928425755,
+      "grad_norm": 9.260364149994357,
+      "learning_rate": 1.207939146615434e-06,
+      "loss": 0.3768,
+      "step": 795
+    },
+    {
+      "epoch": 0.20588520928425755,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8846153846153846,
+      "eval_PRM F1 AUC": 0.8287061288632793,
+      "eval_PRM F1 AUC (fixed)": 0.6946045049764275,
+      "eval_PRM F1 Neg": 0.6785714285714286,
+      "eval_PRM NPV": 0.5757575757575758,
+      "eval_PRM Precision": 0.9452054794520548,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.3177688419818878,
+      "eval_runtime": 14.5323,
+      "eval_samples_per_second": 3.028,
+      "eval_steps_per_second": 0.138,
+      "step": 795
+    },
+    {
+      "epoch": 0.2061441843902755,
+      "grad_norm": 6.166600089935319,
+      "learning_rate": 1.207735071936749e-06,
+      "loss": 0.3425,
+      "step": 796
+    },
+    {
+      "epoch": 0.20640315949629343,
+      "grad_norm": 5.291436952965745,
+      "learning_rate": 1.2075305207050233e-06,
+      "loss": 0.3083,
+      "step": 797
+    },
+    {
+      "epoch": 0.20666213460231136,
+      "grad_norm": 4.946759609608186,
+      "learning_rate": 1.2073254930875372e-06,
+      "loss": 0.346,
+      "step": 798
+    },
+    {
+      "epoch": 0.20692110970832928,
+      "grad_norm": 3.2952179929570984,
+      "learning_rate": 1.2071199892519587e-06,
+      "loss": 0.3274,
+      "step": 799
+    },
+    {
+      "epoch": 0.20718008481434722,
+      "grad_norm": 3.9838080756980765,
+      "learning_rate": 1.2069140093663468e-06,
+      "loss": 0.4127,
+      "step": 800
+    },
+    {
+      "epoch": 0.20718008481434722,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.9079754601226994,
+      "eval_PRM F1 AUC": 0.8153483499214248,
+      "eval_PRM F1 AUC (fixed)": 0.710843373493976,
+      "eval_PRM F1 Neg": 0.6938775510204082,
+      "eval_PRM NPV": 0.6538461538461539,
+      "eval_PRM Precision": 0.925,
+      "eval_PRM Recall": 0.891566265060241,
+      "eval_PRM Specificty": 0.7391304347826086,
+      "eval_loss": 0.3012973964214325,
+      "eval_runtime": 14.7148,
+      "eval_samples_per_second": 2.99,
+      "eval_steps_per_second": 0.136,
+      "step": 800
+    },
+    {
+      "epoch": 0.20743905992036515,
+      "grad_norm": 5.84440802349982,
+      "learning_rate": 1.2067075535991485e-06,
+      "loss": 0.3121,
+      "step": 801
+    },
+    {
+      "epoch": 0.2076980350263831,
+      "grad_norm": 18.634255107630327,
+      "learning_rate": 1.206500622119201e-06,
+      "loss": 0.6074,
+      "step": 802
+    },
+    {
+      "epoch": 0.20795701013240103,
+      "grad_norm": 3.4684820156592164,
+      "learning_rate": 1.2062932150957302e-06,
+      "loss": 0.2838,
+      "step": 803
+    },
+    {
+      "epoch": 0.20821598523841894,
+      "grad_norm": 6.985530687578916,
+      "learning_rate": 1.2060853326983506e-06,
+      "loss": 0.3661,
+      "step": 804
+    },
+    {
+      "epoch": 0.20847496034443688,
+      "grad_norm": 15.523633503922179,
+      "learning_rate": 1.205876975097066e-06,
+      "loss": 0.5244,
+      "step": 805
+    },
+    {
+      "epoch": 0.20847496034443688,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.9079754601226994,
+      "eval_PRM F1 AUC": 0.8153483499214248,
+      "eval_PRM F1 AUC (fixed)": 0.717391304347826,
+      "eval_PRM F1 Neg": 0.6938775510204082,
+      "eval_PRM NPV": 0.6538461538461539,
+      "eval_PRM Precision": 0.925,
+      "eval_PRM Recall": 0.891566265060241,
+      "eval_PRM Specificty": 0.7391304347826086,
+      "eval_loss": 0.3000315725803375,
+      "eval_runtime": 14.3543,
+      "eval_samples_per_second": 3.065,
+      "eval_steps_per_second": 0.139,
+      "step": 805
+    },
+    {
+      "epoch": 0.20873393545045482,
+      "grad_norm": 3.215330481636461,
+      "learning_rate": 1.2056681424622682e-06,
+      "loss": 0.3055,
+      "step": 806
+    },
+    {
+      "epoch": 0.20899291055647276,
+      "grad_norm": 3.3904213572865647,
+      "learning_rate": 1.2054588349647376e-06,
+      "loss": 0.3612,
+      "step": 807
+    },
+    {
+      "epoch": 0.2092518856624907,
+      "grad_norm": 4.089578401872159,
+      "learning_rate": 1.2052490527756435e-06,
+      "loss": 0.3688,
+      "step": 808
+    },
+    {
+      "epoch": 0.20951086076850864,
+      "grad_norm": 5.149244379565398,
+      "learning_rate": 1.205038796066543e-06,
+      "loss": 0.3794,
+      "step": 809
+    },
+    {
+      "epoch": 0.20976983587452655,
+      "grad_norm": 7.982346861326755,
+      "learning_rate": 1.2048280650093808e-06,
+      "loss": 0.4222,
+      "step": 810
+    },
+    {
+      "epoch": 0.20976983587452655,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.7192247249869042,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.3014485538005829,
+      "eval_runtime": 14.5923,
+      "eval_samples_per_second": 3.015,
+      "eval_steps_per_second": 0.137,
+      "step": 810
+    },
+    {
+      "epoch": 0.2100288109805445,
+      "grad_norm": 3.3870290321601293,
+      "learning_rate": 1.2046168597764905e-06,
+      "loss": 0.3392,
+      "step": 811
+    },
+    {
+      "epoch": 0.21028778608656243,
+      "grad_norm": 5.422644541842962,
+      "learning_rate": 1.2044051805405923e-06,
+      "loss": 0.3788,
+      "step": 812
+    },
+    {
+      "epoch": 0.21054676119258037,
+      "grad_norm": 12.103695395274976,
+      "learning_rate": 1.2041930274747955e-06,
+      "loss": 0.394,
+      "step": 813
+    },
+    {
+      "epoch": 0.2108057362985983,
+      "grad_norm": 5.780235540532406,
+      "learning_rate": 1.2039804007525956e-06,
+      "loss": 0.4104,
+      "step": 814
+    },
+    {
+      "epoch": 0.21106471140461622,
+      "grad_norm": 8.248186220584325,
+      "learning_rate": 1.203767300547876e-06,
+      "loss": 0.3479,
+      "step": 815
+    },
+    {
+      "epoch": 0.21106471140461622,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8903225806451613,
+      "eval_PRM F1 AUC": 0.8504452592980618,
+      "eval_PRM F1 AUC (fixed)": 0.7168674698795181,
+      "eval_PRM F1 Neg": 0.7017543859649122,
+      "eval_PRM NPV": 0.5882352941176471,
+      "eval_PRM Precision": 0.9583333333333334,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.3021652400493622,
+      "eval_runtime": 14.4687,
+      "eval_samples_per_second": 3.041,
+      "eval_steps_per_second": 0.138,
+      "step": 815
+    },
+    {
+      "epoch": 0.21132368651063416,
+      "grad_norm": 10.434436452029244,
+      "learning_rate": 1.203553727034907e-06,
+      "loss": 0.3728,
+      "step": 816
+    },
+    {
+      "epoch": 0.2115826616166521,
+      "grad_norm": 4.209869566782344,
+      "learning_rate": 1.2033396803883467e-06,
+      "loss": 0.3499,
+      "step": 817
+    },
+    {
+      "epoch": 0.21184163672267003,
+      "grad_norm": 5.604499786309078,
+      "learning_rate": 1.2031251607832393e-06,
+      "loss": 0.4211,
+      "step": 818
+    },
+    {
+      "epoch": 0.21210061182868797,
+      "grad_norm": 3.4492243819967734,
+      "learning_rate": 1.2029101683950161e-06,
+      "loss": 0.4104,
+      "step": 819
+    },
+    {
+      "epoch": 0.2123595869347059,
+      "grad_norm": 5.627721634673,
+      "learning_rate": 1.202694703399495e-06,
+      "loss": 0.4138,
+      "step": 820
+    },
+    {
+      "epoch": 0.2123595869347059,
+      "eval_PRM Accuracy": 0.8679245283018868,
+      "eval_PRM F1": 0.9125,
+      "eval_PRM F1 AUC": 0.8528025144054479,
+      "eval_PRM F1 AUC (fixed)": 0.7187008905185961,
+      "eval_PRM F1 Neg": 0.7307692307692307,
+      "eval_PRM NPV": 0.6551724137931034,
+      "eval_PRM Precision": 0.948051948051948,
+      "eval_PRM Recall": 0.8795180722891566,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.272720068693161,
+      "eval_runtime": 14.4143,
+      "eval_samples_per_second": 3.053,
+      "eval_steps_per_second": 0.139,
+      "step": 820
+    },
+    {
+      "epoch": 0.21261856204072382,
+      "grad_norm": 4.1223242524960275,
+      "learning_rate": 1.2024787659728805e-06,
+      "loss": 0.3767,
+      "step": 821
+    },
+    {
+      "epoch": 0.21287753714674176,
+      "grad_norm": 4.041731071615488,
+      "learning_rate": 1.2022623562917634e-06,
+      "loss": 0.3681,
+      "step": 822
+    },
+    {
+      "epoch": 0.2131365122527597,
+      "grad_norm": 12.213894926599707,
+      "learning_rate": 1.2020454745331207e-06,
+      "loss": 0.5263,
+      "step": 823
+    },
+    {
+      "epoch": 0.21339548735877764,
+      "grad_norm": 4.048567978079006,
+      "learning_rate": 1.2018281208743155e-06,
+      "loss": 0.2961,
+      "step": 824
+    },
+    {
+      "epoch": 0.21365446246479558,
+      "grad_norm": 3.4978630432290467,
+      "learning_rate": 1.2016102954930965e-06,
+      "loss": 0.2978,
+      "step": 825
+    },
+    {
+      "epoch": 0.21365446246479558,
+      "eval_PRM Accuracy": 0.8679245283018868,
+      "eval_PRM F1": 0.9125,
+      "eval_PRM F1 AUC": 0.8528025144054479,
+      "eval_PRM F1 AUC (fixed)": 0.7160817181770561,
+      "eval_PRM F1 Neg": 0.7307692307692307,
+      "eval_PRM NPV": 0.6551724137931034,
+      "eval_PRM Precision": 0.948051948051948,
+      "eval_PRM Recall": 0.8795180722891566,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.27165505290031433,
+      "eval_runtime": 14.2242,
+      "eval_samples_per_second": 3.093,
+      "eval_steps_per_second": 0.141,
+      "step": 825
+    },
+    {
+      "epoch": 0.21391343757081352,
+      "grad_norm": 6.136696971864226,
+      "learning_rate": 1.2013919985675985e-06,
+      "loss": 0.4115,
+      "step": 826
+    },
+    {
+      "epoch": 0.21417241267683143,
+      "grad_norm": 7.112543853206797,
+      "learning_rate": 1.2011732302763419e-06,
+      "loss": 0.3849,
+      "step": 827
+    },
+    {
+      "epoch": 0.21443138778284937,
+      "grad_norm": 3.7784105346607646,
+      "learning_rate": 1.2009539907982324e-06,
+      "loss": 0.3712,
+      "step": 828
+    },
+    {
+      "epoch": 0.2146903628888673,
+      "grad_norm": 4.433101135916309,
+      "learning_rate": 1.2007342803125616e-06,
+      "loss": 0.3525,
+      "step": 829
+    },
+    {
+      "epoch": 0.21494933799488525,
+      "grad_norm": 3.219684081039623,
+      "learning_rate": 1.2005140989990051e-06,
+      "loss": 0.325,
+      "step": 830
+    },
+    {
+      "epoch": 0.21494933799488525,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.9056603773584906,
+      "eval_PRM F1 AUC": 0.8467784180199058,
+      "eval_PRM F1 AUC (fixed)": 0.7145102147721321,
+      "eval_PRM F1 Neg": 0.7169811320754716,
+      "eval_PRM NPV": 0.6333333333333333,
+      "eval_PRM Precision": 0.9473684210526315,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.2757134437561035,
+      "eval_runtime": 14.4793,
+      "eval_samples_per_second": 3.039,
+      "eval_steps_per_second": 0.138,
+      "step": 830
+    },
+    {
+      "epoch": 0.2152083131009032,
+      "grad_norm": 10.491754275926994,
+      "learning_rate": 1.2002934470376248e-06,
+      "loss": 0.4024,
+      "step": 831
+    },
+    {
+      "epoch": 0.2154672882069211,
+      "grad_norm": 4.998222363731994,
+      "learning_rate": 1.200072324608867e-06,
+      "loss": 0.3625,
+      "step": 832
+    },
+    {
+      "epoch": 0.21572626331293904,
+      "grad_norm": 4.470005863558178,
+      "learning_rate": 1.1998507318935624e-06,
+      "loss": 0.3332,
+      "step": 833
+    },
+    {
+      "epoch": 0.21598523841895698,
+      "grad_norm": 7.993509681116096,
+      "learning_rate": 1.1996286690729266e-06,
+      "loss": 0.369,
+      "step": 834
+    },
+    {
+      "epoch": 0.21624421352497492,
+      "grad_norm": 4.708532369425207,
+      "learning_rate": 1.1994061363285598e-06,
+      "loss": 0.3882,
+      "step": 835
+    },
+    {
+      "epoch": 0.21624421352497492,
+      "eval_PRM Accuracy": 0.8679245283018868,
+      "eval_PRM F1": 0.9113924050632911,
+      "eval_PRM F1 AUC": 0.8685175484546883,
+      "eval_PRM F1 AUC (fixed)": 0.7145102147721321,
+      "eval_PRM F1 Neg": 0.7407407407407407,
+      "eval_PRM NPV": 0.6451612903225806,
+      "eval_PRM Precision": 0.96,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.27347585558891296,
+      "eval_runtime": 15.0518,
+      "eval_samples_per_second": 2.923,
+      "eval_steps_per_second": 0.133,
+      "step": 835
+    },
+    {
+      "epoch": 0.21650318863099285,
+      "grad_norm": 3.187417433180603,
+      "learning_rate": 1.1991831338424465e-06,
+      "loss": 0.3189,
+      "step": 836
+    },
+    {
+      "epoch": 0.2167621637370108,
+      "grad_norm": 5.108923083012557,
+      "learning_rate": 1.1989596617969546e-06,
+      "loss": 0.468,
+      "step": 837
+    },
+    {
+      "epoch": 0.2170211388430287,
+      "grad_norm": 3.5092540984088227,
+      "learning_rate": 1.198735720374837e-06,
+      "loss": 0.2836,
+      "step": 838
+    },
+    {
+      "epoch": 0.21728011394904664,
+      "grad_norm": 6.365958781576424,
+      "learning_rate": 1.1985113097592302e-06,
+      "loss": 0.3103,
+      "step": 839
+    },
+    {
+      "epoch": 0.21753908905506458,
+      "grad_norm": 7.018918766044205,
+      "learning_rate": 1.1982864301336541e-06,
+      "loss": 0.3434,
+      "step": 840
+    },
+    {
+      "epoch": 0.21753908905506458,
+      "eval_PRM Accuracy": 0.8679245283018868,
+      "eval_PRM F1": 0.9125,
+      "eval_PRM F1 AUC": 0.8528025144054479,
+      "eval_PRM F1 AUC (fixed)": 0.7176532215819801,
+      "eval_PRM F1 Neg": 0.7307692307692307,
+      "eval_PRM NPV": 0.6551724137931034,
+      "eval_PRM Precision": 0.948051948051948,
+      "eval_PRM Recall": 0.8795180722891566,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.26224979758262634,
+      "eval_runtime": 14.8565,
+      "eval_samples_per_second": 2.962,
+      "eval_steps_per_second": 0.135,
+      "step": 840
+    },
+    {
+      "epoch": 0.21779806416108252,
+      "grad_norm": 3.179988198620702,
+      "learning_rate": 1.198061081682012e-06,
+      "loss": 0.292,
+      "step": 841
+    },
+    {
+      "epoch": 0.21805703926710046,
+      "grad_norm": 5.252994006042356,
+      "learning_rate": 1.1978352645885913e-06,
+      "loss": 0.469,
+      "step": 842
+    },
+    {
+      "epoch": 0.21831601437311837,
+      "grad_norm": 5.41230067605829,
+      "learning_rate": 1.1976089790380619e-06,
+      "loss": 0.3918,
+      "step": 843
+    },
+    {
+      "epoch": 0.2185749894791363,
+      "grad_norm": 6.237162379573823,
+      "learning_rate": 1.197382225215477e-06,
+      "loss": 0.4238,
+      "step": 844
+    },
+    {
+      "epoch": 0.21883396458515425,
+      "grad_norm": 5.260596050836425,
+      "learning_rate": 1.1971550033062737e-06,
+      "loss": 0.437,
+      "step": 845
+    },
+    {
+      "epoch": 0.21883396458515425,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8903225806451613,
+      "eval_PRM F1 AUC": 0.8504452592980618,
+      "eval_PRM F1 AUC (fixed)": 0.7082242011524359,
+      "eval_PRM F1 Neg": 0.7017543859649122,
+      "eval_PRM NPV": 0.5882352941176471,
+      "eval_PRM Precision": 0.9583333333333334,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.2731127440929413,
+      "eval_runtime": 15.0799,
+      "eval_samples_per_second": 2.918,
+      "eval_steps_per_second": 0.133,
+      "step": 845
+    },
+    {
+      "epoch": 0.2190929396911722,
+      "grad_norm": 3.8809428532933423,
+      "learning_rate": 1.19692731349627e-06,
+      "loss": 0.4406,
+      "step": 846
+    },
+    {
+      "epoch": 0.21935191479719013,
+      "grad_norm": 10.17440956775982,
+      "learning_rate": 1.1966991559716685e-06,
+      "loss": 0.3781,
+      "step": 847
+    },
+    {
+      "epoch": 0.21961088990320807,
+      "grad_norm": 8.224360422397567,
+      "learning_rate": 1.1964705309190531e-06,
+      "loss": 0.3955,
+      "step": 848
+    },
+    {
+      "epoch": 0.21986986500922598,
+      "grad_norm": 6.917395590081431,
+      "learning_rate": 1.1962414385253898e-06,
+      "loss": 0.3605,
+      "step": 849
+    },
+    {
+      "epoch": 0.22012884011524392,
+      "grad_norm": 5.291250727527,
+      "learning_rate": 1.1960118789780282e-06,
+      "loss": 0.3373,
+      "step": 850
+    },
+    {
+      "epoch": 0.22012884011524392,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8903225806451613,
+      "eval_PRM F1 AUC": 0.8504452592980618,
+      "eval_PRM F1 AUC (fixed)": 0.7048192771084338,
+      "eval_PRM F1 Neg": 0.7017543859649122,
+      "eval_PRM NPV": 0.5882352941176471,
+      "eval_PRM Precision": 0.9583333333333334,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.2853865921497345,
+      "eval_runtime": 14.6096,
+      "eval_samples_per_second": 3.012,
+      "eval_steps_per_second": 0.137,
+      "step": 850
+    },
+    {
+      "epoch": 0.22038781522126186,
+      "grad_norm": 4.169023666456844,
+      "learning_rate": 1.1957818524646987e-06,
+      "loss": 0.4194,
+      "step": 851
+    },
+    {
+      "epoch": 0.2206467903272798,
+      "grad_norm": 3.8927309085937742,
+      "learning_rate": 1.1955513591735137e-06,
+      "loss": 0.3856,
+      "step": 852
+    },
+    {
+      "epoch": 0.22090576543329773,
+      "grad_norm": 4.616525144202818,
+      "learning_rate": 1.195320399292968e-06,
+      "loss": 0.3722,
+      "step": 853
+    },
+    {
+      "epoch": 0.22116474053931565,
+      "grad_norm": 4.846970920598354,
+      "learning_rate": 1.1950889730119374e-06,
+      "loss": 0.4251,
+      "step": 854
+    },
+    {
+      "epoch": 0.22142371564533359,
+      "grad_norm": 3.389416043470305,
+      "learning_rate": 1.194857080519679e-06,
+      "loss": 0.3592,
+      "step": 855
+    },
+    {
+      "epoch": 0.22142371564533359,
+      "eval_PRM Accuracy": 0.8867924528301887,
+      "eval_PRM F1": 0.925,
+      "eval_PRM F1 AUC": 0.8805657412257727,
+      "eval_PRM F1 AUC (fixed)": 0.7032477737035098,
+      "eval_PRM F1 Neg": 0.7692307692307693,
+      "eval_PRM NPV": 0.6896551724137931,
+      "eval_PRM Precision": 0.961038961038961,
+      "eval_PRM Recall": 0.891566265060241,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.26908186078071594,
+      "eval_runtime": 14.562,
+      "eval_samples_per_second": 3.022,
+      "eval_steps_per_second": 0.137,
+      "step": 855
+    },
+    {
+      "epoch": 0.22168269075135152,
+      "grad_norm": 5.107553289534113,
+      "learning_rate": 1.1946247220058315e-06,
+      "loss": 0.3464,
+      "step": 856
+    },
+    {
+      "epoch": 0.22194166585736946,
+      "grad_norm": 4.546089365240697,
+      "learning_rate": 1.194391897660415e-06,
+      "loss": 0.4066,
+      "step": 857
+    },
+    {
+      "epoch": 0.2222006409633874,
+      "grad_norm": 3.0429013571459382,
+      "learning_rate": 1.1941586076738298e-06,
+      "loss": 0.3494,
+      "step": 858
+    },
+    {
+      "epoch": 0.22245961606940534,
+      "grad_norm": 4.515604834735779,
+      "learning_rate": 1.1939248522368574e-06,
+      "loss": 0.3247,
+      "step": 859
+    },
+    {
+      "epoch": 0.22271859117542325,
+      "grad_norm": 6.328796625019218,
+      "learning_rate": 1.1936906315406602e-06,
+      "loss": 0.4285,
+      "step": 860
+    },
+    {
+      "epoch": 0.22271859117542325,
+      "eval_PRM Accuracy": 0.8773584905660378,
+      "eval_PRM F1": 0.9202453987730062,
+      "eval_PRM F1 AUC": 0.8431115767417497,
+      "eval_PRM F1 AUC (fixed)": 0.7066526977475118,
+      "eval_PRM F1 Neg": 0.7346938775510204,
+      "eval_PRM NPV": 0.6923076923076923,
+      "eval_PRM Precision": 0.9375,
+      "eval_PRM Recall": 0.9036144578313253,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2668800354003906,
+      "eval_runtime": 14.4032,
+      "eval_samples_per_second": 3.055,
+      "eval_steps_per_second": 0.139,
+      "step": 860
+    },
+    {
+      "epoch": 0.2229775662814412,
+      "grad_norm": 4.003627406455415,
+      "learning_rate": 1.1934559457767803e-06,
+      "loss": 0.3303,
+      "step": 861
+    },
+    {
+      "epoch": 0.22323654138745913,
+      "grad_norm": 2.9568343764262015,
+      "learning_rate": 1.193220795137141e-06,
+      "loss": 0.3514,
+      "step": 862
+    },
+    {
+      "epoch": 0.22349551649347707,
+      "grad_norm": 8.797213234245561,
+      "learning_rate": 1.1929851798140452e-06,
+      "loss": 0.3842,
+      "step": 863
+    },
+    {
+      "epoch": 0.223754491599495,
+      "grad_norm": 2.5474802896901565,
+      "learning_rate": 1.1927491000001762e-06,
+      "loss": 0.2886,
+      "step": 864
+    },
+    {
+      "epoch": 0.22401346670551292,
+      "grad_norm": 3.3874524772324275,
+      "learning_rate": 1.1925125558885966e-06,
+      "loss": 0.3237,
+      "step": 865
+    },
+    {
+      "epoch": 0.22401346670551292,
+      "eval_PRM Accuracy": 0.8867924528301887,
+      "eval_PRM F1": 0.9259259259259259,
+      "eval_PRM F1 AUC": 0.8648507071765322,
+      "eval_PRM F1 AUC (fixed)": 0.7056050288108958,
+      "eval_PRM F1 Neg": 0.76,
+      "eval_PRM NPV": 0.7037037037037037,
+      "eval_PRM Precision": 0.9493670886075949,
+      "eval_PRM Recall": 0.9036144578313253,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.26945021748542786,
+      "eval_runtime": 14.3503,
+      "eval_samples_per_second": 3.066,
+      "eval_steps_per_second": 0.139,
+      "step": 865
+    },
+    {
+      "epoch": 0.22427244181153086,
+      "grad_norm": 6.980144378433547,
+      "learning_rate": 1.1922755476727493e-06,
+      "loss": 0.4359,
+      "step": 866
+    },
+    {
+      "epoch": 0.2245314169175488,
+      "grad_norm": 3.675259629117122,
+      "learning_rate": 1.1920380755464567e-06,
+      "loss": 0.4484,
+      "step": 867
+    },
+    {
+      "epoch": 0.22479039202356674,
+      "grad_norm": 3.970800178023882,
+      "learning_rate": 1.19180013970392e-06,
+      "loss": 0.4649,
+      "step": 868
+    },
+    {
+      "epoch": 0.22504936712958468,
+      "grad_norm": 5.593595197945199,
+      "learning_rate": 1.1915617403397198e-06,
+      "loss": 0.406,
+      "step": 869
+    },
+    {
+      "epoch": 0.22530834223560262,
+      "grad_norm": 3.4055613682905475,
+      "learning_rate": 1.1913228776488164e-06,
+      "loss": 0.3813,
+      "step": 870
+    },
+    {
+      "epoch": 0.22530834223560262,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.6998428496595076,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.2825016975402832,
+      "eval_runtime": 14.7056,
+      "eval_samples_per_second": 2.992,
+      "eval_steps_per_second": 0.136,
+      "step": 870
+    },
+    {
+      "epoch": 0.22556731734162053,
+      "grad_norm": 4.766583139189498,
+      "learning_rate": 1.1910835518265488e-06,
+      "loss": 0.406,
+      "step": 871
+    },
+    {
+      "epoch": 0.22582629244763847,
+      "grad_norm": 5.360701882443408,
+      "learning_rate": 1.1908437630686337e-06,
+      "loss": 0.2926,
+      "step": 872
+    },
+    {
+      "epoch": 0.2260852675536564,
+      "grad_norm": 8.516057938457399,
+      "learning_rate": 1.1906035115711675e-06,
+      "loss": 0.3621,
+      "step": 873
+    },
+    {
+      "epoch": 0.22634424265967434,
+      "grad_norm": 6.787723362329659,
+      "learning_rate": 1.190362797530625e-06,
+      "loss": 0.327,
+      "step": 874
+    },
+    {
+      "epoch": 0.22660321776569228,
+      "grad_norm": 3.657201137384946,
+      "learning_rate": 1.1901216211438586e-06,
+      "loss": 0.3264,
+      "step": 875
+    },
+    {
+      "epoch": 0.22660321776569228,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8974358974358975,
+      "eval_PRM F1 AUC": 0.8564693556836039,
+      "eval_PRM F1 AUC (fixed)": 0.6948664222105815,
+      "eval_PRM F1 Neg": 0.7142857142857143,
+      "eval_PRM NPV": 0.6060606060606061,
+      "eval_PRM Precision": 0.958904109589041,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.29068121314048767,
+      "eval_runtime": 14.7585,
+      "eval_samples_per_second": 2.981,
+      "eval_steps_per_second": 0.136,
+      "step": 875
+    },
+    {
+      "epoch": 0.2268621928717102,
+      "grad_norm": 4.078588375063669,
+      "learning_rate": 1.1898799826080994e-06,
+      "loss": 0.4119,
+      "step": 876
+    },
+    {
+      "epoch": 0.22712116797772813,
+      "grad_norm": 3.2953125555811984,
+      "learning_rate": 1.189637882120956e-06,
+      "loss": 0.3044,
+      "step": 877
+    },
+    {
+      "epoch": 0.22738014308374607,
+      "grad_norm": 7.182771434003031,
+      "learning_rate": 1.1893953198804152e-06,
+      "loss": 0.3758,
+      "step": 878
+    },
+    {
+      "epoch": 0.227639118189764,
+      "grad_norm": 4.247871537462031,
+      "learning_rate": 1.1891522960848409e-06,
+      "loss": 0.3703,
+      "step": 879
+    },
+    {
+      "epoch": 0.22789809329578195,
+      "grad_norm": 3.4826649057243224,
+      "learning_rate": 1.1889088109329752e-06,
+      "loss": 0.3483,
+      "step": 880
+    },
+    {
+      "epoch": 0.22789809329578195,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.9056603773584906,
+      "eval_PRM F1 AUC": 0.8467784180199058,
+      "eval_PRM F1 AUC (fixed)": 0.7103195390256679,
+      "eval_PRM F1 Neg": 0.7169811320754716,
+      "eval_PRM NPV": 0.6333333333333333,
+      "eval_PRM Precision": 0.9473684210526315,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.2728223502635956,
+      "eval_runtime": 15.0548,
+      "eval_samples_per_second": 2.923,
+      "eval_steps_per_second": 0.133,
+      "step": 880
+    },
+    {
+      "epoch": 0.2281570684017999,
+      "grad_norm": 5.741320223413004,
+      "learning_rate": 1.1886648646239365e-06,
+      "loss": 0.3574,
+      "step": 881
+    },
+    {
+      "epoch": 0.2284160435078178,
+      "grad_norm": 4.062167022584372,
+      "learning_rate": 1.188420457357221e-06,
+      "loss": 0.4174,
+      "step": 882
+    },
+    {
+      "epoch": 0.22867501861383574,
+      "grad_norm": 2.526453290531781,
+      "learning_rate": 1.1881755893327022e-06,
+      "loss": 0.317,
+      "step": 883
+    },
+    {
+      "epoch": 0.22893399371985368,
+      "grad_norm": 3.0807541085440304,
+      "learning_rate": 1.1879302607506295e-06,
+      "loss": 0.3288,
+      "step": 884
+    },
+    {
+      "epoch": 0.22919296882587162,
+      "grad_norm": 3.8308465141169763,
+      "learning_rate": 1.1876844718116293e-06,
+      "loss": 0.4456,
+      "step": 885
+    },
+    {
+      "epoch": 0.22919296882587162,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.9056603773584906,
+      "eval_PRM F1 AUC": 0.8467784180199058,
+      "eval_PRM F1 AUC (fixed)": 0.71634363541121,
+      "eval_PRM F1 Neg": 0.7169811320754716,
+      "eval_PRM NPV": 0.6333333333333333,
+      "eval_PRM Precision": 0.9473684210526315,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.26763397455215454,
+      "eval_runtime": 14.9954,
+      "eval_samples_per_second": 2.934,
+      "eval_steps_per_second": 0.133,
+      "step": 885
+    },
+    {
+      "epoch": 0.22945194393188956,
+      "grad_norm": 3.024120524976241,
+      "learning_rate": 1.1874382227167049e-06,
+      "loss": 0.3371,
+      "step": 886
+    },
+    {
+      "epoch": 0.22971091903790747,
+      "grad_norm": 3.82411760033903,
+      "learning_rate": 1.1871915136672352e-06,
+      "loss": 0.4065,
+      "step": 887
+    },
+    {
+      "epoch": 0.2299698941439254,
+      "grad_norm": 3.8886412588863,
+      "learning_rate": 1.1869443448649758e-06,
+      "loss": 0.269,
+      "step": 888
+    },
+    {
+      "epoch": 0.23022886924994335,
+      "grad_norm": 4.071708730287361,
+      "learning_rate": 1.1866967165120583e-06,
+      "loss": 0.2922,
+      "step": 889
+    },
+    {
+      "epoch": 0.23048784435596129,
+      "grad_norm": 5.072664995850144,
+      "learning_rate": 1.1864486288109894e-06,
+      "loss": 0.4196,
+      "step": 890
+    },
+    {
+      "epoch": 0.23048784435596129,
+      "eval_PRM Accuracy": 0.8679245283018868,
+      "eval_PRM F1": 0.9113924050632911,
+      "eval_PRM F1 AUC": 0.8685175484546883,
+      "eval_PRM F1 AUC (fixed)": 0.7239392352016762,
+      "eval_PRM F1 Neg": 0.7407407407407407,
+      "eval_PRM NPV": 0.6451612903225806,
+      "eval_PRM Precision": 0.96,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.2615525424480438,
+      "eval_runtime": 14.7332,
+      "eval_samples_per_second": 2.986,
+      "eval_steps_per_second": 0.136,
+      "step": 890
+    },
+    {
+      "epoch": 0.23074681946197922,
+      "grad_norm": 3.0759707900811657,
+      "learning_rate": 1.186200081964652e-06,
+      "loss": 0.3235,
+      "step": 891
+    },
+    {
+      "epoch": 0.23100579456799716,
+      "grad_norm": 4.164881209108914,
+      "learning_rate": 1.185951076176305e-06,
+      "loss": 0.3374,
+      "step": 892
+    },
+    {
+      "epoch": 0.23126476967401507,
+      "grad_norm": 4.746338390873242,
+      "learning_rate": 1.1857016116495815e-06,
+      "loss": 0.3589,
+      "step": 893
+    },
+    {
+      "epoch": 0.23152374478003301,
+      "grad_norm": 4.619158986837625,
+      "learning_rate": 1.1854516885884903e-06,
+      "loss": 0.2584,
+      "step": 894
+    },
+    {
+      "epoch": 0.23178271988605095,
+      "grad_norm": 3.02965756184151,
+      "learning_rate": 1.1852013071974155e-06,
+      "loss": 0.3908,
+      "step": 895
+    },
+    {
+      "epoch": 0.23178271988605095,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.9044585987261147,
+      "eval_PRM F1 AUC": 0.8624934520691462,
+      "eval_PRM F1 AUC (fixed)": 0.7202723939235202,
+      "eval_PRM F1 Neg": 0.7272727272727273,
+      "eval_PRM NPV": 0.625,
+      "eval_PRM Precision": 0.9594594594594594,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.2613525986671448,
+      "eval_runtime": 14.5307,
+      "eval_samples_per_second": 3.028,
+      "eval_steps_per_second": 0.138,
+      "step": 895
+    },
+    {
+      "epoch": 0.2320416949920689,
+      "grad_norm": 6.098313346871557,
+      "learning_rate": 1.1849504676811156e-06,
+      "loss": 0.3305,
+      "step": 896
+    },
+    {
+      "epoch": 0.23230067009808683,
+      "grad_norm": 6.268537137431423,
+      "learning_rate": 1.1846991702447233e-06,
+      "loss": 0.3817,
+      "step": 897
+    },
+    {
+      "epoch": 0.23255964520410474,
+      "grad_norm": 4.935579305034822,
+      "learning_rate": 1.184447415093747e-06,
+      "loss": 0.3596,
+      "step": 898
+    },
+    {
+      "epoch": 0.23281862031012268,
+      "grad_norm": 4.467145665647315,
+      "learning_rate": 1.1841952024340688e-06,
+      "loss": 0.416,
+      "step": 899
+    },
+    {
+      "epoch": 0.23307759541614062,
+      "grad_norm": 4.170804728572236,
+      "learning_rate": 1.1839425324719442e-06,
+      "loss": 0.3559,
+      "step": 900
+    },
+    {
+      "epoch": 0.23307759541614062,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8987341772151899,
+      "eval_PRM F1 AUC": 0.8407543216343635,
+      "eval_PRM F1 AUC (fixed)": 0.71503404924044,
+      "eval_PRM F1 Neg": 0.7037037037037037,
+      "eval_PRM NPV": 0.6129032258064516,
+      "eval_PRM Precision": 0.9466666666666667,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.2619946002960205,
+      "eval_runtime": 14.6743,
+      "eval_samples_per_second": 2.998,
+      "eval_steps_per_second": 0.136,
+      "step": 900
+    },
+    {
+      "epoch": 0.23333657052215856,
+      "grad_norm": 3.561851713362729,
+      "learning_rate": 1.183689405414004e-06,
+      "loss": 0.37,
+      "step": 901
+    },
+    {
+      "epoch": 0.2335955456281765,
+      "grad_norm": 5.391340666602356,
+      "learning_rate": 1.183435821467252e-06,
+      "loss": 0.2998,
+      "step": 902
+    },
+    {
+      "epoch": 0.23385452073419444,
+      "grad_norm": 4.479966992834465,
+      "learning_rate": 1.1831817808390655e-06,
+      "loss": 0.4816,
+      "step": 903
+    },
+    {
+      "epoch": 0.23411349584021235,
+      "grad_norm": 3.788280129003505,
+      "learning_rate": 1.1829272837371958e-06,
+      "loss": 0.4445,
+      "step": 904
+    },
+    {
+      "epoch": 0.2343724709462303,
+      "grad_norm": 6.620416351536968,
+      "learning_rate": 1.1826723303697673e-06,
+      "loss": 0.4148,
+      "step": 905
+    },
+    {
+      "epoch": 0.2343724709462303,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.9056603773584906,
+      "eval_PRM F1 AUC": 0.8467784180199058,
+      "eval_PRM F1 AUC (fixed)": 0.7116291251964378,
+      "eval_PRM F1 Neg": 0.7169811320754716,
+      "eval_PRM NPV": 0.6333333333333333,
+      "eval_PRM Precision": 0.9473684210526315,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.2720625102519989,
+      "eval_runtime": 15.08,
+      "eval_samples_per_second": 2.918,
+      "eval_steps_per_second": 0.133,
+      "step": 905
+    },
+    {
+      "epoch": 0.23463144605224823,
+      "grad_norm": 3.4257473666984324,
+      "learning_rate": 1.1824169209452774e-06,
+      "loss": 0.3041,
+      "step": 906
+    },
+    {
+      "epoch": 0.23489042115826617,
+      "grad_norm": 4.939739069415202,
+      "learning_rate": 1.1821610556725966e-06,
+      "loss": 0.435,
+      "step": 907
+    },
+    {
+      "epoch": 0.2351493962642841,
+      "grad_norm": 5.255878093381102,
+      "learning_rate": 1.181904734760968e-06,
+      "loss": 0.4064,
+      "step": 908
+    },
+    {
+      "epoch": 0.23540837137030202,
+      "grad_norm": 8.85032004547169,
+      "learning_rate": 1.1816479584200078e-06,
+      "loss": 0.3155,
+      "step": 909
+    },
+    {
+      "epoch": 0.23566734647631996,
+      "grad_norm": 3.6772122279451294,
+      "learning_rate": 1.1813907268597038e-06,
+      "loss": 0.3787,
+      "step": 910
+    },
+    {
+      "epoch": 0.23566734647631996,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.9056603773584906,
+      "eval_PRM F1 AUC": 0.8467784180199058,
+      "eval_PRM F1 AUC (fixed)": 0.712676794133054,
+      "eval_PRM F1 Neg": 0.7169811320754716,
+      "eval_PRM NPV": 0.6333333333333333,
+      "eval_PRM Precision": 0.9473684210526315,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.280823677778244,
+      "eval_runtime": 13.5068,
+      "eval_samples_per_second": 3.258,
+      "eval_steps_per_second": 0.148,
+      "step": 910
+    },
+    {
+      "epoch": 0.2359263215823379,
+      "grad_norm": 4.360653413098666,
+      "learning_rate": 1.1811330402904171e-06,
+      "loss": 0.3677,
+      "step": 911
+    },
+    {
+      "epoch": 0.23618529668835583,
+      "grad_norm": 3.384814109696639,
+      "learning_rate": 1.18087489892288e-06,
+      "loss": 0.313,
+      "step": 912
+    },
+    {
+      "epoch": 0.23644427179437377,
+      "grad_norm": 3.0761177527594104,
+      "learning_rate": 1.1806163029681972e-06,
+      "loss": 0.2976,
+      "step": 913
+    },
+    {
+      "epoch": 0.2367032469003917,
+      "grad_norm": 3.0945972922107345,
+      "learning_rate": 1.1803572526378453e-06,
+      "loss": 0.3056,
+      "step": 914
+    },
+    {
+      "epoch": 0.23696222200640962,
+      "grad_norm": 7.625548103055213,
+      "learning_rate": 1.1800977481436718e-06,
+      "loss": 0.3014,
+      "step": 915
+    },
+    {
+      "epoch": 0.23696222200640962,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.9056603773584906,
+      "eval_PRM F1 AUC": 0.8467784180199058,
+      "eval_PRM F1 AUC (fixed)": 0.7210581456259822,
+      "eval_PRM F1 Neg": 0.7169811320754716,
+      "eval_PRM NPV": 0.6333333333333333,
+      "eval_PRM Precision": 0.9473684210526315,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.2804136276245117,
+      "eval_runtime": 14.4877,
+      "eval_samples_per_second": 3.037,
+      "eval_steps_per_second": 0.138,
+      "step": 915
+    },
+    {
+      "epoch": 0.23722119711242756,
+      "grad_norm": 4.106895071256707,
+      "learning_rate": 1.1798377896978964e-06,
+      "loss": 0.3447,
+      "step": 916
+    },
+    {
+      "epoch": 0.2374801722184455,
+      "grad_norm": 3.4879165088232758,
+      "learning_rate": 1.1795773775131094e-06,
+      "loss": 0.3609,
+      "step": 917
+    },
+    {
+      "epoch": 0.23773914732446344,
+      "grad_norm": 4.94351615997525,
+      "learning_rate": 1.1793165118022725e-06,
+      "loss": 0.464,
+      "step": 918
+    },
+    {
+      "epoch": 0.23799812243048138,
+      "grad_norm": 9.395892112887031,
+      "learning_rate": 1.1790551927787186e-06,
+      "loss": 0.3857,
+      "step": 919
+    },
+    {
+      "epoch": 0.2382570975364993,
+      "grad_norm": 4.4953539881083575,
+      "learning_rate": 1.1787934206561506e-06,
+      "loss": 0.3387,
+      "step": 920
+    },
+    {
+      "epoch": 0.2382570975364993,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8987341772151899,
+      "eval_PRM F1 AUC": 0.8407543216343635,
+      "eval_PRM F1 AUC (fixed)": 0.7482975379779989,
+      "eval_PRM F1 Neg": 0.7037037037037037,
+      "eval_PRM NPV": 0.6129032258064516,
+      "eval_PRM Precision": 0.9466666666666667,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.2711288332939148,
+      "eval_runtime": 14.5297,
+      "eval_samples_per_second": 3.028,
+      "eval_steps_per_second": 0.138,
+      "step": 920
+    },
+    {
+      "epoch": 0.23851607264251723,
+      "grad_norm": 4.288113954542933,
+      "learning_rate": 1.178531195648642e-06,
+      "loss": 0.3936,
+      "step": 921
+    },
+    {
+      "epoch": 0.23877504774853517,
+      "grad_norm": 4.977864839923052,
+      "learning_rate": 1.1782685179706375e-06,
+      "loss": 0.4172,
+      "step": 922
+    },
+    {
+      "epoch": 0.2390340228545531,
+      "grad_norm": 6.67201876896054,
+      "learning_rate": 1.1780053878369513e-06,
+      "loss": 0.388,
+      "step": 923
+    },
+    {
+      "epoch": 0.23929299796057105,
+      "grad_norm": 6.880680332320413,
+      "learning_rate": 1.1777418054627677e-06,
+      "loss": 0.3382,
+      "step": 924
+    },
+    {
+      "epoch": 0.23955197306658899,
+      "grad_norm": 3.9508208402930105,
+      "learning_rate": 1.1774777710636406e-06,
+      "loss": 0.3966,
+      "step": 925
+    },
+    {
+      "epoch": 0.23955197306658899,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8888888888888888,
+      "eval_PRM F1 AUC": 0.8661602933473023,
+      "eval_PRM F1 AUC (fixed)": 0.7482975379779989,
+      "eval_PRM F1 Neg": 0.711864406779661,
+      "eval_PRM NPV": 0.5833333333333334,
+      "eval_PRM Precision": 0.9714285714285714,
+      "eval_PRM Recall": 0.8192771084337349,
+      "eval_PRM Specificty": 0.9130434782608695,
+      "eval_loss": 0.2894640564918518,
+      "eval_runtime": 14.5853,
+      "eval_samples_per_second": 3.017,
+      "eval_steps_per_second": 0.137,
+      "step": 925
+    },
+    {
+      "epoch": 0.2398109481726069,
+      "grad_norm": 10.535536833190756,
+      "learning_rate": 1.1772132848554942e-06,
+      "loss": 0.3728,
+      "step": 926
+    },
+    {
+      "epoch": 0.24006992327862484,
+      "grad_norm": 6.648969924884001,
+      "learning_rate": 1.1769483470546216e-06,
+      "loss": 0.3397,
+      "step": 927
+    },
+    {
+      "epoch": 0.24032889838464278,
+      "grad_norm": 3.638658941745989,
+      "learning_rate": 1.1766829578776858e-06,
+      "loss": 0.3116,
+      "step": 928
+    },
+    {
+      "epoch": 0.24058787349066071,
+      "grad_norm": 6.1916710161098525,
+      "learning_rate": 1.176417117541718e-06,
+      "loss": 0.3743,
+      "step": 929
+    },
+    {
+      "epoch": 0.24084684859667865,
+      "grad_norm": 6.466301555599048,
+      "learning_rate": 1.1761508262641195e-06,
+      "loss": 0.432,
+      "step": 930
+    },
+    {
+      "epoch": 0.24084684859667865,
+      "eval_PRM Accuracy": 0.8679245283018868,
+      "eval_PRM F1": 0.9102564102564102,
+      "eval_PRM F1 AUC": 0.8842325825039288,
+      "eval_PRM F1 AUC (fixed)": 0.7551073860660031,
+      "eval_PRM F1 Neg": 0.75,
+      "eval_PRM NPV": 0.6363636363636364,
+      "eval_PRM Precision": 0.9726027397260274,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.9130434782608695,
+      "eval_loss": 0.26407501101493835,
+      "eval_runtime": 14.429,
+      "eval_samples_per_second": 3.049,
+      "eval_steps_per_second": 0.139,
+      "step": 930
+    },
+    {
+      "epoch": 0.24110582370269656,
+      "grad_norm": 3.5072923022044473,
+      "learning_rate": 1.1758840842626593e-06,
+      "loss": 0.3742,
+      "step": 931
+    },
+    {
+      "epoch": 0.2413647988087145,
+      "grad_norm": 4.137152539221647,
+      "learning_rate": 1.1756168917554759e-06,
+      "loss": 0.3656,
+      "step": 932
+    },
+    {
+      "epoch": 0.24162377391473244,
+      "grad_norm": 3.7639799069758637,
+      "learning_rate": 1.1753492489610755e-06,
+      "loss": 0.3303,
+      "step": 933
+    },
+    {
+      "epoch": 0.24188274902075038,
+      "grad_norm": 2.896848508314599,
+      "learning_rate": 1.175081156098333e-06,
+      "loss": 0.3401,
+      "step": 934
+    },
+    {
+      "epoch": 0.24214172412676832,
+      "grad_norm": 9.300379803883216,
+      "learning_rate": 1.1748126133864908e-06,
+      "loss": 0.4256,
+      "step": 935
+    },
+    {
+      "epoch": 0.24214172412676832,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8987341772151899,
+      "eval_PRM F1 AUC": 0.8407543216343635,
+      "eval_PRM F1 AUC (fixed)": 0.7503928758512309,
+      "eval_PRM F1 Neg": 0.7037037037037037,
+      "eval_PRM NPV": 0.6129032258064516,
+      "eval_PRM Precision": 0.9466666666666667,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.25802791118621826,
+      "eval_runtime": 14.7761,
+      "eval_samples_per_second": 2.978,
+      "eval_steps_per_second": 0.135,
+      "step": 935
+    },
+    {
+      "epoch": 0.24240069923278626,
+      "grad_norm": 6.945735757870045,
+      "learning_rate": 1.1745436210451603e-06,
+      "loss": 0.403,
+      "step": 936
+    },
+    {
+      "epoch": 0.24265967433880417,
+      "grad_norm": 5.168673525936932,
+      "learning_rate": 1.1742741792943193e-06,
+      "loss": 0.3643,
+      "step": 937
+    },
+    {
+      "epoch": 0.2429186494448221,
+      "grad_norm": 3.9301017982836597,
+      "learning_rate": 1.1740042883543139e-06,
+      "loss": 0.2894,
+      "step": 938
+    },
+    {
+      "epoch": 0.24317762455084005,
+      "grad_norm": 3.8086762466056783,
+      "learning_rate": 1.1737339484458574e-06,
+      "loss": 0.3478,
+      "step": 939
+    },
+    {
+      "epoch": 0.243436599656858,
+      "grad_norm": 10.598569677321471,
+      "learning_rate": 1.1734631597900301e-06,
+      "loss": 0.4391,
+      "step": 940
+    },
+    {
+      "epoch": 0.243436599656858,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.881578947368421,
+      "eval_PRM F1 AUC": 0.8601361969617601,
+      "eval_PRM F1 AUC (fixed)": 0.7454164484023048,
+      "eval_PRM F1 Neg": 0.7,
+      "eval_PRM NPV": 0.5675675675675675,
+      "eval_PRM Precision": 0.9710144927536232,
+      "eval_PRM Recall": 0.8072289156626506,
+      "eval_PRM Specificty": 0.9130434782608695,
+      "eval_loss": 0.26957109570503235,
+      "eval_runtime": 14.7665,
+      "eval_samples_per_second": 2.98,
+      "eval_steps_per_second": 0.135,
+      "step": 940
+    },
+    {
+      "epoch": 0.24369557476287593,
+      "grad_norm": 5.764724413638612,
+      "learning_rate": 1.1731919226082793e-06,
+      "loss": 0.365,
+      "step": 941
+    },
+    {
+      "epoch": 0.24395454986889387,
+      "grad_norm": 5.9502788053858895,
+      "learning_rate": 1.1729202371224194e-06,
+      "loss": 0.3258,
+      "step": 942
+    },
+    {
+      "epoch": 0.24421352497491178,
+      "grad_norm": 6.031412246354583,
+      "learning_rate": 1.1726481035546311e-06,
+      "loss": 0.3288,
+      "step": 943
+    },
+    {
+      "epoch": 0.24447250008092972,
+      "grad_norm": 3.945656622656256,
+      "learning_rate": 1.1723755221274619e-06,
+      "loss": 0.28,
+      "step": 944
+    },
+    {
+      "epoch": 0.24473147518694766,
+      "grad_norm": 3.3620655142691787,
+      "learning_rate": 1.1721024930638248e-06,
+      "loss": 0.34,
+      "step": 945
+    },
+    {
+      "epoch": 0.24473147518694766,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8974358974358975,
+      "eval_PRM F1 AUC": 0.8564693556836039,
+      "eval_PRM F1 AUC (fixed)": 0.7407019381875327,
+      "eval_PRM F1 Neg": 0.7142857142857143,
+      "eval_PRM NPV": 0.6060606060606061,
+      "eval_PRM Precision": 0.958904109589041,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.2563490867614746,
+      "eval_runtime": 14.652,
+      "eval_samples_per_second": 3.003,
+      "eval_steps_per_second": 0.136,
+      "step": 945
+    },
+    {
+      "epoch": 0.2449904502929656,
+      "grad_norm": 3.5293565846531973,
+      "learning_rate": 1.1718290165869995e-06,
+      "loss": 0.3143,
+      "step": 946
+    },
+    {
+      "epoch": 0.24524942539898353,
+      "grad_norm": 3.4890087445954756,
+      "learning_rate": 1.1715550929206317e-06,
+      "loss": 0.3351,
+      "step": 947
+    },
+    {
+      "epoch": 0.24550840050500145,
+      "grad_norm": 2.986678147022999,
+      "learning_rate": 1.1712807222887324e-06,
+      "loss": 0.3392,
+      "step": 948
+    },
+    {
+      "epoch": 0.24576737561101938,
+      "grad_norm": 11.359804178521635,
+      "learning_rate": 1.1710059049156783e-06,
+      "loss": 0.4761,
+      "step": 949
+    },
+    {
+      "epoch": 0.24602635071703732,
+      "grad_norm": 10.1120871833462,
+      "learning_rate": 1.1707306410262112e-06,
+      "loss": 0.4559,
+      "step": 950
+    },
+    {
+      "epoch": 0.24602635071703732,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8930817610062893,
+      "eval_PRM F1 AUC": 0.819015191199581,
+      "eval_PRM F1 AUC (fixed)": 0.7393923520167627,
+      "eval_PRM F1 Neg": 0.6792452830188679,
+      "eval_PRM NPV": 0.6,
+      "eval_PRM Precision": 0.9342105263157895,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2529611885547638,
+      "eval_runtime": 14.6632,
+      "eval_samples_per_second": 3.001,
+      "eval_steps_per_second": 0.136,
+      "step": 950
+    },
+    {
+      "epoch": 0.24628532582305526,
+      "grad_norm": 6.21559932436371,
+      "learning_rate": 1.1704549308454385e-06,
+      "loss": 0.3531,
+      "step": 951
+    },
+    {
+      "epoch": 0.2465443009290732,
+      "grad_norm": 4.139390120568164,
+      "learning_rate": 1.1701787745988325e-06,
+      "loss": 0.4025,
+      "step": 952
+    },
+    {
+      "epoch": 0.24680327603509114,
+      "grad_norm": 4.066293812063238,
+      "learning_rate": 1.1699021725122297e-06,
+      "loss": 0.3229,
+      "step": 953
+    },
+    {
+      "epoch": 0.24706225114110905,
+      "grad_norm": 2.899098952795315,
+      "learning_rate": 1.169625124811832e-06,
+      "loss": 0.3156,
+      "step": 954
+    },
+    {
+      "epoch": 0.247321226247127,
+      "grad_norm": 2.8517635816301694,
+      "learning_rate": 1.169347631724205e-06,
+      "loss": 0.3273,
+      "step": 955
+    },
+    {
+      "epoch": 0.247321226247127,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8974358974358975,
+      "eval_PRM F1 AUC": 0.8564693556836039,
+      "eval_PRM F1 AUC (fixed)": 0.7333682556312205,
+      "eval_PRM F1 Neg": 0.7142857142857143,
+      "eval_PRM NPV": 0.6060606060606061,
+      "eval_PRM Precision": 0.958904109589041,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.2633054554462433,
+      "eval_runtime": 14.3335,
+      "eval_samples_per_second": 3.07,
+      "eval_steps_per_second": 0.14,
+      "step": 955
+    },
+    {
+      "epoch": 0.24758020135314493,
+      "grad_norm": 3.3564577121473618,
+      "learning_rate": 1.1690696934762794e-06,
+      "loss": 0.3227,
+      "step": 956
+    },
+    {
+      "epoch": 0.24783917645916287,
+      "grad_norm": 3.8662849481785635,
+      "learning_rate": 1.168791310295349e-06,
+      "loss": 0.357,
+      "step": 957
+    },
+    {
+      "epoch": 0.2480981515651808,
+      "grad_norm": 3.5997682609517634,
+      "learning_rate": 1.1685124824090719e-06,
+      "loss": 0.417,
+      "step": 958
+    },
+    {
+      "epoch": 0.24835712667119872,
+      "grad_norm": 2.7034258306479293,
+      "learning_rate": 1.1682332100454699e-06,
+      "loss": 0.3167,
+      "step": 959
+    },
+    {
+      "epoch": 0.24861610177721666,
+      "grad_norm": 4.988676707709703,
+      "learning_rate": 1.1679534934329283e-06,
+      "loss": 0.2986,
+      "step": 960
+    },
+    {
+      "epoch": 0.24861610177721666,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.9,
+      "eval_PRM F1 AUC": 0.8250392875851232,
+      "eval_PRM F1 AUC (fixed)": 0.7354635935044526,
+      "eval_PRM F1 Neg": 0.6923076923076923,
+      "eval_PRM NPV": 0.6206896551724138,
+      "eval_PRM Precision": 0.935064935064935,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.26185938715934753,
+      "eval_runtime": 14.5293,
+      "eval_samples_per_second": 3.028,
+      "eval_steps_per_second": 0.138,
+      "step": 960
+    },
+    {
+      "epoch": 0.2488750768832346,
+      "grad_norm": 5.29107206320586,
+      "learning_rate": 1.167673332800196e-06,
+      "loss": 0.4215,
+      "step": 961
+    },
+    {
+      "epoch": 0.24913405198925254,
+      "grad_norm": 5.437935849441125,
+      "learning_rate": 1.167392728376384e-06,
+      "loss": 0.4476,
+      "step": 962
+    },
+    {
+      "epoch": 0.24939302709527048,
+      "grad_norm": 3.8839556426836372,
+      "learning_rate": 1.1671116803909674e-06,
+      "loss": 0.3246,
+      "step": 963
+    },
+    {
+      "epoch": 0.24965200220128841,
+      "grad_norm": 10.37270496386567,
+      "learning_rate": 1.1668301890737833e-06,
+      "loss": 0.4899,
+      "step": 964
+    },
+    {
+      "epoch": 0.24991097730730633,
+      "grad_norm": 5.908063708001343,
+      "learning_rate": 1.1665482546550314e-06,
+      "loss": 0.3955,
+      "step": 965
+    },
+    {
+      "epoch": 0.24991097730730633,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.7260345730749084,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.2727225124835968,
+      "eval_runtime": 14.3383,
+      "eval_samples_per_second": 3.069,
+      "eval_steps_per_second": 0.139,
+      "step": 965
+    },
+    {
+      "epoch": 0.2501699524133243,
+      "grad_norm": 5.6447939854256735,
+      "learning_rate": 1.1662658773652744e-06,
+      "loss": 0.4093,
+      "step": 966
+    },
+    {
+      "epoch": 0.2504289275193422,
+      "grad_norm": 2.850052957391009,
+      "learning_rate": 1.1659830574354363e-06,
+      "loss": 0.3873,
+      "step": 967
+    },
+    {
+      "epoch": 0.2506879026253601,
+      "grad_norm": 4.787640638975102,
+      "learning_rate": 1.1656997950968037e-06,
+      "loss": 0.4238,
+      "step": 968
+    },
+    {
+      "epoch": 0.2509468777313781,
+      "grad_norm": 5.680659064340013,
+      "learning_rate": 1.1654160905810246e-06,
+      "loss": 0.4614,
+      "step": 969
+    },
+    {
+      "epoch": 0.251205852837396,
+      "grad_norm": 3.3362762459579023,
+      "learning_rate": 1.1651319441201094e-06,
+      "loss": 0.344,
+      "step": 970
+    },
+    {
+      "epoch": 0.251205852837396,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.716081718177056,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.28485599160194397,
+      "eval_runtime": 14.3151,
+      "eval_samples_per_second": 3.074,
+      "eval_steps_per_second": 0.14,
+      "step": 970
+    },
+    {
+      "epoch": 0.25146482794341396,
+      "grad_norm": 5.758747112832516,
+      "learning_rate": 1.1648473559464287e-06,
+      "loss": 0.3374,
+      "step": 971
+    },
+    {
+      "epoch": 0.25172380304943187,
+      "grad_norm": 8.58153415473367,
+      "learning_rate": 1.164562326292715e-06,
+      "loss": 0.538,
+      "step": 972
+    },
+    {
+      "epoch": 0.2519827781554498,
+      "grad_norm": 5.950271313129463,
+      "learning_rate": 1.1642768553920621e-06,
+      "loss": 0.3176,
+      "step": 973
+    },
+    {
+      "epoch": 0.25224175326146775,
+      "grad_norm": 3.1460089924178947,
+      "learning_rate": 1.163990943477924e-06,
+      "loss": 0.3241,
+      "step": 974
+    },
+    {
+      "epoch": 0.25250072836748566,
+      "grad_norm": 6.985297468419992,
+      "learning_rate": 1.163704590784116e-06,
+      "loss": 0.3705,
+      "step": 975
+    },
+    {
+      "epoch": 0.25250072836748566,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.7087480356207437,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.27933061122894287,
+      "eval_runtime": 14.5344,
+      "eval_samples_per_second": 3.027,
+      "eval_steps_per_second": 0.138,
+      "step": 975
+    },
+    {
+      "epoch": 0.2527597034735036,
+      "grad_norm": 8.012879551894242,
+      "learning_rate": 1.1634177975448133e-06,
+      "loss": 0.3826,
+      "step": 976
+    },
+    {
+      "epoch": 0.25301867857952154,
+      "grad_norm": 7.96887475220341,
+      "learning_rate": 1.1631305639945517e-06,
+      "loss": 0.3364,
+      "step": 977
+    },
+    {
+      "epoch": 0.25327765368553945,
+      "grad_norm": 3.612692739178533,
+      "learning_rate": 1.162842890368227e-06,
+      "loss": 0.4073,
+      "step": 978
+    },
+    {
+      "epoch": 0.2535366287915574,
+      "grad_norm": 7.720990027200896,
+      "learning_rate": 1.162554776901095e-06,
+      "loss": 0.3994,
+      "step": 979
+    },
+    {
+      "epoch": 0.25379560389757533,
+      "grad_norm": 2.783639066391506,
+      "learning_rate": 1.1622662238287708e-06,
+      "loss": 0.3031,
+      "step": 980
+    },
+    {
+      "epoch": 0.25379560389757533,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.9056603773584906,
+      "eval_PRM F1 AUC": 0.8467784180199058,
+      "eval_PRM F1 AUC (fixed)": 0.7145102147721321,
+      "eval_PRM F1 Neg": 0.7169811320754716,
+      "eval_PRM NPV": 0.6333333333333333,
+      "eval_PRM Precision": 0.9473684210526315,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.27657219767570496,
+      "eval_runtime": 14.9306,
+      "eval_samples_per_second": 2.947,
+      "eval_steps_per_second": 0.134,
+      "step": 980
+    },
+    {
+      "epoch": 0.2540545790035933,
+      "grad_norm": 3.4357231189414783,
+      "learning_rate": 1.1619772313872295e-06,
+      "loss": 0.3553,
+      "step": 981
+    },
+    {
+      "epoch": 0.2543135541096112,
+      "grad_norm": 4.935806590676655,
+      "learning_rate": 1.1616877998128053e-06,
+      "loss": 0.3536,
+      "step": 982
+    },
+    {
+      "epoch": 0.2545725292156292,
+      "grad_norm": 3.193095180565718,
+      "learning_rate": 1.1613979293421918e-06,
+      "loss": 0.2857,
+      "step": 983
+    },
+    {
+      "epoch": 0.2548315043216471,
+      "grad_norm": 5.53188970528004,
+      "learning_rate": 1.1611076202124404e-06,
+      "loss": 0.3127,
+      "step": 984
+    },
+    {
+      "epoch": 0.255090479427665,
+      "grad_norm": 3.229345173101998,
+      "learning_rate": 1.160816872660963e-06,
+      "loss": 0.4002,
+      "step": 985
+    },
+    {
+      "epoch": 0.255090479427665,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.7160817181770561,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.27515214681625366,
+      "eval_runtime": 14.4985,
+      "eval_samples_per_second": 3.035,
+      "eval_steps_per_second": 0.138,
+      "step": 985
+    },
+    {
+      "epoch": 0.25534945453368296,
+      "grad_norm": 4.293361296415176,
+      "learning_rate": 1.1605256869255285e-06,
+      "loss": 0.3489,
+      "step": 986
+    },
+    {
+      "epoch": 0.2556084296397009,
+      "grad_norm": 4.129626468223985,
+      "learning_rate": 1.1602340632442652e-06,
+      "loss": 0.3799,
+      "step": 987
+    },
+    {
+      "epoch": 0.25586740474571884,
+      "grad_norm": 9.096540369766284,
+      "learning_rate": 1.1599420018556586e-06,
+      "loss": 0.4538,
+      "step": 988
+    },
+    {
+      "epoch": 0.25612637985173675,
+      "grad_norm": 5.247960343985199,
+      "learning_rate": 1.159649502998553e-06,
+      "loss": 0.3674,
+      "step": 989
+    },
+    {
+      "epoch": 0.25638535495775466,
+      "grad_norm": 7.994078985517792,
+      "learning_rate": 1.1593565669121497e-06,
+      "loss": 0.3333,
+      "step": 990
+    },
+    {
+      "epoch": 0.25638535495775466,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8903225806451613,
+      "eval_PRM F1 AUC": 0.8504452592980618,
+      "eval_PRM F1 AUC (fixed)": 0.7239392352016761,
+      "eval_PRM F1 Neg": 0.7017543859649122,
+      "eval_PRM NPV": 0.5882352941176471,
+      "eval_PRM Precision": 0.9583333333333334,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.287078857421875,
+      "eval_runtime": 14.6202,
+      "eval_samples_per_second": 3.01,
+      "eval_steps_per_second": 0.137,
+      "step": 990
+    },
+    {
+      "epoch": 0.25664433006377263,
+      "grad_norm": 8.594303185516962,
+      "learning_rate": 1.1590631938360086e-06,
+      "loss": 0.3525,
+      "step": 991
+    },
+    {
+      "epoch": 0.25690330516979054,
+      "grad_norm": 7.048469269863221,
+      "learning_rate": 1.158769384010046e-06,
+      "loss": 0.3893,
+      "step": 992
+    },
+    {
+      "epoch": 0.2571622802758085,
+      "grad_norm": 13.317768952534582,
+      "learning_rate": 1.1584751376745355e-06,
+      "loss": 0.3186,
+      "step": 993
+    },
+    {
+      "epoch": 0.2574212553818264,
+      "grad_norm": 5.726905993306342,
+      "learning_rate": 1.1581804550701078e-06,
+      "loss": 0.3263,
+      "step": 994
+    },
+    {
+      "epoch": 0.25768023048784433,
+      "grad_norm": 4.893574502139262,
+      "learning_rate": 1.157885336437751e-06,
+      "loss": 0.4972,
+      "step": 995
+    },
+    {
+      "epoch": 0.25768023048784433,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.7409638554216867,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.2642107307910919,
+      "eval_runtime": 14.5194,
+      "eval_samples_per_second": 3.03,
+      "eval_steps_per_second": 0.138,
+      "step": 995
+    },
+    {
+      "epoch": 0.2579392055938623,
+      "grad_norm": 3.5760726549084616,
+      "learning_rate": 1.1575897820188087e-06,
+      "loss": 0.3395,
+      "step": 996
+    },
+    {
+      "epoch": 0.2581981806998802,
+      "grad_norm": 4.246352890964505,
+      "learning_rate": 1.1572937920549816e-06,
+      "loss": 0.4059,
+      "step": 997
+    },
+    {
+      "epoch": 0.2584571558058982,
+      "grad_norm": 5.18629173452879,
+      "learning_rate": 1.1569973667883264e-06,
+      "loss": 0.3453,
+      "step": 998
+    },
+    {
+      "epoch": 0.2587161309119161,
+      "grad_norm": 3.3078206651369015,
+      "learning_rate": 1.1567005064612558e-06,
+      "loss": 0.3284,
+      "step": 999
+    },
+    {
+      "epoch": 0.25897510601793405,
+      "grad_norm": 3.0615848926933,
+      "learning_rate": 1.156403211316538e-06,
+      "loss": 0.2652,
+      "step": 1000
+    },
+    {
+      "epoch": 0.25897510601793405,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.9056603773584906,
+      "eval_PRM F1 AUC": 0.8467784180199058,
+      "eval_PRM F1 AUC (fixed)": 0.7443687794656888,
+      "eval_PRM F1 Neg": 0.7169811320754716,
+      "eval_PRM NPV": 0.6333333333333333,
+      "eval_PRM Precision": 0.9473684210526315,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.25816041231155396,
+      "eval_runtime": 14.3987,
+      "eval_samples_per_second": 3.056,
+      "eval_steps_per_second": 0.139,
+      "step": 1000
+    },
+    {
+      "epoch": 0.25923408112395196,
+      "grad_norm": 8.62964960291262,
+      "learning_rate": 1.1561054815972973e-06,
+      "loss": 0.4371,
+      "step": 1001
+    },
+    {
+      "epoch": 0.2594930562299699,
+      "grad_norm": 3.752764520211669,
+      "learning_rate": 1.155807317547013e-06,
+      "loss": 0.3212,
+      "step": 1002
+    },
+    {
+      "epoch": 0.25975203133598784,
+      "grad_norm": 11.589612656246816,
+      "learning_rate": 1.1555087194095199e-06,
+      "loss": 0.3769,
+      "step": 1003
+    },
+    {
+      "epoch": 0.26001100644200575,
+      "grad_norm": 3.8830914204755986,
+      "learning_rate": 1.1552096874290074e-06,
+      "loss": 0.3566,
+      "step": 1004
+    },
+    {
+      "epoch": 0.2602699815480237,
+      "grad_norm": 4.374775346676012,
+      "learning_rate": 1.1549102218500199e-06,
+      "loss": 0.3932,
+      "step": 1005
+    },
+    {
+      "epoch": 0.2602699815480237,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.9056603773584906,
+      "eval_PRM F1 AUC": 0.8467784180199058,
+      "eval_PRM F1 AUC (fixed)": 0.7412257726558408,
+      "eval_PRM F1 Neg": 0.7169811320754716,
+      "eval_PRM NPV": 0.6333333333333333,
+      "eval_PRM Precision": 0.9473684210526315,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.2624988853931427,
+      "eval_runtime": 14.6088,
+      "eval_samples_per_second": 3.012,
+      "eval_steps_per_second": 0.137,
+      "step": 1005
+    },
+    {
+      "epoch": 0.26052895665404163,
+      "grad_norm": 6.288991137216826,
+      "learning_rate": 1.1546103229174566e-06,
+      "loss": 0.3921,
+      "step": 1006
+    },
+    {
+      "epoch": 0.26078793176005954,
+      "grad_norm": 3.4011240081976823,
+      "learning_rate": 1.1543099908765706e-06,
+      "loss": 0.3222,
+      "step": 1007
+    },
+    {
+      "epoch": 0.2610469068660775,
+      "grad_norm": 8.545602163381849,
+      "learning_rate": 1.1540092259729698e-06,
+      "loss": 0.3048,
+      "step": 1008
+    },
+    {
+      "epoch": 0.2613058819720954,
+      "grad_norm": 3.5424382509880132,
+      "learning_rate": 1.1537080284526156e-06,
+      "loss": 0.3191,
+      "step": 1009
+    },
+    {
+      "epoch": 0.2615648570781134,
+      "grad_norm": 7.447874599354588,
+      "learning_rate": 1.1534063985618231e-06,
+      "loss": 0.3002,
+      "step": 1010
+    },
+    {
+      "epoch": 0.2615648570781134,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8987341772151899,
+      "eval_PRM F1 AUC": 0.8407543216343635,
+      "eval_PRM F1 AUC (fixed)": 0.7391304347826088,
+      "eval_PRM F1 Neg": 0.7037037037037037,
+      "eval_PRM NPV": 0.6129032258064516,
+      "eval_PRM Precision": 0.9466666666666667,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.2732199430465698,
+      "eval_runtime": 14.6566,
+      "eval_samples_per_second": 3.002,
+      "eval_steps_per_second": 0.136,
+      "step": 1010
+    },
+    {
+      "epoch": 0.2618238321841313,
+      "grad_norm": 4.934117068568929,
+      "learning_rate": 1.153104336547262e-06,
+      "loss": 0.4552,
+      "step": 1011
+    },
+    {
+      "epoch": 0.2620828072901492,
+      "grad_norm": 5.94232166921095,
+      "learning_rate": 1.1528018426559534e-06,
+      "loss": 0.3295,
+      "step": 1012
+    },
+    {
+      "epoch": 0.2623417823961672,
+      "grad_norm": 4.68230926071834,
+      "learning_rate": 1.152498917135274e-06,
+      "loss": 0.3659,
+      "step": 1013
+    },
+    {
+      "epoch": 0.2626007575021851,
+      "grad_norm": 3.9028364151194155,
+      "learning_rate": 1.1521955602329516e-06,
+      "loss": 0.375,
+      "step": 1014
+    },
+    {
+      "epoch": 0.26285973260820306,
+      "grad_norm": 3.820941550762621,
+      "learning_rate": 1.1518917721970679e-06,
+      "loss": 0.387,
+      "step": 1015
+    },
+    {
+      "epoch": 0.26285973260820306,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.7252488213724463,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.28247568011283875,
+      "eval_runtime": 15.3011,
+      "eval_samples_per_second": 2.876,
+      "eval_steps_per_second": 0.131,
+      "step": 1015
+    },
+    {
+      "epoch": 0.26311870771422097,
+      "grad_norm": 6.272094131495291,
+      "learning_rate": 1.1515875532760563e-06,
+      "loss": 0.4004,
+      "step": 1016
+    },
+    {
+      "epoch": 0.2633776828202389,
+      "grad_norm": 9.61148233057241,
+      "learning_rate": 1.1512829037187032e-06,
+      "loss": 0.3623,
+      "step": 1017
+    },
+    {
+      "epoch": 0.26363665792625685,
+      "grad_norm": 3.5927848620945237,
+      "learning_rate": 1.150977823774147e-06,
+      "loss": 0.3681,
+      "step": 1018
+    },
+    {
+      "epoch": 0.26389563303227476,
+      "grad_norm": 4.669022408853148,
+      "learning_rate": 1.150672313691878e-06,
+      "loss": 0.329,
+      "step": 1019
+    },
+    {
+      "epoch": 0.2641546081382927,
+      "grad_norm": 4.151941292781019,
+      "learning_rate": 1.1503663737217385e-06,
+      "loss": 0.3425,
+      "step": 1020
+    },
+    {
+      "epoch": 0.2641546081382927,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.7155578837087481,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.29420801997184753,
+      "eval_runtime": 14.6768,
+      "eval_samples_per_second": 2.998,
+      "eval_steps_per_second": 0.136,
+      "step": 1020
+    },
+    {
+      "epoch": 0.26441358324431063,
+      "grad_norm": 3.1002475083020897,
+      "learning_rate": 1.150060004113922e-06,
+      "loss": 0.3625,
+      "step": 1021
+    },
+    {
+      "epoch": 0.2646725583503286,
+      "grad_norm": 7.00755462604261,
+      "learning_rate": 1.1497532051189734e-06,
+      "loss": 0.3134,
+      "step": 1022
+    },
+    {
+      "epoch": 0.2649315334563465,
+      "grad_norm": 3.205399859551509,
+      "learning_rate": 1.1494459769877892e-06,
+      "loss": 0.4001,
+      "step": 1023
+    },
+    {
+      "epoch": 0.2651905085623644,
+      "grad_norm": 4.163906104739272,
+      "learning_rate": 1.1491383199716162e-06,
+      "loss": 0.3586,
+      "step": 1024
+    },
+    {
+      "epoch": 0.2654494836683824,
+      "grad_norm": 3.3459054714717604,
+      "learning_rate": 1.1488302343220522e-06,
+      "loss": 0.3757,
+      "step": 1025
+    },
+    {
+      "epoch": 0.2654494836683824,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.9056603773584906,
+      "eval_PRM F1 AUC": 0.8467784180199058,
+      "eval_PRM F1 AUC (fixed)": 0.7097957045573599,
+      "eval_PRM F1 Neg": 0.7169811320754716,
+      "eval_PRM NPV": 0.6333333333333333,
+      "eval_PRM Precision": 0.9473684210526315,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.2874738276004791,
+      "eval_runtime": 14.7665,
+      "eval_samples_per_second": 2.98,
+      "eval_steps_per_second": 0.135,
+      "step": 1025
+    },
+    {
+      "epoch": 0.2657084587744003,
+      "grad_norm": 3.062475684970944,
+      "learning_rate": 1.148521720291046e-06,
+      "loss": 0.3169,
+      "step": 1026
+    },
+    {
+      "epoch": 0.26596743388041827,
+      "grad_norm": 5.559405808823225,
+      "learning_rate": 1.1482127781308959e-06,
+      "loss": 0.3497,
+      "step": 1027
+    },
+    {
+      "epoch": 0.2662264089864362,
+      "grad_norm": 2.8845109010736802,
+      "learning_rate": 1.1479034080942506e-06,
+      "loss": 0.2926,
+      "step": 1028
+    },
+    {
+      "epoch": 0.2664853840924541,
+      "grad_norm": 2.7290208271682483,
+      "learning_rate": 1.1475936104341092e-06,
+      "loss": 0.2948,
+      "step": 1029
+    },
+    {
+      "epoch": 0.26674435919847206,
+      "grad_norm": 4.275627121965084,
+      "learning_rate": 1.1472833854038202e-06,
+      "loss": 0.3048,
+      "step": 1030
+    },
+    {
+      "epoch": 0.26674435919847206,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.9,
+      "eval_PRM F1 AUC": 0.8250392875851232,
+      "eval_PRM F1 AUC (fixed)": 0.7176532215819801,
+      "eval_PRM F1 Neg": 0.6923076923076923,
+      "eval_PRM NPV": 0.6206896551724138,
+      "eval_PRM Precision": 0.935064935064935,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2746083736419678,
+      "eval_runtime": 14.8637,
+      "eval_samples_per_second": 2.96,
+      "eval_steps_per_second": 0.135,
+      "step": 1030
+    },
+    {
+      "epoch": 0.26700333430448997,
+      "grad_norm": 5.096607444133815,
+      "learning_rate": 1.146972733257081e-06,
+      "loss": 0.3847,
+      "step": 1031
+    },
+    {
+      "epoch": 0.26726230941050794,
+      "grad_norm": 5.906775619461052,
+      "learning_rate": 1.1466616542479392e-06,
+      "loss": 0.4176,
+      "step": 1032
+    },
+    {
+      "epoch": 0.26752128451652585,
+      "grad_norm": 3.3864533892662276,
+      "learning_rate": 1.1463501486307913e-06,
+      "loss": 0.4073,
+      "step": 1033
+    },
+    {
+      "epoch": 0.26778025962254376,
+      "grad_norm": 7.674881770284153,
+      "learning_rate": 1.146038216660382e-06,
+      "loss": 0.3887,
+      "step": 1034
+    },
+    {
+      "epoch": 0.2680392347285617,
+      "grad_norm": 3.9737886137856604,
+      "learning_rate": 1.1457258585918055e-06,
+      "loss": 0.3936,
+      "step": 1035
+    },
+    {
+      "epoch": 0.2680392347285617,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8974358974358975,
+      "eval_PRM F1 AUC": 0.8564693556836039,
+      "eval_PRM F1 AUC (fixed)": 0.7317967522262965,
+      "eval_PRM F1 Neg": 0.7142857142857143,
+      "eval_PRM NPV": 0.6060606060606061,
+      "eval_PRM Precision": 0.958904109589041,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.2778846025466919,
+      "eval_runtime": 14.5607,
+      "eval_samples_per_second": 3.022,
+      "eval_steps_per_second": 0.137,
+      "step": 1035
+    },
+    {
+      "epoch": 0.26829820983457964,
+      "grad_norm": 3.299595057990445,
+      "learning_rate": 1.1454130746805036e-06,
+      "loss": 0.3571,
+      "step": 1036
+    },
+    {
+      "epoch": 0.2685571849405976,
+      "grad_norm": 3.1859027589559115,
+      "learning_rate": 1.1450998651822676e-06,
+      "loss": 0.2808,
+      "step": 1037
+    },
+    {
+      "epoch": 0.2688161600466155,
+      "grad_norm": 5.266318626904086,
+      "learning_rate": 1.1447862303532357e-06,
+      "loss": 0.3535,
+      "step": 1038
+    },
+    {
+      "epoch": 0.2690751351526334,
+      "grad_norm": 6.0832686097080835,
+      "learning_rate": 1.144472170449894e-06,
+      "loss": 0.2934,
+      "step": 1039
+    },
+    {
+      "epoch": 0.2693341102586514,
+      "grad_norm": 5.449410893831182,
+      "learning_rate": 1.144157685729077e-06,
+      "loss": 0.3511,
+      "step": 1040
+    },
+    {
+      "epoch": 0.2693341102586514,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8831168831168831,
+      "eval_PRM F1 AUC": 0.8444211629125196,
+      "eval_PRM F1 AUC (fixed)": 0.7393923520167627,
+      "eval_PRM F1 Neg": 0.6896551724137931,
+      "eval_PRM NPV": 0.5714285714285714,
+      "eval_PRM Precision": 0.9577464788732394,
+      "eval_PRM Recall": 0.8192771084337349,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.2817172706127167,
+      "eval_runtime": 14.4198,
+      "eval_samples_per_second": 3.051,
+      "eval_steps_per_second": 0.139,
+      "step": 1040
+    },
+    {
+      "epoch": 0.2695930853646693,
+      "grad_norm": 10.491775913753377,
+      "learning_rate": 1.143842776447966e-06,
+      "loss": 0.4059,
+      "step": 1041
+    },
+    {
+      "epoch": 0.26985206047068727,
+      "grad_norm": 4.163129039105927,
+      "learning_rate": 1.1435274428640896e-06,
+      "loss": 0.3379,
+      "step": 1042
+    },
+    {
+      "epoch": 0.2701110355767052,
+      "grad_norm": 4.035370510840349,
+      "learning_rate": 1.1432116852353236e-06,
+      "loss": 0.3394,
+      "step": 1043
+    },
+    {
+      "epoch": 0.27037001068272315,
+      "grad_norm": 5.014839844833506,
+      "learning_rate": 1.1428955038198902e-06,
+      "loss": 0.2666,
+      "step": 1044
+    },
+    {
+      "epoch": 0.27062898578874106,
+      "grad_norm": 3.3777543126356533,
+      "learning_rate": 1.1425788988763587e-06,
+      "loss": 0.3968,
+      "step": 1045
+    },
+    {
+      "epoch": 0.27062898578874106,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.9044585987261147,
+      "eval_PRM F1 AUC": 0.8624934520691462,
+      "eval_PRM F1 AUC (fixed)": 0.7545835515976952,
+      "eval_PRM F1 Neg": 0.7272727272727273,
+      "eval_PRM NPV": 0.625,
+      "eval_PRM Precision": 0.9594594594594594,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.25391244888305664,
+      "eval_runtime": 14.6404,
+      "eval_samples_per_second": 3.005,
+      "eval_steps_per_second": 0.137,
+      "step": 1045
+    },
+    {
+      "epoch": 0.270887960894759,
+      "grad_norm": 4.769686269210307,
+      "learning_rate": 1.142261870663644e-06,
+      "loss": 0.3934,
+      "step": 1046
+    },
+    {
+      "epoch": 0.27114693600077694,
+      "grad_norm": 4.340672008315693,
+      "learning_rate": 1.1419444194410078e-06,
+      "loss": 0.3723,
+      "step": 1047
+    },
+    {
+      "epoch": 0.27140591110679485,
+      "grad_norm": 7.286389338199718,
+      "learning_rate": 1.1416265454680578e-06,
+      "loss": 0.3354,
+      "step": 1048
+    },
+    {
+      "epoch": 0.2716648862128128,
+      "grad_norm": 6.061977229152866,
+      "learning_rate": 1.1413082490047465e-06,
+      "loss": 0.2896,
+      "step": 1049
+    },
+    {
+      "epoch": 0.27192386131883073,
+      "grad_norm": 6.780070674559419,
+      "learning_rate": 1.140989530311373e-06,
+      "loss": 0.3464,
+      "step": 1050
+    },
+    {
+      "epoch": 0.27192386131883073,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.9056603773584906,
+      "eval_PRM F1 AUC": 0.8467784180199058,
+      "eval_PRM F1 AUC (fixed)": 0.7582503928758513,
+      "eval_PRM F1 Neg": 0.7169811320754716,
+      "eval_PRM NPV": 0.6333333333333333,
+      "eval_PRM Precision": 0.9473684210526315,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.250600129365921,
+      "eval_runtime": 14.7351,
+      "eval_samples_per_second": 2.986,
+      "eval_steps_per_second": 0.136,
+      "step": 1050
+    },
+    {
+      "epoch": 0.27218283642484864,
+      "grad_norm": 3.0057781248611124,
+      "learning_rate": 1.1406703896485814e-06,
+      "loss": 0.3507,
+      "step": 1051
+    },
+    {
+      "epoch": 0.2724418115308666,
+      "grad_norm": 2.3656334187644323,
+      "learning_rate": 1.14035082727736e-06,
+      "loss": 0.2873,
+      "step": 1052
+    },
+    {
+      "epoch": 0.2727007866368845,
+      "grad_norm": 4.327035964713289,
+      "learning_rate": 1.1400308434590434e-06,
+      "loss": 0.3582,
+      "step": 1053
+    },
+    {
+      "epoch": 0.2729597617429025,
+      "grad_norm": 4.409821289635134,
+      "learning_rate": 1.1397104384553099e-06,
+      "loss": 0.3955,
+      "step": 1054
+    },
+    {
+      "epoch": 0.2732187368489204,
+      "grad_norm": 6.070528106749317,
+      "learning_rate": 1.1393896125281823e-06,
+      "loss": 0.3542,
+      "step": 1055
+    },
+    {
+      "epoch": 0.2732187368489204,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8903225806451613,
+      "eval_PRM F1 AUC": 0.8504452592980618,
+      "eval_PRM F1 AUC (fixed)": 0.7572027239392352,
+      "eval_PRM F1 Neg": 0.7017543859649122,
+      "eval_PRM NPV": 0.5882352941176471,
+      "eval_PRM Precision": 0.9583333333333334,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.256532222032547,
+      "eval_runtime": 15.0852,
+      "eval_samples_per_second": 2.917,
+      "eval_steps_per_second": 0.133,
+      "step": 1055
+    },
+    {
+      "epoch": 0.2734777119549383,
+      "grad_norm": 3.5562342168376575,
+      "learning_rate": 1.139068365940028e-06,
+      "loss": 0.3447,
+      "step": 1056
+    },
+    {
+      "epoch": 0.2737366870609563,
+      "grad_norm": 5.912361465122927,
+      "learning_rate": 1.1387466989535581e-06,
+      "loss": 0.3846,
+      "step": 1057
+    },
+    {
+      "epoch": 0.2739956621669742,
+      "grad_norm": 5.0568559263393595,
+      "learning_rate": 1.1384246118318279e-06,
+      "loss": 0.3529,
+      "step": 1058
+    },
+    {
+      "epoch": 0.27425463727299215,
+      "grad_norm": 3.890988872505904,
+      "learning_rate": 1.1381021048382354e-06,
+      "loss": 0.3636,
+      "step": 1059
+    },
+    {
+      "epoch": 0.27451361237901006,
+      "grad_norm": 5.104942614408514,
+      "learning_rate": 1.1377791782365234e-06,
+      "loss": 0.4364,
+      "step": 1060
+    },
+    {
+      "epoch": 0.27451361237901006,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8961038961038961,
+      "eval_PRM F1 AUC": 0.8721843897328445,
+      "eval_PRM F1 AUC (fixed)": 0.7527501309586171,
+      "eval_PRM F1 Neg": 0.7241379310344828,
+      "eval_PRM NPV": 0.6,
+      "eval_PRM Precision": 0.971830985915493,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.9130434782608695,
+      "eval_loss": 0.26171520352363586,
+      "eval_runtime": 14.5773,
+      "eval_samples_per_second": 3.018,
+      "eval_steps_per_second": 0.137,
+      "step": 1060
+    },
+    {
+      "epoch": 0.274772587485028,
+      "grad_norm": 7.7662853415479525,
+      "learning_rate": 1.137455832290776e-06,
+      "loss": 0.3633,
+      "step": 1061
+    },
+    {
+      "epoch": 0.27503156259104594,
+      "grad_norm": 5.938423981059565,
+      "learning_rate": 1.137132067265422e-06,
+      "loss": 0.3852,
+      "step": 1062
+    },
+    {
+      "epoch": 0.27529053769706385,
+      "grad_norm": 5.107382832753897,
+      "learning_rate": 1.136807883425232e-06,
+      "loss": 0.2787,
+      "step": 1063
+    },
+    {
+      "epoch": 0.2755495128030818,
+      "grad_norm": 3.6572572981324556,
+      "learning_rate": 1.136483281035319e-06,
+      "loss": 0.3835,
+      "step": 1064
+    },
+    {
+      "epoch": 0.27580848790909973,
+      "grad_norm": 4.0782743725531505,
+      "learning_rate": 1.136158260361139e-06,
+      "loss": 0.3717,
+      "step": 1065
+    },
+    {
+      "epoch": 0.27580848790909973,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8974358974358975,
+      "eval_PRM F1 AUC": 0.8564693556836039,
+      "eval_PRM F1 AUC (fixed)": 0.7456783656364588,
+      "eval_PRM F1 Neg": 0.7142857142857143,
+      "eval_PRM NPV": 0.6060606060606061,
+      "eval_PRM Precision": 0.958904109589041,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.26301947236061096,
+      "eval_runtime": 14.8292,
+      "eval_samples_per_second": 2.967,
+      "eval_steps_per_second": 0.135,
+      "step": 1065
+    },
+    {
+      "epoch": 0.2760674630151177,
+      "grad_norm": 5.013671476758816,
+      "learning_rate": 1.1358328216684891e-06,
+      "loss": 0.2519,
+      "step": 1066
+    },
+    {
+      "epoch": 0.2763264381211356,
+      "grad_norm": 3.4108222416181158,
+      "learning_rate": 1.135506965223509e-06,
+      "loss": 0.2606,
+      "step": 1067
+    },
+    {
+      "epoch": 0.2765854132271535,
+      "grad_norm": 6.796678122355816,
+      "learning_rate": 1.13518069129268e-06,
+      "loss": 0.4095,
+      "step": 1068
+    },
+    {
+      "epoch": 0.2768443883331715,
+      "grad_norm": 4.326362848524545,
+      "learning_rate": 1.1348540001428243e-06,
+      "loss": 0.3535,
+      "step": 1069
+    },
+    {
+      "epoch": 0.2771033634391894,
+      "grad_norm": 4.655760102750851,
+      "learning_rate": 1.134526892041106e-06,
+      "loss": 0.3831,
+      "step": 1070
+    },
+    {
+      "epoch": 0.2771033634391894,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.9,
+      "eval_PRM F1 AUC": 0.8250392875851232,
+      "eval_PRM F1 AUC (fixed)": 0.7569408067050812,
+      "eval_PRM F1 Neg": 0.6923076923076923,
+      "eval_PRM NPV": 0.6206896551724138,
+      "eval_PRM Precision": 0.935064935064935,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.26515859365463257,
+      "eval_runtime": 14.8422,
+      "eval_samples_per_second": 2.965,
+      "eval_steps_per_second": 0.135,
+      "step": 1070
+    },
+    {
+      "epoch": 0.27736233854520737,
+      "grad_norm": 8.05051403901847,
+      "learning_rate": 1.134199367255029e-06,
+      "loss": 0.3539,
+      "step": 1071
+    },
+    {
+      "epoch": 0.2776213136512253,
+      "grad_norm": 3.378675019359202,
+      "learning_rate": 1.1338714260524393e-06,
+      "loss": 0.3111,
+      "step": 1072
+    },
+    {
+      "epoch": 0.2778802887572432,
+      "grad_norm": 3.7446683598641615,
+      "learning_rate": 1.133543068701523e-06,
+      "loss": 0.4096,
+      "step": 1073
+    },
+    {
+      "epoch": 0.27813926386326115,
+      "grad_norm": 6.913150764414947,
+      "learning_rate": 1.1332142954708064e-06,
+      "loss": 0.3498,
+      "step": 1074
+    },
+    {
+      "epoch": 0.27839823896927907,
+      "grad_norm": 3.781401402320106,
+      "learning_rate": 1.1328851066291555e-06,
+      "loss": 0.3295,
+      "step": 1075
+    },
+    {
+      "epoch": 0.27839823896927907,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8987341772151899,
+      "eval_PRM F1 AUC": 0.8407543216343635,
+      "eval_PRM F1 AUC (fixed)": 0.7537977998952331,
+      "eval_PRM F1 Neg": 0.7037037037037037,
+      "eval_PRM NPV": 0.6129032258064516,
+      "eval_PRM Precision": 0.9466666666666667,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.2676940858364105,
+      "eval_runtime": 14.9396,
+      "eval_samples_per_second": 2.945,
+      "eval_steps_per_second": 0.134,
+      "step": 1075
+    },
+    {
+      "epoch": 0.27865721407529703,
+      "grad_norm": 5.819523266576147,
+      "learning_rate": 1.1325555024457768e-06,
+      "loss": 0.4179,
+      "step": 1076
+    },
+    {
+      "epoch": 0.27891618918131494,
+      "grad_norm": 4.099575759852333,
+      "learning_rate": 1.1322254831902162e-06,
+      "loss": 0.4283,
+      "step": 1077
+    },
+    {
+      "epoch": 0.27917516428733286,
+      "grad_norm": 2.388694788644085,
+      "learning_rate": 1.1318950491323593e-06,
+      "loss": 0.3189,
+      "step": 1078
+    },
+    {
+      "epoch": 0.2794341393933508,
+      "grad_norm": 3.8430182333509477,
+      "learning_rate": 1.1315642005424304e-06,
+      "loss": 0.3609,
+      "step": 1079
+    },
+    {
+      "epoch": 0.27969311449936873,
+      "grad_norm": 6.0484009009962865,
+      "learning_rate": 1.1312329376909934e-06,
+      "loss": 0.4167,
+      "step": 1080
+    },
+    {
+      "epoch": 0.27969311449936873,
+      "eval_PRM Accuracy": 0.8207547169811321,
+      "eval_PRM F1": 0.8758169934640523,
+      "eval_PRM F1 AUC": 0.8383970665269774,
+      "eval_PRM F1 AUC (fixed)": 0.749083289680461,
+      "eval_PRM F1 Neg": 0.6779661016949152,
+      "eval_PRM NPV": 0.5555555555555556,
+      "eval_PRM Precision": 0.9571428571428572,
+      "eval_PRM Recall": 0.8072289156626506,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.28986474871635437,
+      "eval_runtime": 14.6064,
+      "eval_samples_per_second": 3.012,
+      "eval_steps_per_second": 0.137,
+      "step": 1080
+    },
+    {
+      "epoch": 0.2799520896053867,
+      "grad_norm": 7.64904237886481,
+      "learning_rate": 1.1309012608489504e-06,
+      "loss": 0.3803,
+      "step": 1081
+    },
+    {
+      "epoch": 0.2802110647114046,
+      "grad_norm": 9.823767001803189,
+      "learning_rate": 1.1305691702875423e-06,
+      "loss": 0.2893,
+      "step": 1082
+    },
+    {
+      "epoch": 0.2804700398174225,
+      "grad_norm": 5.004452607333411,
+      "learning_rate": 1.1302366662783488e-06,
+      "loss": 0.4203,
+      "step": 1083
+    },
+    {
+      "epoch": 0.2807290149234405,
+      "grad_norm": 8.144551217692342,
+      "learning_rate": 1.129903749093287e-06,
+      "loss": 0.3629,
+      "step": 1084
+    },
+    {
+      "epoch": 0.2809879900294584,
+      "grad_norm": 7.145958462099795,
+      "learning_rate": 1.129570419004612e-06,
+      "loss": 0.289,
+      "step": 1085
+    },
+    {
+      "epoch": 0.2809879900294584,
+      "eval_PRM Accuracy": 0.8113207547169812,
+      "eval_PRM F1": 0.868421052631579,
+      "eval_PRM F1 AUC": 0.8323729701414354,
+      "eval_PRM F1 AUC (fixed)": 0.748821372446307,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5405405405405406,
+      "eval_PRM Precision": 0.9565217391304348,
+      "eval_PRM Recall": 0.7951807228915663,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.294299453496933,
+      "eval_runtime": 14.5707,
+      "eval_samples_per_second": 3.02,
+      "eval_steps_per_second": 0.137,
+      "step": 1085
+    },
+    {
+      "epoch": 0.28124696513547637,
+      "grad_norm": 4.960838845669801,
+      "learning_rate": 1.129236676284917e-06,
+      "loss": 0.3983,
+      "step": 1086
+    },
+    {
+      "epoch": 0.2815059402414943,
+      "grad_norm": 4.9063190727136,
+      "learning_rate": 1.1289025212071324e-06,
+      "loss": 0.3552,
+      "step": 1087
+    },
+    {
+      "epoch": 0.28176491534751225,
+      "grad_norm": 6.111329302463371,
+      "learning_rate": 1.1285679540445259e-06,
+      "loss": 0.4539,
+      "step": 1088
+    },
+    {
+      "epoch": 0.28202389045353016,
+      "grad_norm": 3.1683233714486176,
+      "learning_rate": 1.1282329750707018e-06,
+      "loss": 0.3701,
+      "step": 1089
+    },
+    {
+      "epoch": 0.28228286555954807,
+      "grad_norm": 5.4822402949350115,
+      "learning_rate": 1.1278975845596016e-06,
+      "loss": 0.3055,
+      "step": 1090
+    },
+    {
+      "epoch": 0.28228286555954807,
+      "eval_PRM Accuracy": 0.8207547169811321,
+      "eval_PRM F1": 0.8789808917197452,
+      "eval_PRM F1 AUC": 0.8069669984284967,
+      "eval_PRM F1 AUC (fixed)": 0.753273965426925,
+      "eval_PRM F1 Neg": 0.6545454545454545,
+      "eval_PRM NPV": 0.5625,
+      "eval_PRM Precision": 0.9324324324324325,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2796691656112671,
+      "eval_runtime": 14.4984,
+      "eval_samples_per_second": 3.035,
+      "eval_steps_per_second": 0.138,
+      "step": 1090
+    },
+    {
+      "epoch": 0.28254184066556604,
+      "grad_norm": 3.480490868188625,
+      "learning_rate": 1.127561782785503e-06,
+      "loss": 0.3824,
+      "step": 1091
+    },
+    {
+      "epoch": 0.28280081577158395,
+      "grad_norm": 3.805686299465861,
+      "learning_rate": 1.1272255700230209e-06,
+      "loss": 0.3474,
+      "step": 1092
+    },
+    {
+      "epoch": 0.2830597908776019,
+      "grad_norm": 4.48044589020009,
+      "learning_rate": 1.126888946547105e-06,
+      "loss": 0.3661,
+      "step": 1093
+    },
+    {
+      "epoch": 0.2833187659836198,
+      "grad_norm": 2.877380173271708,
+      "learning_rate": 1.1265519126330417e-06,
+      "loss": 0.3087,
+      "step": 1094
+    },
+    {
+      "epoch": 0.28357774108963774,
+      "grad_norm": 2.542242455848216,
+      "learning_rate": 1.126214468556453e-06,
+      "loss": 0.315,
+      "step": 1095
+    },
+    {
+      "epoch": 0.28357774108963774,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8875,
+      "eval_PRM F1 AUC": 0.7972760607647982,
+      "eval_PRM F1 AUC (fixed)": 0.7637506547930855,
+      "eval_PRM F1 Neg": 0.6538461538461539,
+      "eval_PRM NPV": 0.5862068965517241,
+      "eval_PRM Precision": 0.922077922077922,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.7391304347826086,
+      "eval_loss": 0.2715385854244232,
+      "eval_runtime": 14.3759,
+      "eval_samples_per_second": 3.061,
+      "eval_steps_per_second": 0.139,
+      "step": 1095
+    },
+    {
+      "epoch": 0.2838367161956557,
+      "grad_norm": 5.416422720177891,
+      "learning_rate": 1.1258766145932964e-06,
+      "loss": 0.5243,
+      "step": 1096
+    },
+    {
+      "epoch": 0.2840956913016736,
+      "grad_norm": 7.765499713875308,
+      "learning_rate": 1.125538351019864e-06,
+      "loss": 0.4824,
+      "step": 1097
+    },
+    {
+      "epoch": 0.2843546664076916,
+      "grad_norm": 4.784714891415138,
+      "learning_rate": 1.1251996781127832e-06,
+      "loss": 0.3516,
+      "step": 1098
+    },
+    {
+      "epoch": 0.2846136415137095,
+      "grad_norm": 4.1611214148825315,
+      "learning_rate": 1.1248605961490168e-06,
+      "loss": 0.4139,
+      "step": 1099
+    },
+    {
+      "epoch": 0.2848726166197274,
+      "grad_norm": 9.588537077132573,
+      "learning_rate": 1.1245211054058611e-06,
+      "loss": 0.3736,
+      "step": 1100
+    },
+    {
+      "epoch": 0.2848726166197274,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.7532739654269252,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.27907219529151917,
+      "eval_runtime": 14.5308,
+      "eval_samples_per_second": 3.028,
+      "eval_steps_per_second": 0.138,
+      "step": 1100
+    },
+    {
+      "epoch": 0.28513159172574537,
+      "grad_norm": 8.28027340948901,
+      "learning_rate": 1.1241812061609475e-06,
+      "loss": 0.3066,
+      "step": 1101
+    },
+    {
+      "epoch": 0.2853905668317633,
+      "grad_norm": 5.2275923345878565,
+      "learning_rate": 1.1238408986922405e-06,
+      "loss": 0.2485,
+      "step": 1102
+    },
+    {
+      "epoch": 0.28564954193778125,
+      "grad_norm": 3.9191319661849118,
+      "learning_rate": 1.1235001832780397e-06,
+      "loss": 0.2648,
+      "step": 1103
+    },
+    {
+      "epoch": 0.28590851704379916,
+      "grad_norm": 3.803575863891714,
+      "learning_rate": 1.1231590601969773e-06,
+      "loss": 0.3509,
+      "step": 1104
+    },
+    {
+      "epoch": 0.2861674921498171,
+      "grad_norm": 5.062747812604048,
+      "learning_rate": 1.1228175297280193e-06,
+      "loss": 0.3306,
+      "step": 1105
+    },
+    {
+      "epoch": 0.2861674921498171,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8987341772151899,
+      "eval_PRM F1 AUC": 0.8407543216343635,
+      "eval_PRM F1 AUC (fixed)": 0.7564169722367732,
+      "eval_PRM F1 Neg": 0.7037037037037037,
+      "eval_PRM NPV": 0.6129032258064516,
+      "eval_PRM Precision": 0.9466666666666667,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.2660982012748718,
+      "eval_runtime": 14.627,
+      "eval_samples_per_second": 3.008,
+      "eval_steps_per_second": 0.137,
+      "step": 1105
+    },
+    {
+      "epoch": 0.28642646725583504,
+      "grad_norm": 4.898710258003656,
+      "learning_rate": 1.1224755921504648e-06,
+      "loss": 0.4031,
+      "step": 1106
+    },
+    {
+      "epoch": 0.28668544236185295,
+      "grad_norm": 3.561715323993499,
+      "learning_rate": 1.1221332477439459e-06,
+      "loss": 0.3674,
+      "step": 1107
+    },
+    {
+      "epoch": 0.2869444174678709,
+      "grad_norm": 3.7429726684658853,
+      "learning_rate": 1.1217904967884274e-06,
+      "loss": 0.3967,
+      "step": 1108
+    },
+    {
+      "epoch": 0.2872033925738888,
+      "grad_norm": 3.178179402931704,
+      "learning_rate": 1.1214473395642064e-06,
+      "loss": 0.3632,
+      "step": 1109
+    },
+    {
+      "epoch": 0.2874623676799068,
+      "grad_norm": 6.2815507059756,
+      "learning_rate": 1.1211037763519122e-06,
+      "loss": 0.3744,
+      "step": 1110
+    },
+    {
+      "epoch": 0.2874623676799068,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.7608695652173912,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.26640403270721436,
+      "eval_runtime": 14.4791,
+      "eval_samples_per_second": 3.039,
+      "eval_steps_per_second": 0.138,
+      "step": 1110
+    },
+    {
+      "epoch": 0.2877213427859247,
+      "grad_norm": 4.2386671161357405,
+      "learning_rate": 1.1207598074325066e-06,
+      "loss": 0.3827,
+      "step": 1111
+    },
+    {
+      "epoch": 0.2879803178919426,
+      "grad_norm": 3.3655970950015295,
+      "learning_rate": 1.1204154330872824e-06,
+      "loss": 0.3525,
+      "step": 1112
+    },
+    {
+      "epoch": 0.2882392929979606,
+      "grad_norm": 7.982714386079896,
+      "learning_rate": 1.1200706535978647e-06,
+      "loss": 0.3293,
+      "step": 1113
+    },
+    {
+      "epoch": 0.2884982681039785,
+      "grad_norm": 9.602171181971372,
+      "learning_rate": 1.1197254692462096e-06,
+      "loss": 0.3855,
+      "step": 1114
+    },
+    {
+      "epoch": 0.28875724320999646,
+      "grad_norm": 3.4844020908031554,
+      "learning_rate": 1.1193798803146042e-06,
+      "loss": 0.3128,
+      "step": 1115
+    },
+    {
+      "epoch": 0.28875724320999646,
+      "eval_PRM Accuracy": 0.8207547169811321,
+      "eval_PRM F1": 0.8774193548387097,
+      "eval_PRM F1 AUC": 0.8226820324777371,
+      "eval_PRM F1 AUC (fixed)": 0.7627029858564695,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5588235294117647,
+      "eval_PRM Precision": 0.9444444444444444,
+      "eval_PRM Recall": 0.8192771084337349,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.26669546961784363,
+      "eval_runtime": 14.4819,
+      "eval_samples_per_second": 3.038,
+      "eval_steps_per_second": 0.138,
+      "step": 1115
+    },
+    {
+      "epoch": 0.2890162183160144,
+      "grad_norm": 6.597406785592498,
+      "learning_rate": 1.1190338870856666e-06,
+      "loss": 0.2791,
+      "step": 1116
+    },
+    {
+      "epoch": 0.2892751934220323,
+      "grad_norm": 5.9280718737016045,
+      "learning_rate": 1.1186874898423455e-06,
+      "loss": 0.3807,
+      "step": 1117
+    },
+    {
+      "epoch": 0.28953416852805025,
+      "grad_norm": 2.8334208382831605,
+      "learning_rate": 1.1183406888679199e-06,
+      "loss": 0.3188,
+      "step": 1118
+    },
+    {
+      "epoch": 0.28979314363406816,
+      "grad_norm": 7.612503860515019,
+      "learning_rate": 1.117993484445999e-06,
+      "loss": 0.3501,
+      "step": 1119
+    },
+    {
+      "epoch": 0.29005211874008613,
+      "grad_norm": 8.11990763445414,
+      "learning_rate": 1.1176458768605225e-06,
+      "loss": 0.4403,
+      "step": 1120
+    },
+    {
+      "epoch": 0.29005211874008613,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.9,
+      "eval_PRM F1 AUC": 0.8250392875851232,
+      "eval_PRM F1 AUC (fixed)": 0.7747511786275538,
+      "eval_PRM F1 Neg": 0.6923076923076923,
+      "eval_PRM NPV": 0.6206896551724138,
+      "eval_PRM Precision": 0.935064935064935,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2532932758331299,
+      "eval_runtime": 14.6892,
+      "eval_samples_per_second": 2.995,
+      "eval_steps_per_second": 0.136,
+      "step": 1120
+    },
+    {
+      "epoch": 0.29031109384610404,
+      "grad_norm": 4.263431566665755,
+      "learning_rate": 1.1172978663957587e-06,
+      "loss": 0.3335,
+      "step": 1121
+    },
+    {
+      "epoch": 0.29057006895212195,
+      "grad_norm": 5.260238174654083,
+      "learning_rate": 1.1169494533363062e-06,
+      "loss": 0.34,
+      "step": 1122
+    },
+    {
+      "epoch": 0.2908290440581399,
+      "grad_norm": 4.355002531212862,
+      "learning_rate": 1.1166006379670924e-06,
+      "loss": 0.3562,
+      "step": 1123
+    },
+    {
+      "epoch": 0.29108801916415783,
+      "grad_norm": 4.538866881853854,
+      "learning_rate": 1.1162514205733744e-06,
+      "loss": 0.343,
+      "step": 1124
+    },
+    {
+      "epoch": 0.2913469942701758,
+      "grad_norm": 4.793637250566336,
+      "learning_rate": 1.115901801440737e-06,
+      "loss": 0.3588,
+      "step": 1125
+    },
+    {
+      "epoch": 0.2913469942701758,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.906832298136646,
+      "eval_PRM F1 AUC": 0.8310633839706653,
+      "eval_PRM F1 AUC (fixed)": 0.7755369303300158,
+      "eval_PRM F1 Neg": 0.7058823529411765,
+      "eval_PRM NPV": 0.6428571428571429,
+      "eval_PRM Precision": 0.9358974358974359,
+      "eval_PRM Recall": 0.8795180722891566,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2523413598537445,
+      "eval_runtime": 14.579,
+      "eval_samples_per_second": 3.018,
+      "eval_steps_per_second": 0.137,
+      "step": 1125
+    },
+    {
+      "epoch": 0.2916059693761937,
+      "grad_norm": 3.7268330544818213,
+      "learning_rate": 1.1155517808550941e-06,
+      "loss": 0.4181,
+      "step": 1126
+    },
+    {
+      "epoch": 0.2918649444822117,
+      "grad_norm": 5.165577278078134,
+      "learning_rate": 1.1152013591026884e-06,
+      "loss": 0.3887,
+      "step": 1127
+    },
+    {
+      "epoch": 0.2921239195882296,
+      "grad_norm": 5.040742010231609,
+      "learning_rate": 1.11485053647009e-06,
+      "loss": 0.3919,
+      "step": 1128
+    },
+    {
+      "epoch": 0.2923828946942475,
+      "grad_norm": 4.725959357988391,
+      "learning_rate": 1.1144993132441967e-06,
+      "loss": 0.3668,
+      "step": 1129
+    },
+    {
+      "epoch": 0.29264186980026546,
+      "grad_norm": 4.032660789825553,
+      "learning_rate": 1.1141476897122348e-06,
+      "loss": 0.3183,
+      "step": 1130
+    },
+    {
+      "epoch": 0.29264186980026546,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.89171974522293,
+      "eval_PRM F1 AUC": 0.8347302252488213,
+      "eval_PRM F1 AUC (fixed)": 0.7661079099004714,
+      "eval_PRM F1 Neg": 0.6909090909090909,
+      "eval_PRM NPV": 0.59375,
+      "eval_PRM Precision": 0.9459459459459459,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.26497408747673035,
+      "eval_runtime": 14.3768,
+      "eval_samples_per_second": 3.06,
+      "eval_steps_per_second": 0.139,
+      "step": 1130
+    },
+    {
+      "epoch": 0.2929008449062834,
+      "grad_norm": 7.673167100360908,
+      "learning_rate": 1.1137956661617566e-06,
+      "loss": 0.3832,
+      "step": 1131
+    },
+    {
+      "epoch": 0.29315982001230134,
+      "grad_norm": 7.881068518051551,
+      "learning_rate": 1.113443242880643e-06,
+      "loss": 0.3027,
+      "step": 1132
+    },
+    {
+      "epoch": 0.29341879511831925,
+      "grad_norm": 5.782281218579323,
+      "learning_rate": 1.1130904201571006e-06,
+      "loss": 0.3171,
+      "step": 1133
+    },
+    {
+      "epoch": 0.29367777022433716,
+      "grad_norm": 3.762358561390526,
+      "learning_rate": 1.1127371982796636e-06,
+      "loss": 0.3372,
+      "step": 1134
+    },
+    {
+      "epoch": 0.29393674533035513,
+      "grad_norm": 3.7955893572075787,
+      "learning_rate": 1.1123835775371919e-06,
+      "loss": 0.3413,
+      "step": 1135
+    },
+    {
+      "epoch": 0.29393674533035513,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.906832298136646,
+      "eval_PRM F1 AUC": 0.8310633839706653,
+      "eval_PRM F1 AUC (fixed)": 0.7619172341540074,
+      "eval_PRM F1 Neg": 0.7058823529411765,
+      "eval_PRM NPV": 0.6428571428571429,
+      "eval_PRM Precision": 0.9358974358974359,
+      "eval_PRM Recall": 0.8795180722891566,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.25865188241004944,
+      "eval_runtime": 14.9603,
+      "eval_samples_per_second": 2.941,
+      "eval_steps_per_second": 0.134,
+      "step": 1135
+    },
+    {
+      "epoch": 0.29419572043637304,
+      "grad_norm": 2.959177369623632,
+      "learning_rate": 1.1120295582188718e-06,
+      "loss": 0.3441,
+      "step": 1136
+    },
+    {
+      "epoch": 0.294454695542391,
+      "grad_norm": 3.3679792765512704,
+      "learning_rate": 1.111675140614216e-06,
+      "loss": 0.3377,
+      "step": 1137
+    },
+    {
+      "epoch": 0.2947136706484089,
+      "grad_norm": 3.597086189327973,
+      "learning_rate": 1.1113203250130623e-06,
+      "loss": 0.3644,
+      "step": 1138
+    },
+    {
+      "epoch": 0.29497264575442683,
+      "grad_norm": 2.9662259450420168,
+      "learning_rate": 1.110965111705574e-06,
+      "loss": 0.3793,
+      "step": 1139
+    },
+    {
+      "epoch": 0.2952316208604448,
+      "grad_norm": 10.258782090900965,
+      "learning_rate": 1.1106095009822401e-06,
+      "loss": 0.4473,
+      "step": 1140
+    },
+    {
+      "epoch": 0.2952316208604448,
+      "eval_PRM Accuracy": 0.8773584905660378,
+      "eval_PRM F1": 0.9202453987730062,
+      "eval_PRM F1 AUC": 0.8431115767417497,
+      "eval_PRM F1 AUC (fixed)": 0.7621791513881614,
+      "eval_PRM F1 Neg": 0.7346938775510204,
+      "eval_PRM NPV": 0.6923076923076923,
+      "eval_PRM Precision": 0.9375,
+      "eval_PRM Recall": 0.9036144578313253,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2613238990306854,
+      "eval_runtime": 14.3424,
+      "eval_samples_per_second": 3.068,
+      "eval_steps_per_second": 0.139,
+      "step": 1140
+    },
+    {
+      "epoch": 0.2954905959664627,
+      "grad_norm": 9.086209755968815,
+      "learning_rate": 1.1102534931338743e-06,
+      "loss": 0.357,
+      "step": 1141
+    },
+    {
+      "epoch": 0.2957495710724807,
+      "grad_norm": 4.4360234766203845,
+      "learning_rate": 1.1098970884516153e-06,
+      "loss": 0.3027,
+      "step": 1142
+    },
+    {
+      "epoch": 0.2960085461784986,
+      "grad_norm": 3.6234523247900623,
+      "learning_rate": 1.1095402872269257e-06,
+      "loss": 0.3617,
+      "step": 1143
+    },
+    {
+      "epoch": 0.2962675212845165,
+      "grad_norm": 3.214590685530097,
+      "learning_rate": 1.1091830897515932e-06,
+      "loss": 0.361,
+      "step": 1144
+    },
+    {
+      "epoch": 0.29652649639053447,
+      "grad_norm": 4.836324193876224,
+      "learning_rate": 1.108825496317729e-06,
+      "loss": 0.3596,
+      "step": 1145
+    },
+    {
+      "epoch": 0.29652649639053447,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8860759493670886,
+      "eval_PRM F1 AUC": 0.8129910948140389,
+      "eval_PRM F1 AUC (fixed)": 0.7619172341540074,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5806451612903226,
+      "eval_PRM Precision": 0.9333333333333333,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2637127935886383,
+      "eval_runtime": 14.6897,
+      "eval_samples_per_second": 2.995,
+      "eval_steps_per_second": 0.136,
+      "step": 1145
+    },
+    {
+      "epoch": 0.2967854714965524,
+      "grad_norm": 4.40229983630881,
+      "learning_rate": 1.1084675072177684e-06,
+      "loss": 0.2748,
+      "step": 1146
+    },
+    {
+      "epoch": 0.29704444660257034,
+      "grad_norm": 6.446443974590935,
+      "learning_rate": 1.10810912274447e-06,
+      "loss": 0.3959,
+      "step": 1147
+    },
+    {
+      "epoch": 0.29730342170858826,
+      "grad_norm": 4.162136530137705,
+      "learning_rate": 1.1077503431909161e-06,
+      "loss": 0.3092,
+      "step": 1148
+    },
+    {
+      "epoch": 0.2975623968146062,
+      "grad_norm": 3.379942752653197,
+      "learning_rate": 1.1073911688505118e-06,
+      "loss": 0.3569,
+      "step": 1149
+    },
+    {
+      "epoch": 0.29782137192062413,
+      "grad_norm": 4.790526956890661,
+      "learning_rate": 1.1070316000169847e-06,
+      "loss": 0.3305,
+      "step": 1150
+    },
+    {
+      "epoch": 0.29782137192062413,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.906832298136646,
+      "eval_PRM F1 AUC": 0.8310633839706653,
+      "eval_PRM F1 AUC (fixed)": 0.7668936616029335,
+      "eval_PRM F1 Neg": 0.7058823529411765,
+      "eval_PRM NPV": 0.6428571428571429,
+      "eval_PRM Precision": 0.9358974358974359,
+      "eval_PRM Recall": 0.8795180722891566,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.256858229637146,
+      "eval_runtime": 14.6627,
+      "eval_samples_per_second": 3.001,
+      "eval_steps_per_second": 0.136,
+      "step": 1150
+    },
+    {
+      "epoch": 0.29808034702664205,
+      "grad_norm": 4.646326337168363,
+      "learning_rate": 1.1066716369843863e-06,
+      "loss": 0.4038,
+      "step": 1151
+    },
+    {
+      "epoch": 0.29833932213266,
+      "grad_norm": 6.96599879604997,
+      "learning_rate": 1.1063112800470888e-06,
+      "loss": 0.3765,
+      "step": 1152
+    },
+    {
+      "epoch": 0.2985982972386779,
+      "grad_norm": 3.1915204817949783,
+      "learning_rate": 1.105950529499788e-06,
+      "loss": 0.2686,
+      "step": 1153
+    },
+    {
+      "epoch": 0.2988572723446959,
+      "grad_norm": 3.798299543621722,
+      "learning_rate": 1.1055893856375003e-06,
+      "loss": 0.3423,
+      "step": 1154
+    },
+    {
+      "epoch": 0.2991162474507138,
+      "grad_norm": 5.672302650751939,
+      "learning_rate": 1.1052278487555649e-06,
+      "loss": 0.383,
+      "step": 1155
+    },
+    {
+      "epoch": 0.2991162474507138,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.906832298136646,
+      "eval_PRM F1 AUC": 0.8310633839706653,
+      "eval_PRM F1 AUC (fixed)": 0.7750130958617076,
+      "eval_PRM F1 Neg": 0.7058823529411765,
+      "eval_PRM NPV": 0.6428571428571429,
+      "eval_PRM Precision": 0.9358974358974359,
+      "eval_PRM Recall": 0.8795180722891566,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.25225791335105896,
+      "eval_runtime": 14.7283,
+      "eval_samples_per_second": 2.987,
+      "eval_steps_per_second": 0.136,
+      "step": 1155
+    },
+    {
+      "epoch": 0.2993752225567317,
+      "grad_norm": 5.845418089666656,
+      "learning_rate": 1.1048659191496416e-06,
+      "loss": 0.417,
+      "step": 1156
+    },
+    {
+      "epoch": 0.2996341976627497,
+      "grad_norm": 5.937672783763917,
+      "learning_rate": 1.1045035971157117e-06,
+      "loss": 0.4291,
+      "step": 1157
+    },
+    {
+      "epoch": 0.2998931727687676,
+      "grad_norm": 3.4584606230076447,
+      "learning_rate": 1.1041408829500773e-06,
+      "loss": 0.3194,
+      "step": 1158
+    },
+    {
+      "epoch": 0.30015214787478556,
+      "grad_norm": 4.451876308852337,
+      "learning_rate": 1.1037777769493613e-06,
+      "loss": 0.3549,
+      "step": 1159
+    },
+    {
+      "epoch": 0.30041112298080347,
+      "grad_norm": 3.602995497692067,
+      "learning_rate": 1.103414279410507e-06,
+      "loss": 0.3692,
+      "step": 1160
+    },
+    {
+      "epoch": 0.30041112298080347,
+      "eval_PRM Accuracy": 0.8207547169811321,
+      "eval_PRM F1": 0.8789808917197452,
+      "eval_PRM F1 AUC": 0.8069669984284967,
+      "eval_PRM F1 AUC (fixed)": 0.7773703509690938,
+      "eval_PRM F1 Neg": 0.6545454545454545,
+      "eval_PRM NPV": 0.5625,
+      "eval_PRM Precision": 0.9324324324324325,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.26475226879119873,
+      "eval_runtime": 14.7743,
+      "eval_samples_per_second": 2.978,
+      "eval_steps_per_second": 0.135,
+      "step": 1160
+    },
+    {
+      "epoch": 0.3006700980868214,
+      "grad_norm": 5.62440934358399,
+      "learning_rate": 1.1030503906307781e-06,
+      "loss": 0.2798,
+      "step": 1161
+    },
+    {
+      "epoch": 0.30092907319283935,
+      "grad_norm": 4.339810549098005,
+      "learning_rate": 1.1026861109077579e-06,
+      "loss": 0.3868,
+      "step": 1162
+    },
+    {
+      "epoch": 0.30118804829885726,
+      "grad_norm": 12.165816417405841,
+      "learning_rate": 1.1023214405393492e-06,
+      "loss": 0.3984,
+      "step": 1163
+    },
+    {
+      "epoch": 0.3014470234048752,
+      "grad_norm": 5.7935098656181365,
+      "learning_rate": 1.1019563798237752e-06,
+      "loss": 0.5339,
+      "step": 1164
+    },
+    {
+      "epoch": 0.30170599851089314,
+      "grad_norm": 3.5268608216207467,
+      "learning_rate": 1.1015909290595771e-06,
+      "loss": 0.4078,
+      "step": 1165
+    },
+    {
+      "epoch": 0.30170599851089314,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8860759493670886,
+      "eval_PRM F1 AUC": 0.8129910948140389,
+      "eval_PRM F1 AUC (fixed)": 0.7729177579884756,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5806451612903226,
+      "eval_PRM Precision": 0.9333333333333333,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.26175162196159363,
+      "eval_runtime": 14.2847,
+      "eval_samples_per_second": 3.08,
+      "eval_steps_per_second": 0.14,
+      "step": 1165
+    },
+    {
+      "epoch": 0.30196497361691105,
+      "grad_norm": 4.127649198536379,
+      "learning_rate": 1.1012250885456164e-06,
+      "loss": 0.4231,
+      "step": 1166
+    },
+    {
+      "epoch": 0.302223948722929,
+      "grad_norm": 3.4331514655877773,
+      "learning_rate": 1.100858858581072e-06,
+      "loss": 0.4242,
+      "step": 1167
+    },
+    {
+      "epoch": 0.3024829238289469,
+      "grad_norm": 6.40016116126962,
+      "learning_rate": 1.1004922394654423e-06,
+      "loss": 0.4285,
+      "step": 1168
+    },
+    {
+      "epoch": 0.3027418989349649,
+      "grad_norm": 3.656133214972611,
+      "learning_rate": 1.1001252314985433e-06,
+      "loss": 0.3593,
+      "step": 1169
+    },
+    {
+      "epoch": 0.3030008740409828,
+      "grad_norm": 7.158557853449496,
+      "learning_rate": 1.0997578349805096e-06,
+      "loss": 0.4875,
+      "step": 1170
+    },
+    {
+      "epoch": 0.3030008740409828,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8930817610062893,
+      "eval_PRM F1 AUC": 0.819015191199581,
+      "eval_PRM F1 AUC (fixed)": 0.7590361445783133,
+      "eval_PRM F1 Neg": 0.6792452830188679,
+      "eval_PRM NPV": 0.6,
+      "eval_PRM Precision": 0.9342105263157895,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2685607969760895,
+      "eval_runtime": 14.5565,
+      "eval_samples_per_second": 3.023,
+      "eval_steps_per_second": 0.137,
+      "step": 1170
+    },
+    {
+      "epoch": 0.30325984914700077,
+      "grad_norm": 3.0556367903726644,
+      "learning_rate": 1.0993900502117929e-06,
+      "loss": 0.3849,
+      "step": 1171
+    },
+    {
+      "epoch": 0.3035188242530187,
+      "grad_norm": 2.802202697649935,
+      "learning_rate": 1.099021877493163e-06,
+      "loss": 0.3063,
+      "step": 1172
+    },
+    {
+      "epoch": 0.3037777993590366,
+      "grad_norm": 5.612109421532672,
+      "learning_rate": 1.0986533171257064e-06,
+      "loss": 0.3155,
+      "step": 1173
+    },
+    {
+      "epoch": 0.30403677446505456,
+      "grad_norm": 7.349516478413747,
+      "learning_rate": 1.0982843694108272e-06,
+      "loss": 0.3551,
+      "step": 1174
+    },
+    {
+      "epoch": 0.30429574957107247,
+      "grad_norm": 5.372861942029928,
+      "learning_rate": 1.0979150346502456e-06,
+      "loss": 0.3109,
+      "step": 1175
+    },
+    {
+      "epoch": 0.30429574957107247,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.9,
+      "eval_PRM F1 AUC": 0.8250392875851232,
+      "eval_PRM F1 AUC (fixed)": 0.7627029858564693,
+      "eval_PRM F1 Neg": 0.6923076923076923,
+      "eval_PRM NPV": 0.6206896551724138,
+      "eval_PRM Precision": 0.935064935064935,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2636399567127228,
+      "eval_runtime": 14.6856,
+      "eval_samples_per_second": 2.996,
+      "eval_steps_per_second": 0.136,
+      "step": 1175
+    },
+    {
+      "epoch": 0.30455472467709044,
+      "grad_norm": 2.9856816961371804,
+      "learning_rate": 1.097545313145999e-06,
+      "loss": 0.3356,
+      "step": 1176
+    },
+    {
+      "epoch": 0.30481369978310835,
+      "grad_norm": 4.151685285025255,
+      "learning_rate": 1.0971752052004406e-06,
+      "loss": 0.3121,
+      "step": 1177
+    },
+    {
+      "epoch": 0.30507267488912626,
+      "grad_norm": 3.2390232780479025,
+      "learning_rate": 1.0968047111162399e-06,
+      "loss": 0.3094,
+      "step": 1178
+    },
+    {
+      "epoch": 0.3053316499951442,
+      "grad_norm": 4.673769546912608,
+      "learning_rate": 1.096433831196382e-06,
+      "loss": 0.3841,
+      "step": 1179
+    },
+    {
+      "epoch": 0.30559062510116214,
+      "grad_norm": 3.818883587684225,
+      "learning_rate": 1.0960625657441678e-06,
+      "loss": 0.3289,
+      "step": 1180
+    },
+    {
+      "epoch": 0.30559062510116214,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.9,
+      "eval_PRM F1 AUC": 0.8250392875851232,
+      "eval_PRM F1 AUC (fixed)": 0.7797276060764797,
+      "eval_PRM F1 Neg": 0.6923076923076923,
+      "eval_PRM NPV": 0.6206896551724138,
+      "eval_PRM Precision": 0.935064935064935,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.25430724024772644,
+      "eval_runtime": 14.6663,
+      "eval_samples_per_second": 3.0,
+      "eval_steps_per_second": 0.136,
+      "step": 1180
+    },
+    {
+      "epoch": 0.3058496002071801,
+      "grad_norm": 3.871524702893708,
+      "learning_rate": 1.0956909150632127e-06,
+      "loss": 0.3914,
+      "step": 1181
+    },
+    {
+      "epoch": 0.306108575313198,
+      "grad_norm": 4.465570175748092,
+      "learning_rate": 1.0953188794574485e-06,
+      "loss": 0.4142,
+      "step": 1182
+    },
+    {
+      "epoch": 0.30636755041921593,
+      "grad_norm": 6.871748586463232,
+      "learning_rate": 1.0949464592311203e-06,
+      "loss": 0.4566,
+      "step": 1183
+    },
+    {
+      "epoch": 0.3066265255252339,
+      "grad_norm": 5.5128943255174985,
+      "learning_rate": 1.0945736546887888e-06,
+      "loss": 0.3573,
+      "step": 1184
+    },
+    {
+      "epoch": 0.3068855006312518,
+      "grad_norm": 6.356115342327138,
+      "learning_rate": 1.0942004661353286e-06,
+      "loss": 0.4997,
+      "step": 1185
+    },
+    {
+      "epoch": 0.3068855006312518,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8930817610062893,
+      "eval_PRM F1 AUC": 0.819015191199581,
+      "eval_PRM F1 AUC (fixed)": 0.7844421162912519,
+      "eval_PRM F1 Neg": 0.6792452830188679,
+      "eval_PRM NPV": 0.6,
+      "eval_PRM Precision": 0.9342105263157895,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.25315046310424805,
+      "eval_runtime": 14.4533,
+      "eval_samples_per_second": 3.044,
+      "eval_steps_per_second": 0.138,
+      "step": 1185
+    },
+    {
+      "epoch": 0.3071444757372698,
+      "grad_norm": 3.5379039136569537,
+      "learning_rate": 1.0938268938759283e-06,
+      "loss": 0.379,
+      "step": 1186
+    },
+    {
+      "epoch": 0.3074034508432877,
+      "grad_norm": 4.202834808405025,
+      "learning_rate": 1.0934529382160903e-06,
+      "loss": 0.3091,
+      "step": 1187
+    },
+    {
+      "epoch": 0.3076624259493056,
+      "grad_norm": 3.8281927280708548,
+      "learning_rate": 1.0930785994616308e-06,
+      "loss": 0.4309,
+      "step": 1188
+    },
+    {
+      "epoch": 0.30792140105532356,
+      "grad_norm": 6.333845590798601,
+      "learning_rate": 1.092703877918679e-06,
+      "loss": 0.4023,
+      "step": 1189
+    },
+    {
+      "epoch": 0.3081803761613415,
+      "grad_norm": 4.1471122361908845,
+      "learning_rate": 1.0923287738936771e-06,
+      "loss": 0.4087,
+      "step": 1190
+    },
+    {
+      "epoch": 0.3081803761613415,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8903225806451613,
+      "eval_PRM F1 AUC": 0.8504452592980618,
+      "eval_PRM F1 AUC (fixed)": 0.7799895233106339,
+      "eval_PRM F1 Neg": 0.7017543859649122,
+      "eval_PRM NPV": 0.5882352941176471,
+      "eval_PRM Precision": 0.9583333333333334,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.26387837529182434,
+      "eval_runtime": 15.0772,
+      "eval_samples_per_second": 2.918,
+      "eval_steps_per_second": 0.133,
+      "step": 1190
+    },
+    {
+      "epoch": 0.30843935126735944,
+      "grad_norm": 3.490983419168074,
+      "learning_rate": 1.0919532876933803e-06,
+      "loss": 0.4005,
+      "step": 1191
+    },
+    {
+      "epoch": 0.30869832637337735,
+      "grad_norm": 4.300796741862126,
+      "learning_rate": 1.0915774196248564e-06,
+      "loss": 0.4054,
+      "step": 1192
+    },
+    {
+      "epoch": 0.3089573014793953,
+      "grad_norm": 5.991455393032304,
+      "learning_rate": 1.091201169995485e-06,
+      "loss": 0.3517,
+      "step": 1193
+    },
+    {
+      "epoch": 0.30921627658541323,
+      "grad_norm": 4.34016764245388,
+      "learning_rate": 1.0908245391129584e-06,
+      "loss": 0.3691,
+      "step": 1194
+    },
+    {
+      "epoch": 0.30947525169143114,
+      "grad_norm": 3.006782408187908,
+      "learning_rate": 1.0904475272852802e-06,
+      "loss": 0.3554,
+      "step": 1195
+    },
+    {
+      "epoch": 0.30947525169143114,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8860759493670886,
+      "eval_PRM F1 AUC": 0.8129910948140389,
+      "eval_PRM F1 AUC (fixed)": 0.788108957569408,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5806451612903226,
+      "eval_PRM Precision": 0.9333333333333333,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.25778552889823914,
+      "eval_runtime": 14.6532,
+      "eval_samples_per_second": 3.003,
+      "eval_steps_per_second": 0.136,
+      "step": 1195
+    },
+    {
+      "epoch": 0.3097342267974491,
+      "grad_norm": 7.834331309453101,
+      "learning_rate": 1.0900701348207656e-06,
+      "loss": 0.3341,
+      "step": 1196
+    },
+    {
+      "epoch": 0.309993201903467,
+      "grad_norm": 4.837884152961991,
+      "learning_rate": 1.0896923620280416e-06,
+      "loss": 0.3391,
+      "step": 1197
+    },
+    {
+      "epoch": 0.310252177009485,
+      "grad_norm": 3.458578607508161,
+      "learning_rate": 1.0893142092160451e-06,
+      "loss": 0.3735,
+      "step": 1198
+    },
+    {
+      "epoch": 0.3105111521155029,
+      "grad_norm": 3.243852160400903,
+      "learning_rate": 1.0889356766940252e-06,
+      "loss": 0.3834,
+      "step": 1199
+    },
+    {
+      "epoch": 0.3107701272215208,
+      "grad_norm": 4.370429860764285,
+      "learning_rate": 1.0885567647715404e-06,
+      "loss": 0.2463,
+      "step": 1200
+    },
+    {
+      "epoch": 0.3107701272215208,
+      "eval_PRM Accuracy": 0.8679245283018868,
+      "eval_PRM F1": 0.9135802469135802,
+      "eval_PRM F1 AUC": 0.8370874803562075,
+      "eval_PRM F1 AUC (fixed)": 0.7998952331063384,
+      "eval_PRM F1 Neg": 0.72,
+      "eval_PRM NPV": 0.6666666666666666,
+      "eval_PRM Precision": 0.9367088607594937,
+      "eval_PRM Recall": 0.891566265060241,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.25024715065956116,
+      "eval_runtime": 14.8849,
+      "eval_samples_per_second": 2.956,
+      "eval_steps_per_second": 0.134,
+      "step": 1200
+    },
+    {
+      "epoch": 0.3110291023275388,
+      "grad_norm": 3.9693767544882834,
+      "learning_rate": 1.0881774737584597e-06,
+      "loss": 0.2953,
+      "step": 1201
+    },
+    {
+      "epoch": 0.3112880774335567,
+      "grad_norm": 3.45629528989537,
+      "learning_rate": 1.0877978039649628e-06,
+      "loss": 0.3799,
+      "step": 1202
+    },
+    {
+      "epoch": 0.31154705253957465,
+      "grad_norm": 3.465792543374586,
+      "learning_rate": 1.087417755701538e-06,
+      "loss": 0.2799,
+      "step": 1203
+    },
+    {
+      "epoch": 0.31180602764559257,
+      "grad_norm": 4.392253680638649,
+      "learning_rate": 1.0870373292789844e-06,
+      "loss": 0.4396,
+      "step": 1204
+    },
+    {
+      "epoch": 0.3120650027516105,
+      "grad_norm": 7.80351799300313,
+      "learning_rate": 1.0866565250084092e-06,
+      "loss": 0.3509,
+      "step": 1205
+    },
+    {
+      "epoch": 0.3120650027516105,
+      "eval_PRM Accuracy": 0.8773584905660378,
+      "eval_PRM F1": 0.9212121212121213,
+      "eval_PRM F1 AUC": 0.8273965426925091,
+      "eval_PRM F1 AUC (fixed)": 0.8140387637506548,
+      "eval_PRM F1 Neg": 0.723404255319149,
+      "eval_PRM NPV": 0.7083333333333334,
+      "eval_PRM Precision": 0.926829268292683,
+      "eval_PRM Recall": 0.9156626506024096,
+      "eval_PRM Specificty": 0.7391304347826086,
+      "eval_loss": 0.2483535259962082,
+      "eval_runtime": 14.8603,
+      "eval_samples_per_second": 2.961,
+      "eval_steps_per_second": 0.135,
+      "step": 1205
+    },
+    {
+      "epoch": 0.31232397785762844,
+      "grad_norm": 5.156928269505667,
+      "learning_rate": 1.0862753432012293e-06,
+      "loss": 0.2728,
+      "step": 1206
+    },
+    {
+      "epoch": 0.31258295296364635,
+      "grad_norm": 12.132211890537517,
+      "learning_rate": 1.08589378416917e-06,
+      "loss": 0.4319,
+      "step": 1207
+    },
+    {
+      "epoch": 0.3128419280696643,
+      "grad_norm": 6.915697049487834,
+      "learning_rate": 1.0855118482242655e-06,
+      "loss": 0.4666,
+      "step": 1208
+    },
+    {
+      "epoch": 0.31310090317568223,
+      "grad_norm": 6.968230933752234,
+      "learning_rate": 1.085129535678858e-06,
+      "loss": 0.2983,
+      "step": 1209
+    },
+    {
+      "epoch": 0.3133598782817002,
+      "grad_norm": 3.594238368899922,
+      "learning_rate": 1.084746846845597e-06,
+      "loss": 0.4571,
+      "step": 1210
+    },
+    {
+      "epoch": 0.3133598782817002,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8961038961038961,
+      "eval_PRM F1 AUC": 0.8721843897328445,
+      "eval_PRM F1 AUC (fixed)": 0.8085385018334206,
+      "eval_PRM F1 Neg": 0.7241379310344828,
+      "eval_PRM NPV": 0.6,
+      "eval_PRM Precision": 0.971830985915493,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.9130434782608695,
+      "eval_loss": 0.26208773255348206,
+      "eval_runtime": 14.5572,
+      "eval_samples_per_second": 3.023,
+      "eval_steps_per_second": 0.137,
+      "step": 1210
+    },
+    {
+      "epoch": 0.3136188533877181,
+      "grad_norm": 10.986999998465846,
+      "learning_rate": 1.0843637820374415e-06,
+      "loss": 0.348,
+      "step": 1211
+    },
+    {
+      "epoch": 0.313877828493736,
+      "grad_norm": 6.007952874878346,
+      "learning_rate": 1.0839803415676555e-06,
+      "loss": 0.3719,
+      "step": 1212
+    },
+    {
+      "epoch": 0.314136803599754,
+      "grad_norm": 6.548551815265104,
+      "learning_rate": 1.0835965257498127e-06,
+      "loss": 0.3069,
+      "step": 1213
+    },
+    {
+      "epoch": 0.3143957787057719,
+      "grad_norm": 6.907837361489586,
+      "learning_rate": 1.083212334897792e-06,
+      "loss": 0.4288,
+      "step": 1214
+    },
+    {
+      "epoch": 0.31465475381178987,
+      "grad_norm": 4.619638739193467,
+      "learning_rate": 1.0828277693257797e-06,
+      "loss": 0.3227,
+      "step": 1215
+    },
+    {
+      "epoch": 0.31465475381178987,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8961038961038961,
+      "eval_PRM F1 AUC": 0.8721843897328445,
+      "eval_PRM F1 AUC (fixed)": 0.8129910948140388,
+      "eval_PRM F1 Neg": 0.7241379310344828,
+      "eval_PRM NPV": 0.6,
+      "eval_PRM Precision": 0.971830985915493,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.9130434782608695,
+      "eval_loss": 0.2673983871936798,
+      "eval_runtime": 14.6708,
+      "eval_samples_per_second": 2.999,
+      "eval_steps_per_second": 0.136,
+      "step": 1215
+    },
+    {
+      "epoch": 0.3149137289178078,
+      "grad_norm": 6.725501666695132,
+      "learning_rate": 1.0824428293482682e-06,
+      "loss": 0.3644,
+      "step": 1216
+    },
+    {
+      "epoch": 0.3151727040238257,
+      "grad_norm": 4.1162153720484715,
+      "learning_rate": 1.082057515280057e-06,
+      "loss": 0.371,
+      "step": 1217
+    },
+    {
+      "epoch": 0.31543167912984366,
+      "grad_norm": 6.834652646331434,
+      "learning_rate": 1.0816718274362505e-06,
+      "loss": 0.2873,
+      "step": 1218
+    },
+    {
+      "epoch": 0.31569065423586157,
+      "grad_norm": 3.0933559887087174,
+      "learning_rate": 1.0812857661322589e-06,
+      "loss": 0.3626,
+      "step": 1219
+    },
+    {
+      "epoch": 0.31594962934187953,
+      "grad_norm": 3.994407339934042,
+      "learning_rate": 1.0808993316837982e-06,
+      "loss": 0.418,
+      "step": 1220
+    },
+    {
+      "epoch": 0.31594962934187953,
+      "eval_PRM Accuracy": 0.8867924528301887,
+      "eval_PRM F1": 0.926829268292683,
+      "eval_PRM F1 AUC": 0.8491356731272918,
+      "eval_PRM F1 AUC (fixed)": 0.8122053431115768,
+      "eval_PRM F1 Neg": 0.75,
+      "eval_PRM NPV": 0.72,
+      "eval_PRM Precision": 0.9382716049382716,
+      "eval_PRM Recall": 0.9156626506024096,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.24850182235240936,
+      "eval_runtime": 15.0241,
+      "eval_samples_per_second": 2.929,
+      "eval_steps_per_second": 0.133,
+      "step": 1220
+    },
+    {
+      "epoch": 0.31620860444789745,
+      "grad_norm": 3.5620307606032946,
+      "learning_rate": 1.0805125244068892e-06,
+      "loss": 0.3168,
+      "step": 1221
+    },
+    {
+      "epoch": 0.31646757955391536,
+      "grad_norm": 7.342654037434144,
+      "learning_rate": 1.0801253446178583e-06,
+      "loss": 0.4416,
+      "step": 1222
+    },
+    {
+      "epoch": 0.3167265546599333,
+      "grad_norm": 9.728744933510296,
+      "learning_rate": 1.0797377926333355e-06,
+      "loss": 0.4929,
+      "step": 1223
+    },
+    {
+      "epoch": 0.31698552976595123,
+      "grad_norm": 6.491475501077239,
+      "learning_rate": 1.079349868770256e-06,
+      "loss": 0.4135,
+      "step": 1224
+    },
+    {
+      "epoch": 0.3172445048719692,
+      "grad_norm": 6.106952798989202,
+      "learning_rate": 1.0789615733458586e-06,
+      "loss": 0.4119,
+      "step": 1225
+    },
+    {
+      "epoch": 0.3172445048719692,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.906832298136646,
+      "eval_PRM F1 AUC": 0.8310633839706653,
+      "eval_PRM F1 AUC (fixed)": 0.7930853850183341,
+      "eval_PRM F1 Neg": 0.7058823529411765,
+      "eval_PRM NPV": 0.6428571428571429,
+      "eval_PRM Precision": 0.9358974358974359,
+      "eval_PRM Recall": 0.8795180722891566,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2541673481464386,
+      "eval_runtime": 14.5856,
+      "eval_samples_per_second": 3.017,
+      "eval_steps_per_second": 0.137,
+      "step": 1225
+    },
+    {
+      "epoch": 0.3175034799779871,
+      "grad_norm": 3.0338791452656144,
+      "learning_rate": 1.0785729066776864e-06,
+      "loss": 0.3631,
+      "step": 1226
+    },
+    {
+      "epoch": 0.317762455084005,
+      "grad_norm": 3.6359197190099266,
+      "learning_rate": 1.0781838690835856e-06,
+      "loss": 0.3624,
+      "step": 1227
+    },
+    {
+      "epoch": 0.318021430190023,
+      "grad_norm": 4.79808651922732,
+      "learning_rate": 1.0777944608817061e-06,
+      "loss": 0.353,
+      "step": 1228
+    },
+    {
+      "epoch": 0.3182804052960409,
+      "grad_norm": 3.2920462609639523,
+      "learning_rate": 1.0774046823905007e-06,
+      "loss": 0.3106,
+      "step": 1229
+    },
+    {
+      "epoch": 0.31853938040205887,
+      "grad_norm": 5.105740527499564,
+      "learning_rate": 1.0770145339287254e-06,
+      "loss": 0.3778,
+      "step": 1230
+    },
+    {
+      "epoch": 0.31853938040205887,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8860759493670886,
+      "eval_PRM F1 AUC": 0.8129910948140389,
+      "eval_PRM F1 AUC (fixed)": 0.7794656888423258,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5806451612903226,
+      "eval_PRM Precision": 0.9333333333333333,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.264245867729187,
+      "eval_runtime": 14.9669,
+      "eval_samples_per_second": 2.94,
+      "eval_steps_per_second": 0.134,
+      "step": 1230
+    },
+    {
+      "epoch": 0.3187983555080768,
+      "grad_norm": 2.5851477388861754,
+      "learning_rate": 1.0766240158154382e-06,
+      "loss": 0.3024,
+      "step": 1231
+    },
+    {
+      "epoch": 0.31905733061409475,
+      "grad_norm": 5.233677920244123,
+      "learning_rate": 1.0762331283699997e-06,
+      "loss": 0.3715,
+      "step": 1232
+    },
+    {
+      "epoch": 0.31931630572011266,
+      "grad_norm": 2.695238376578191,
+      "learning_rate": 1.0758418719120723e-06,
+      "loss": 0.3182,
+      "step": 1233
+    },
+    {
+      "epoch": 0.31957528082613057,
+      "grad_norm": 5.177819112800959,
+      "learning_rate": 1.0754502467616207e-06,
+      "loss": 0.3243,
+      "step": 1234
+    },
+    {
+      "epoch": 0.31983425593214854,
+      "grad_norm": 4.881959830665304,
+      "learning_rate": 1.0750582532389107e-06,
+      "loss": 0.3412,
+      "step": 1235
+    },
+    {
+      "epoch": 0.31983425593214854,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8860759493670886,
+      "eval_PRM F1 AUC": 0.8129910948140389,
+      "eval_PRM F1 AUC (fixed)": 0.7802514405447879,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5806451612903226,
+      "eval_PRM Precision": 0.9333333333333333,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.26019617915153503,
+      "eval_runtime": 14.7283,
+      "eval_samples_per_second": 2.987,
+      "eval_steps_per_second": 0.136,
+      "step": 1235
+    },
+    {
+      "epoch": 0.32009323103816645,
+      "grad_norm": 3.170497689713328,
+      "learning_rate": 1.074665891664509e-06,
+      "loss": 0.3291,
+      "step": 1236
+    },
+    {
+      "epoch": 0.3203522061441844,
+      "grad_norm": 4.371669431913452,
+      "learning_rate": 1.0742731623592846e-06,
+      "loss": 0.3604,
+      "step": 1237
+    },
+    {
+      "epoch": 0.3206111812502023,
+      "grad_norm": 6.077137989216843,
+      "learning_rate": 1.0738800656444053e-06,
+      "loss": 0.3834,
+      "step": 1238
+    },
+    {
+      "epoch": 0.32087015635622024,
+      "grad_norm": 4.292347676028572,
+      "learning_rate": 1.0734866018413413e-06,
+      "loss": 0.3677,
+      "step": 1239
+    },
+    {
+      "epoch": 0.3211291314622382,
+      "grad_norm": 6.327860085742873,
+      "learning_rate": 1.0730927712718614e-06,
+      "loss": 0.3754,
+      "step": 1240
+    },
+    {
+      "epoch": 0.3211291314622382,
+      "eval_PRM Accuracy": 0.8773584905660378,
+      "eval_PRM F1": 0.9202453987730062,
+      "eval_PRM F1 AUC": 0.8431115767417497,
+      "eval_PRM F1 AUC (fixed)": 0.7854897852278679,
+      "eval_PRM F1 Neg": 0.7346938775510204,
+      "eval_PRM NPV": 0.6923076923076923,
+      "eval_PRM Precision": 0.9375,
+      "eval_PRM Recall": 0.9036144578313253,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2534755766391754,
+      "eval_runtime": 14.3876,
+      "eval_samples_per_second": 3.058,
+      "eval_steps_per_second": 0.139,
+      "step": 1240
+    },
+    {
+      "epoch": 0.3213881065682561,
+      "grad_norm": 5.573037635059935,
+      "learning_rate": 1.0726985742580355e-06,
+      "loss": 0.399,
+      "step": 1241
+    },
+    {
+      "epoch": 0.3216470816742741,
+      "grad_norm": 5.900603463933119,
+      "learning_rate": 1.0723040111222325e-06,
+      "loss": 0.3801,
+      "step": 1242
+    },
+    {
+      "epoch": 0.321906056780292,
+      "grad_norm": 7.0207752592900485,
+      "learning_rate": 1.0719090821871208e-06,
+      "loss": 0.3531,
+      "step": 1243
+    },
+    {
+      "epoch": 0.3221650318863099,
+      "grad_norm": 4.396846712017389,
+      "learning_rate": 1.0715137877756683e-06,
+      "loss": 0.3045,
+      "step": 1244
+    },
+    {
+      "epoch": 0.32242400699232787,
+      "grad_norm": 3.10027769254378,
+      "learning_rate": 1.0711181282111415e-06,
+      "loss": 0.3093,
+      "step": 1245
+    },
+    {
+      "epoch": 0.32242400699232787,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8860759493670886,
+      "eval_PRM F1 AUC": 0.8129910948140389,
+      "eval_PRM F1 AUC (fixed)": 0.7805133577789417,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5806451612903226,
+      "eval_PRM Precision": 0.9333333333333333,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.25553369522094727,
+      "eval_runtime": 14.6501,
+      "eval_samples_per_second": 3.003,
+      "eval_steps_per_second": 0.137,
+      "step": 1245
+    },
+    {
+      "epoch": 0.3226829820983458,
+      "grad_norm": 3.5643964755719777,
+      "learning_rate": 1.0707221038171056e-06,
+      "loss": 0.362,
+      "step": 1246
+    },
+    {
+      "epoch": 0.32294195720436375,
+      "grad_norm": 4.684952259372974,
+      "learning_rate": 1.0703257149174238e-06,
+      "loss": 0.2909,
+      "step": 1247
+    },
+    {
+      "epoch": 0.32320093231038166,
+      "grad_norm": 5.515834741111073,
+      "learning_rate": 1.0699289618362579e-06,
+      "loss": 0.3027,
+      "step": 1248
+    },
+    {
+      "epoch": 0.3234599074163996,
+      "grad_norm": 3.841355440414757,
+      "learning_rate": 1.0695318448980677e-06,
+      "loss": 0.3314,
+      "step": 1249
+    },
+    {
+      "epoch": 0.32371888252241754,
+      "grad_norm": 3.259683425761671,
+      "learning_rate": 1.0691343644276095e-06,
+      "loss": 0.3673,
+      "step": 1250
+    },
+    {
+      "epoch": 0.32371888252241754,
+      "eval_PRM Accuracy": 0.8207547169811321,
+      "eval_PRM F1": 0.8789808917197452,
+      "eval_PRM F1 AUC": 0.8069669984284967,
+      "eval_PRM F1 AUC (fixed)": 0.7815610267155578,
+      "eval_PRM F1 Neg": 0.6545454545454545,
+      "eval_PRM NPV": 0.5625,
+      "eval_PRM Precision": 0.9324324324324325,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2531985342502594,
+      "eval_runtime": 14.525,
+      "eval_samples_per_second": 3.029,
+      "eval_steps_per_second": 0.138,
+      "step": 1250
+    },
+    {
+      "epoch": 0.32397785762843545,
+      "grad_norm": 3.9427534379874714,
+      "learning_rate": 1.0687365207499381e-06,
+      "loss": 0.3362,
+      "step": 1251
+    },
+    {
+      "epoch": 0.3242368327344534,
+      "grad_norm": 4.561687981910411,
+      "learning_rate": 1.0683383141904046e-06,
+      "loss": 0.2931,
+      "step": 1252
+    },
+    {
+      "epoch": 0.32449580784047133,
+      "grad_norm": 4.234865118537673,
+      "learning_rate": 1.0679397450746573e-06,
+      "loss": 0.3682,
+      "step": 1253
+    },
+    {
+      "epoch": 0.3247547829464893,
+      "grad_norm": 5.463852961847639,
+      "learning_rate": 1.0675408137286403e-06,
+      "loss": 0.3418,
+      "step": 1254
+    },
+    {
+      "epoch": 0.3250137580525072,
+      "grad_norm": 3.8455546613574847,
+      "learning_rate": 1.0671415204785948e-06,
+      "loss": 0.3141,
+      "step": 1255
+    },
+    {
+      "epoch": 0.3250137580525072,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.9,
+      "eval_PRM F1 AUC": 0.8250392875851232,
+      "eval_PRM F1 AUC (fixed)": 0.7820848611838659,
+      "eval_PRM F1 Neg": 0.6923076923076923,
+      "eval_PRM NPV": 0.6206896551724138,
+      "eval_PRM Precision": 0.935064935064935,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2530316114425659,
+      "eval_runtime": 14.6154,
+      "eval_samples_per_second": 3.011,
+      "eval_steps_per_second": 0.137,
+      "step": 1255
+    },
+    {
+      "epoch": 0.3252727331585251,
+      "grad_norm": 3.095249401099387,
+      "learning_rate": 1.066741865651057e-06,
+      "loss": 0.3307,
+      "step": 1256
+    },
+    {
+      "epoch": 0.3255317082645431,
+      "grad_norm": 4.028023928603981,
+      "learning_rate": 1.06634184957286e-06,
+      "loss": 0.4218,
+      "step": 1257
+    },
+    {
+      "epoch": 0.325790683370561,
+      "grad_norm": 3.2652804916367,
+      "learning_rate": 1.0659414725711314e-06,
+      "loss": 0.3492,
+      "step": 1258
+    },
+    {
+      "epoch": 0.32604965847657896,
+      "grad_norm": 6.934006280547388,
+      "learning_rate": 1.0655407349732942e-06,
+      "loss": 0.3953,
+      "step": 1259
+    },
+    {
+      "epoch": 0.3263086335825969,
+      "grad_norm": 5.3012226263917,
+      "learning_rate": 1.065139637107066e-06,
+      "loss": 0.3463,
+      "step": 1260
+    },
+    {
+      "epoch": 0.3263086335825969,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8930817610062893,
+      "eval_PRM F1 AUC": 0.819015191199581,
+      "eval_PRM F1 AUC (fixed)": 0.782870612886328,
+      "eval_PRM F1 Neg": 0.6792452830188679,
+      "eval_PRM NPV": 0.6,
+      "eval_PRM Precision": 0.9342105263157895,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.25366419553756714,
+      "eval_runtime": 14.8022,
+      "eval_samples_per_second": 2.973,
+      "eval_steps_per_second": 0.135,
+      "step": 1260
+    },
+    {
+      "epoch": 0.3265676086886148,
+      "grad_norm": 5.814350884881637,
+      "learning_rate": 1.06473817930046e-06,
+      "loss": 0.2951,
+      "step": 1261
+    },
+    {
+      "epoch": 0.32682658379463275,
+      "grad_norm": 5.444085139661884,
+      "learning_rate": 1.0643363618817825e-06,
+      "loss": 0.4134,
+      "step": 1262
+    },
+    {
+      "epoch": 0.32708555890065066,
+      "grad_norm": 9.9526531408028,
+      "learning_rate": 1.0639341851796348e-06,
+      "loss": 0.5132,
+      "step": 1263
+    },
+    {
+      "epoch": 0.32734453400666863,
+      "grad_norm": 4.3954758322259835,
+      "learning_rate": 1.0635316495229113e-06,
+      "loss": 0.2878,
+      "step": 1264
+    },
+    {
+      "epoch": 0.32760350911268654,
+      "grad_norm": 4.885386307335036,
+      "learning_rate": 1.063128755240801e-06,
+      "loss": 0.3412,
+      "step": 1265
+    },
+    {
+      "epoch": 0.32760350911268654,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8831168831168831,
+      "eval_PRM F1 AUC": 0.8444211629125196,
+      "eval_PRM F1 AUC (fixed)": 0.7799895233106339,
+      "eval_PRM F1 Neg": 0.6896551724137931,
+      "eval_PRM NPV": 0.5714285714285714,
+      "eval_PRM Precision": 0.9577464788732394,
+      "eval_PRM Recall": 0.8192771084337349,
+      "eval_PRM Specificty": 0.8695652173913043,
+      "eval_loss": 0.2644989490509033,
+      "eval_runtime": 14.5446,
+      "eval_samples_per_second": 3.025,
+      "eval_steps_per_second": 0.138,
+      "step": 1265
+    },
+    {
+      "epoch": 0.32786248421870445,
+      "grad_norm": 2.883792563856442,
+      "learning_rate": 1.062725502662785e-06,
+      "loss": 0.3397,
+      "step": 1266
+    },
+    {
+      "epoch": 0.3281214593247224,
+      "grad_norm": 2.666039333847741,
+      "learning_rate": 1.062321892118638e-06,
+      "loss": 0.2813,
+      "step": 1267
+    },
+    {
+      "epoch": 0.32838043443074033,
+      "grad_norm": 3.2249721487819643,
+      "learning_rate": 1.0619179239384274e-06,
+      "loss": 0.2993,
+      "step": 1268
+    },
+    {
+      "epoch": 0.3286394095367583,
+      "grad_norm": 4.124141804714215,
+      "learning_rate": 1.0615135984525133e-06,
+      "loss": 0.3636,
+      "step": 1269
+    },
+    {
+      "epoch": 0.3288983846427762,
+      "grad_norm": 4.252191767294118,
+      "learning_rate": 1.0611089159915473e-06,
+      "loss": 0.2837,
+      "step": 1270
+    },
+    {
+      "epoch": 0.3288983846427762,
+      "eval_PRM Accuracy": 0.8207547169811321,
+      "eval_PRM F1": 0.8789808917197452,
+      "eval_PRM F1 AUC": 0.8069669984284967,
+      "eval_PRM F1 AUC (fixed)": 0.7852278679937139,
+      "eval_PRM F1 Neg": 0.6545454545454545,
+      "eval_PRM NPV": 0.5625,
+      "eval_PRM Precision": 0.9324324324324325,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2600552439689636,
+      "eval_runtime": 14.5574,
+      "eval_samples_per_second": 3.023,
+      "eval_steps_per_second": 0.137,
+      "step": 1270
+    },
+    {
+      "epoch": 0.3291573597487941,
+      "grad_norm": 3.4884179116143366,
+      "learning_rate": 1.0607038768864737e-06,
+      "loss": 0.2719,
+      "step": 1271
+    },
+    {
+      "epoch": 0.3294163348548121,
+      "grad_norm": 7.575658883276662,
+      "learning_rate": 1.060298481468528e-06,
+      "loss": 0.4286,
+      "step": 1272
+    },
+    {
+      "epoch": 0.32967530996083,
+      "grad_norm": 2.7108707510626338,
+      "learning_rate": 1.0598927300692372e-06,
+      "loss": 0.2576,
+      "step": 1273
+    },
+    {
+      "epoch": 0.32993428506684797,
+      "grad_norm": 4.385897164351068,
+      "learning_rate": 1.0594866230204195e-06,
+      "loss": 0.2862,
+      "step": 1274
+    },
+    {
+      "epoch": 0.3301932601728659,
+      "grad_norm": 3.3979497479914396,
+      "learning_rate": 1.0590801606541839e-06,
+      "loss": 0.4011,
+      "step": 1275
+    },
+    {
+      "epoch": 0.3301932601728659,
+      "eval_PRM Accuracy": 0.8679245283018868,
+      "eval_PRM F1": 0.9135802469135802,
+      "eval_PRM F1 AUC": 0.8370874803562075,
+      "eval_PRM F1 AUC (fixed)": 0.7878470403352541,
+      "eval_PRM F1 Neg": 0.72,
+      "eval_PRM NPV": 0.6666666666666666,
+      "eval_PRM Precision": 0.9367088607594937,
+      "eval_PRM Recall": 0.891566265060241,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.25437629222869873,
+      "eval_runtime": 14.7355,
+      "eval_samples_per_second": 2.986,
+      "eval_steps_per_second": 0.136,
+      "step": 1275
+    },
+    {
+      "epoch": 0.33045223527888384,
+      "grad_norm": 3.0241464378789225,
+      "learning_rate": 1.0586733433029298e-06,
+      "loss": 0.3214,
+      "step": 1276
+    },
+    {
+      "epoch": 0.33071121038490175,
+      "grad_norm": 4.362546620704584,
+      "learning_rate": 1.058266171299347e-06,
+      "loss": 0.3757,
+      "step": 1277
+    },
+    {
+      "epoch": 0.33097018549091967,
+      "grad_norm": 3.935891246180922,
+      "learning_rate": 1.0578586449764157e-06,
+      "loss": 0.3495,
+      "step": 1278
+    },
+    {
+      "epoch": 0.33122916059693763,
+      "grad_norm": 3.5114047359210065,
+      "learning_rate": 1.0574507646674054e-06,
+      "loss": 0.3644,
+      "step": 1279
+    },
+    {
+      "epoch": 0.33148813570295554,
+      "grad_norm": 6.0952351579317625,
+      "learning_rate": 1.0570425307058752e-06,
+      "loss": 0.4252,
+      "step": 1280
+    },
+    {
+      "epoch": 0.33148813570295554,
+      "eval_PRM Accuracy": 0.8867924528301887,
+      "eval_PRM F1": 0.926829268292683,
+      "eval_PRM F1 AUC": 0.8491356731272918,
+      "eval_PRM F1 AUC (fixed)": 0.7930853850183343,
+      "eval_PRM F1 Neg": 0.75,
+      "eval_PRM NPV": 0.72,
+      "eval_PRM Precision": 0.9382716049382716,
+      "eval_PRM Recall": 0.9156626506024096,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2512930631637573,
+      "eval_runtime": 14.9129,
+      "eval_samples_per_second": 2.95,
+      "eval_steps_per_second": 0.134,
+      "step": 1280
+    },
+    {
+      "epoch": 0.3317471108089735,
+      "grad_norm": 10.255531897227266,
+      "learning_rate": 1.0566339434256734e-06,
+      "loss": 0.3373,
+      "step": 1281
+    },
+    {
+      "epoch": 0.3320060859149914,
+      "grad_norm": 2.6011141556068256,
+      "learning_rate": 1.0562250031609372e-06,
+      "loss": 0.201,
+      "step": 1282
+    },
+    {
+      "epoch": 0.33226506102100933,
+      "grad_norm": 5.756435201271477,
+      "learning_rate": 1.0558157102460929e-06,
+      "loss": 0.3607,
+      "step": 1283
+    },
+    {
+      "epoch": 0.3325240361270273,
+      "grad_norm": 3.256313178124926,
+      "learning_rate": 1.0554060650158543e-06,
+      "loss": 0.293,
+      "step": 1284
+    },
+    {
+      "epoch": 0.3327830112330452,
+      "grad_norm": 4.038686227297466,
+      "learning_rate": 1.0549960678052243e-06,
+      "loss": 0.3206,
+      "step": 1285
+    },
+    {
+      "epoch": 0.3327830112330452,
+      "eval_PRM Accuracy": 0.839622641509434,
+      "eval_PRM F1": 0.8930817610062893,
+      "eval_PRM F1 AUC": 0.819015191199581,
+      "eval_PRM F1 AUC (fixed)": 0.7886327920377161,
+      "eval_PRM F1 Neg": 0.6792452830188679,
+      "eval_PRM NPV": 0.6,
+      "eval_PRM Precision": 0.9342105263157895,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.251687616109848,
+      "eval_runtime": 14.924,
+      "eval_samples_per_second": 2.948,
+      "eval_steps_per_second": 0.134,
+      "step": 1285
+    },
+    {
+      "epoch": 0.3330419863390632,
+      "grad_norm": 5.903103517069564,
+      "learning_rate": 1.054585718949493e-06,
+      "loss": 0.4008,
+      "step": 1286
+    },
+    {
+      "epoch": 0.3333009614450811,
+      "grad_norm": 3.6280182528048797,
+      "learning_rate": 1.0541750187842384e-06,
+      "loss": 0.4035,
+      "step": 1287
+    },
+    {
+      "epoch": 0.333559936551099,
+      "grad_norm": 7.746890673662093,
+      "learning_rate": 1.0537639676453254e-06,
+      "loss": 0.2507,
+      "step": 1288
+    },
+    {
+      "epoch": 0.33381891165711697,
+      "grad_norm": 4.728549191922307,
+      "learning_rate": 1.0533525658689064e-06,
+      "loss": 0.3587,
+      "step": 1289
+    },
+    {
+      "epoch": 0.3340778867631349,
+      "grad_norm": 8.67075750836026,
+      "learning_rate": 1.0529408137914204e-06,
+      "loss": 0.2709,
+      "step": 1290
+    },
+    {
+      "epoch": 0.3340778867631349,
+      "eval_PRM Accuracy": 0.8113207547169812,
+      "eval_PRM F1": 0.8717948717948718,
+      "eval_PRM F1 AUC": 0.8009429020429545,
+      "eval_PRM F1 AUC (fixed)": 0.7936092194866423,
+      "eval_PRM F1 Neg": 0.6428571428571429,
+      "eval_PRM NPV": 0.5454545454545454,
+      "eval_PRM Precision": 0.9315068493150684,
+      "eval_PRM Recall": 0.8192771084337349,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2578117549419403,
+      "eval_runtime": 14.7797,
+      "eval_samples_per_second": 2.977,
+      "eval_steps_per_second": 0.135,
+      "step": 1290
+    },
+    {
+      "epoch": 0.33433686186915285,
+      "grad_norm": 4.534289687153858,
+      "learning_rate": 1.0525287117495928e-06,
+      "loss": 0.3352,
+      "step": 1291
+    },
+    {
+      "epoch": 0.33459583697517076,
+      "grad_norm": 2.4350765866908084,
+      "learning_rate": 1.0521162600804348e-06,
+      "loss": 0.2627,
+      "step": 1292
+    },
+    {
+      "epoch": 0.33485481208118867,
+      "grad_norm": 2.993341013394517,
+      "learning_rate": 1.0517034591212447e-06,
+      "loss": 0.3248,
+      "step": 1293
+    },
+    {
+      "epoch": 0.33511378718720664,
+      "grad_norm": 6.045274041684217,
+      "learning_rate": 1.0512903092096048e-06,
+      "loss": 0.4829,
+      "step": 1294
+    },
+    {
+      "epoch": 0.33537276229322455,
+      "grad_norm": 4.920969311687047,
+      "learning_rate": 1.0508768106833844e-06,
+      "loss": 0.4081,
+      "step": 1295
+    },
+    {
+      "epoch": 0.33537276229322455,
+      "eval_PRM Accuracy": 0.8207547169811321,
+      "eval_PRM F1": 0.8789808917197452,
+      "eval_PRM F1 AUC": 0.8069669984284967,
+      "eval_PRM F1 AUC (fixed)": 0.8067050811943426,
+      "eval_PRM F1 Neg": 0.6545454545454545,
+      "eval_PRM NPV": 0.5625,
+      "eval_PRM Precision": 0.9324324324324325,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.24843551218509674,
+      "eval_runtime": 14.645,
+      "eval_samples_per_second": 3.004,
+      "eval_steps_per_second": 0.137,
+      "step": 1295
+    },
+    {
+      "epoch": 0.3356317373992425,
+      "grad_norm": 3.8198314302235783,
+      "learning_rate": 1.0504629638807365e-06,
+      "loss": 0.3589,
+      "step": 1296
+    },
+    {
+      "epoch": 0.3358907125052604,
+      "grad_norm": 3.2373637606236456,
+      "learning_rate": 1.0500487691400998e-06,
+      "loss": 0.3175,
+      "step": 1297
+    },
+    {
+      "epoch": 0.3361496876112784,
+      "grad_norm": 4.29295357505977,
+      "learning_rate": 1.0496342268001975e-06,
+      "loss": 0.3697,
+      "step": 1298
+    },
+    {
+      "epoch": 0.3364086627172963,
+      "grad_norm": 5.516686019813932,
+      "learning_rate": 1.0492193372000364e-06,
+      "loss": 0.324,
+      "step": 1299
+    },
+    {
+      "epoch": 0.3366676378233142,
+      "grad_norm": 3.812344311395989,
+      "learning_rate": 1.0488041006789084e-06,
+      "loss": 0.4356,
+      "step": 1300
+    },
+    {
+      "epoch": 0.3366676378233142,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8860759493670886,
+      "eval_PRM F1 AUC": 0.8129910948140389,
+      "eval_PRM F1 AUC (fixed)": 0.8040859088528025,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5806451612903226,
+      "eval_PRM Precision": 0.9333333333333333,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.24917888641357422,
+      "eval_runtime": 14.8531,
+      "eval_samples_per_second": 2.962,
+      "eval_steps_per_second": 0.135,
+      "step": 1300
+    },
+    {
+      "epoch": 0.3369266129293322,
+      "grad_norm": 3.196056765448634,
+      "learning_rate": 1.0483885175763879e-06,
+      "loss": 0.3073,
+      "step": 1301
+    },
+    {
+      "epoch": 0.3371855880353501,
+      "grad_norm": 4.95895879113035,
+      "learning_rate": 1.047972588232333e-06,
+      "loss": 0.4303,
+      "step": 1302
+    },
+    {
+      "epoch": 0.33744456314136806,
+      "grad_norm": 2.4644183637611103,
+      "learning_rate": 1.047556312986886e-06,
+      "loss": 0.2904,
+      "step": 1303
+    },
+    {
+      "epoch": 0.33770353824738597,
+      "grad_norm": 5.294206024896391,
+      "learning_rate": 1.0471396921804708e-06,
+      "loss": 0.3325,
+      "step": 1304
+    },
+    {
+      "epoch": 0.3379625133534039,
+      "grad_norm": 3.3704941228453094,
+      "learning_rate": 1.0467227261537944e-06,
+      "loss": 0.2584,
+      "step": 1305
+    },
+    {
+      "epoch": 0.3379625133534039,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.906832298136646,
+      "eval_PRM F1 AUC": 0.8310633839706653,
+      "eval_PRM F1 AUC (fixed)": 0.7954426401257203,
+      "eval_PRM F1 Neg": 0.7058823529411765,
+      "eval_PRM NPV": 0.6428571428571429,
+      "eval_PRM Precision": 0.9358974358974359,
+      "eval_PRM Recall": 0.8795180722891566,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.25340020656585693,
+      "eval_runtime": 14.6219,
+      "eval_samples_per_second": 3.009,
+      "eval_steps_per_second": 0.137,
+      "step": 1305
+    },
+    {
+      "epoch": 0.33822148845942185,
+      "grad_norm": 4.249922053779406,
+      "learning_rate": 1.0463054152478464e-06,
+      "loss": 0.3716,
+      "step": 1306
+    },
+    {
+      "epoch": 0.33848046356543976,
+      "grad_norm": 4.501080318218483,
+      "learning_rate": 1.0458877598038978e-06,
+      "loss": 0.2519,
+      "step": 1307
+    },
+    {
+      "epoch": 0.3387394386714577,
+      "grad_norm": 2.8975562640932733,
+      "learning_rate": 1.045469760163502e-06,
+      "loss": 0.3074,
+      "step": 1308
+    },
+    {
+      "epoch": 0.33899841377747564,
+      "grad_norm": 8.021087356933908,
+      "learning_rate": 1.0450514166684933e-06,
+      "loss": 0.3931,
+      "step": 1309
+    },
+    {
+      "epoch": 0.33925738888349355,
+      "grad_norm": 7.004507103777712,
+      "learning_rate": 1.0446327296609876e-06,
+      "loss": 0.4529,
+      "step": 1310
+    },
+    {
+      "epoch": 0.33925738888349355,
+      "eval_PRM Accuracy": 0.8113207547169812,
+      "eval_PRM F1": 0.8717948717948718,
+      "eval_PRM F1 AUC": 0.8009429020429545,
+      "eval_PRM F1 AUC (fixed)": 0.7833944473546359,
+      "eval_PRM F1 Neg": 0.6428571428571429,
+      "eval_PRM NPV": 0.5454545454545454,
+      "eval_PRM Precision": 0.9315068493150684,
+      "eval_PRM Recall": 0.8192771084337349,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2645565867424011,
+      "eval_runtime": 15.0492,
+      "eval_samples_per_second": 2.924,
+      "eval_steps_per_second": 0.133,
+      "step": 1310
+    },
+    {
+      "epoch": 0.3395163639895115,
+      "grad_norm": 5.034753487824166,
+      "learning_rate": 1.0442136994833815e-06,
+      "loss": 0.3002,
+      "step": 1311
+    },
+    {
+      "epoch": 0.3397753390955294,
+      "grad_norm": 4.159325525124912,
+      "learning_rate": 1.0437943264783528e-06,
+      "loss": 0.4791,
+      "step": 1312
+    },
+    {
+      "epoch": 0.3400343142015474,
+      "grad_norm": 4.685979244764695,
+      "learning_rate": 1.0433746109888585e-06,
+      "loss": 0.3015,
+      "step": 1313
+    },
+    {
+      "epoch": 0.3402932893075653,
+      "grad_norm": 3.849565505765079,
+      "learning_rate": 1.042954553358137e-06,
+      "loss": 0.333,
+      "step": 1314
+    },
+    {
+      "epoch": 0.3405522644135832,
+      "grad_norm": 3.645168751223873,
+      "learning_rate": 1.0425341539297054e-06,
+      "loss": 0.3582,
+      "step": 1315
+    },
+    {
+      "epoch": 0.3405522644135832,
+      "eval_PRM Accuracy": 0.8018867924528302,
+      "eval_PRM F1": 0.864516129032258,
+      "eval_PRM F1 AUC": 0.7949188056574124,
+      "eval_PRM F1 AUC (fixed)": 0.7778941854374017,
+      "eval_PRM F1 Neg": 0.631578947368421,
+      "eval_PRM NPV": 0.5294117647058824,
+      "eval_PRM Precision": 0.9305555555555556,
+      "eval_PRM Recall": 0.8072289156626506,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.27547842264175415,
+      "eval_runtime": 14.6792,
+      "eval_samples_per_second": 2.997,
+      "eval_steps_per_second": 0.136,
+      "step": 1315
+    },
+    {
+      "epoch": 0.3408112395196012,
+      "grad_norm": 2.9138626397617093,
+      "learning_rate": 1.0421134130473612e-06,
+      "loss": 0.3854,
+      "step": 1316
+    },
+    {
+      "epoch": 0.3410702146256191,
+      "grad_norm": 2.857443915356315,
+      "learning_rate": 1.0416923310551805e-06,
+      "loss": 0.3204,
+      "step": 1317
+    },
+    {
+      "epoch": 0.34132918973163706,
+      "grad_norm": 6.003891257495076,
+      "learning_rate": 1.0412709082975184e-06,
+      "loss": 0.2993,
+      "step": 1318
+    },
+    {
+      "epoch": 0.341588164837655,
+      "grad_norm": 4.153935299144768,
+      "learning_rate": 1.0408491451190093e-06,
+      "loss": 0.389,
+      "step": 1319
+    },
+    {
+      "epoch": 0.34184713994367294,
+      "grad_norm": 4.6586000639572305,
+      "learning_rate": 1.0404270418645654e-06,
+      "loss": 0.3316,
+      "step": 1320
+    },
+    {
+      "epoch": 0.34184713994367294,
+      "eval_PRM Accuracy": 0.8207547169811321,
+      "eval_PRM F1": 0.8789808917197452,
+      "eval_PRM F1 AUC": 0.8069669984284967,
+      "eval_PRM F1 AUC (fixed)": 0.7768465165007857,
+      "eval_PRM F1 Neg": 0.6545454545454545,
+      "eval_PRM NPV": 0.5625,
+      "eval_PRM Precision": 0.9324324324324325,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.27451756596565247,
+      "eval_runtime": 15.085,
+      "eval_samples_per_second": 2.917,
+      "eval_steps_per_second": 0.133,
+      "step": 1320
+    },
+    {
+      "epoch": 0.34210611504969085,
+      "grad_norm": 4.479214897680437,
+      "learning_rate": 1.0400045988793768e-06,
+      "loss": 0.3974,
+      "step": 1321
+    },
+    {
+      "epoch": 0.34236509015570876,
+      "grad_norm": 3.175295099148635,
+      "learning_rate": 1.0395818165089125e-06,
+      "loss": 0.3704,
+      "step": 1322
+    },
+    {
+      "epoch": 0.34262406526172673,
+      "grad_norm": 4.047456516055003,
+      "learning_rate": 1.039158695098918e-06,
+      "loss": 0.3562,
+      "step": 1323
+    },
+    {
+      "epoch": 0.34288304036774464,
+      "grad_norm": 3.496307850241482,
+      "learning_rate": 1.0387352349954158e-06,
+      "loss": 0.3671,
+      "step": 1324
+    },
+    {
+      "epoch": 0.3431420154737626,
+      "grad_norm": 6.735416072169709,
+      "learning_rate": 1.038311436544707e-06,
+      "loss": 0.4127,
+      "step": 1325
+    },
+    {
+      "epoch": 0.3431420154737626,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8860759493670886,
+      "eval_PRM F1 AUC": 0.8129910948140389,
+      "eval_PRM F1 AUC (fixed)": 0.783918281822944,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5806451612903226,
+      "eval_PRM Precision": 0.9333333333333333,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2647566795349121,
+      "eval_runtime": 14.6853,
+      "eval_samples_per_second": 2.996,
+      "eval_steps_per_second": 0.136,
+      "step": 1325
+    },
+    {
+      "epoch": 0.3434009905797805,
+      "grad_norm": 3.7720284176982295,
+      "learning_rate": 1.0378873000933675e-06,
+      "loss": 0.2992,
+      "step": 1326
+    },
+    {
+      "epoch": 0.34365996568579843,
+      "grad_norm": 10.021450252138205,
+      "learning_rate": 1.037462825988251e-06,
+      "loss": 0.4193,
+      "step": 1327
+    },
+    {
+      "epoch": 0.3439189407918164,
+      "grad_norm": 3.72757558238376,
+      "learning_rate": 1.0370380145764868e-06,
+      "loss": 0.2907,
+      "step": 1328
+    },
+    {
+      "epoch": 0.3441779158978343,
+      "grad_norm": 5.12031159635696,
+      "learning_rate": 1.03661286620548e-06,
+      "loss": 0.4486,
+      "step": 1329
+    },
+    {
+      "epoch": 0.3444368910038523,
+      "grad_norm": 2.935652764654381,
+      "learning_rate": 1.0361873812229111e-06,
+      "loss": 0.226,
+      "step": 1330
+    },
+    {
+      "epoch": 0.3444368910038523,
+      "eval_PRM Accuracy": 0.8113207547169812,
+      "eval_PRM F1": 0.8717948717948718,
+      "eval_PRM F1 AUC": 0.8009429020429545,
+      "eval_PRM F1 AUC (fixed)": 0.7771084337349398,
+      "eval_PRM F1 Neg": 0.6428571428571429,
+      "eval_PRM NPV": 0.5454545454545454,
+      "eval_PRM Precision": 0.9315068493150684,
+      "eval_PRM Recall": 0.8192771084337349,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2631690204143524,
+      "eval_runtime": 14.4887,
+      "eval_samples_per_second": 3.037,
+      "eval_steps_per_second": 0.138,
+      "step": 1330
+    },
+    {
+      "epoch": 0.3446958661098702,
+      "grad_norm": 3.485190804963136,
+      "learning_rate": 1.0357615599767362e-06,
+      "loss": 0.3748,
+      "step": 1331
+    },
+    {
+      "epoch": 0.3449548412158881,
+      "grad_norm": 4.250749573394851,
+      "learning_rate": 1.0353354028151864e-06,
+      "loss": 0.3145,
+      "step": 1332
+    },
+    {
+      "epoch": 0.34521381632190606,
+      "grad_norm": 7.923349942246661,
+      "learning_rate": 1.0349089100867673e-06,
+      "loss": 0.2599,
+      "step": 1333
+    },
+    {
+      "epoch": 0.345472791427924,
+      "grad_norm": 6.3912608889410905,
+      "learning_rate": 1.034482082140259e-06,
+      "loss": 0.3285,
+      "step": 1334
+    },
+    {
+      "epoch": 0.34573176653394194,
+      "grad_norm": 4.472668850805793,
+      "learning_rate": 1.034054919324716e-06,
+      "loss": 0.3863,
+      "step": 1335
+    },
+    {
+      "epoch": 0.34573176653394194,
+      "eval_PRM Accuracy": 0.8113207547169812,
+      "eval_PRM F1": 0.8701298701298701,
+      "eval_PRM F1 AUC": 0.8166579360921948,
+      "eval_PRM F1 AUC (fixed)": 0.784442116291252,
+      "eval_PRM F1 Neg": 0.6551724137931034,
+      "eval_PRM NPV": 0.5428571428571428,
+      "eval_PRM Precision": 0.9436619718309859,
+      "eval_PRM Recall": 0.8072289156626506,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.25815823674201965,
+      "eval_runtime": 14.7537,
+      "eval_samples_per_second": 2.982,
+      "eval_steps_per_second": 0.136,
+      "step": 1335
+    },
+    {
+      "epoch": 0.34599074163995985,
+      "grad_norm": 4.239365211227992,
+      "learning_rate": 1.033627421989466e-06,
+      "loss": 0.3723,
+      "step": 1336
+    },
+    {
+      "epoch": 0.3462497167459778,
+      "grad_norm": 3.6891728911365607,
+      "learning_rate": 1.033199590484111e-06,
+      "loss": 0.3842,
+      "step": 1337
+    },
+    {
+      "epoch": 0.34650869185199573,
+      "grad_norm": 4.1821840352227255,
+      "learning_rate": 1.0327714251585257e-06,
+      "loss": 0.4589,
+      "step": 1338
+    },
+    {
+      "epoch": 0.34676766695801364,
+      "grad_norm": 3.2232499807001544,
+      "learning_rate": 1.0323429263628582e-06,
+      "loss": 0.299,
+      "step": 1339
+    },
+    {
+      "epoch": 0.3470266420640316,
+      "grad_norm": 5.441098902376691,
+      "learning_rate": 1.0319140944475291e-06,
+      "loss": 0.4802,
+      "step": 1340
+    },
+    {
+      "epoch": 0.3470266420640316,
+      "eval_PRM Accuracy": 0.8207547169811321,
+      "eval_PRM F1": 0.8774193548387097,
+      "eval_PRM F1 AUC": 0.8226820324777371,
+      "eval_PRM F1 AUC (fixed)": 0.786013619696176,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5588235294117647,
+      "eval_PRM Precision": 0.9444444444444444,
+      "eval_PRM Recall": 0.8192771084337349,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.2553994953632355,
+      "eval_runtime": 14.633,
+      "eval_samples_per_second": 3.007,
+      "eval_steps_per_second": 0.137,
+      "step": 1340
+    },
+    {
+      "epoch": 0.3472856171700495,
+      "grad_norm": 4.884035995601269,
+      "learning_rate": 1.0314849297632318e-06,
+      "loss": 0.3386,
+      "step": 1341
+    },
+    {
+      "epoch": 0.3475445922760675,
+      "grad_norm": 3.2695838689315853,
+      "learning_rate": 1.031055432660931e-06,
+      "loss": 0.3565,
+      "step": 1342
+    },
+    {
+      "epoch": 0.3478035673820854,
+      "grad_norm": 4.304615322479972,
+      "learning_rate": 1.0306256034918637e-06,
+      "loss": 0.3045,
+      "step": 1343
+    },
+    {
+      "epoch": 0.3480625424881033,
+      "grad_norm": 3.3317439490288208,
+      "learning_rate": 1.0301954426075391e-06,
+      "loss": 0.343,
+      "step": 1344
+    },
+    {
+      "epoch": 0.3483215175941213,
+      "grad_norm": 3.656639575005203,
+      "learning_rate": 1.0297649503597366e-06,
+      "loss": 0.3504,
+      "step": 1345
+    },
+    {
+      "epoch": 0.3483215175941213,
+      "eval_PRM Accuracy": 0.8207547169811321,
+      "eval_PRM F1": 0.8774193548387097,
+      "eval_PRM F1 AUC": 0.8226820324777371,
+      "eval_PRM F1 AUC (fixed)": 0.784704033525406,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5588235294117647,
+      "eval_PRM Precision": 0.9444444444444444,
+      "eval_PRM Recall": 0.8192771084337349,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.25615188479423523,
+      "eval_runtime": 14.6776,
+      "eval_samples_per_second": 2.998,
+      "eval_steps_per_second": 0.136,
+      "step": 1345
+    },
+    {
+      "epoch": 0.3485804927001392,
+      "grad_norm": 3.766623424533264,
+      "learning_rate": 1.0293341271005073e-06,
+      "loss": 0.284,
+      "step": 1346
+    },
+    {
+      "epoch": 0.34883946780615716,
+      "grad_norm": 4.488867287571511,
+      "learning_rate": 1.0289029731821725e-06,
+      "loss": 0.3686,
+      "step": 1347
+    },
+    {
+      "epoch": 0.34909844291217507,
+      "grad_norm": 3.1747978172581894,
+      "learning_rate": 1.0284714889573248e-06,
+      "loss": 0.3598,
+      "step": 1348
+    },
+    {
+      "epoch": 0.349357418018193,
+      "grad_norm": 3.3137262712445894,
+      "learning_rate": 1.0280396747788255e-06,
+      "loss": 0.3896,
+      "step": 1349
+    },
+    {
+      "epoch": 0.34961639312421094,
+      "grad_norm": 4.6326692615664316,
+      "learning_rate": 1.027607530999807e-06,
+      "loss": 0.3655,
+      "step": 1350
+    },
+    {
+      "epoch": 0.34961639312421094,
+      "eval_PRM Accuracy": 0.8207547169811321,
+      "eval_PRM F1": 0.8789808917197452,
+      "eval_PRM F1 AUC": 0.8069669984284967,
+      "eval_PRM F1 AUC (fixed)": 0.7915138816134102,
+      "eval_PRM F1 Neg": 0.6545454545454545,
+      "eval_PRM NPV": 0.5625,
+      "eval_PRM Precision": 0.9324324324324325,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2515624165534973,
+      "eval_runtime": 14.6399,
+      "eval_samples_per_second": 3.005,
+      "eval_steps_per_second": 0.137,
+      "step": 1350
+    },
+    {
+      "epoch": 0.34987536823022886,
+      "grad_norm": 5.029034145916732,
+      "learning_rate": 1.0271750579736707e-06,
+      "loss": 0.2834,
+      "step": 1351
+    },
+    {
+      "epoch": 0.3501343433362468,
+      "grad_norm": 3.2262110030593965,
+      "learning_rate": 1.026742256054087e-06,
+      "loss": 0.3099,
+      "step": 1352
+    },
+    {
+      "epoch": 0.35039331844226473,
+      "grad_norm": 4.277241669093875,
+      "learning_rate": 1.0263091255949962e-06,
+      "loss": 0.3033,
+      "step": 1353
+    },
+    {
+      "epoch": 0.35065229354828265,
+      "grad_norm": 4.219679308248584,
+      "learning_rate": 1.0258756669506065e-06,
+      "loss": 0.3592,
+      "step": 1354
+    },
+    {
+      "epoch": 0.3509112686543006,
+      "grad_norm": 3.873414393356266,
+      "learning_rate": 1.0254418804753941e-06,
+      "loss": 0.3591,
+      "step": 1355
+    },
+    {
+      "epoch": 0.3509112686543006,
+      "eval_PRM Accuracy": 0.8113207547169812,
+      "eval_PRM F1": 0.8717948717948718,
+      "eval_PRM F1 AUC": 0.8009429020429545,
+      "eval_PRM F1 AUC (fixed)": 0.7941330539549503,
+      "eval_PRM F1 Neg": 0.6428571428571429,
+      "eval_PRM NPV": 0.5454545454545454,
+      "eval_PRM Precision": 0.9315068493150684,
+      "eval_PRM Recall": 0.8192771084337349,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.25376003980636597,
+      "eval_runtime": 14.6093,
+      "eval_samples_per_second": 3.012,
+      "eval_steps_per_second": 0.137,
+      "step": 1355
+    },
+    {
+      "epoch": 0.3511702437603185,
+      "grad_norm": 3.596581202851472,
+      "learning_rate": 1.0250077665241045e-06,
+      "loss": 0.3553,
+      "step": 1356
+    },
+    {
+      "epoch": 0.3514292188663365,
+      "grad_norm": 3.0834953882859586,
+      "learning_rate": 1.02457332545175e-06,
+      "loss": 0.2994,
+      "step": 1357
+    },
+    {
+      "epoch": 0.3516881939723544,
+      "grad_norm": 3.5752729654852904,
+      "learning_rate": 1.0241385576136109e-06,
+      "loss": 0.3762,
+      "step": 1358
+    },
+    {
+      "epoch": 0.35194716907837237,
+      "grad_norm": 6.601488366950558,
+      "learning_rate": 1.0237034633652345e-06,
+      "loss": 0.3852,
+      "step": 1359
+    },
+    {
+      "epoch": 0.3522061441843903,
+      "grad_norm": 3.8142506524141284,
+      "learning_rate": 1.0232680430624352e-06,
+      "loss": 0.3078,
+      "step": 1360
+    },
+    {
+      "epoch": 0.3522061441843903,
+      "eval_PRM Accuracy": 0.8207547169811321,
+      "eval_PRM F1": 0.8789808917197452,
+      "eval_PRM F1 AUC": 0.8069669984284967,
+      "eval_PRM F1 AUC (fixed)": 0.7977998952331063,
+      "eval_PRM F1 Neg": 0.6545454545454545,
+      "eval_PRM NPV": 0.5625,
+      "eval_PRM Precision": 0.9324324324324325,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.24866238236427307,
+      "eval_runtime": 14.679,
+      "eval_samples_per_second": 2.997,
+      "eval_steps_per_second": 0.136,
+      "step": 1360
+    },
+    {
+      "epoch": 0.3524651192904082,
+      "grad_norm": 7.2589367790025685,
+      "learning_rate": 1.022832297061294e-06,
+      "loss": 0.3643,
+      "step": 1361
+    },
+    {
+      "epoch": 0.35272409439642616,
+      "grad_norm": 6.2858784402296495,
+      "learning_rate": 1.022396225718158e-06,
+      "loss": 0.4068,
+      "step": 1362
+    },
+    {
+      "epoch": 0.35298306950244407,
+      "grad_norm": 7.788782355650248,
+      "learning_rate": 1.021959829389641e-06,
+      "loss": 0.3245,
+      "step": 1363
+    },
+    {
+      "epoch": 0.35324204460846204,
+      "grad_norm": 3.599017538260975,
+      "learning_rate": 1.021523108432622e-06,
+      "loss": 0.3178,
+      "step": 1364
+    },
+    {
+      "epoch": 0.35350101971447995,
+      "grad_norm": 6.426781605853537,
+      "learning_rate": 1.0210860632042453e-06,
+      "loss": 0.4676,
+      "step": 1365
+    },
+    {
+      "epoch": 0.35350101971447995,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8860759493670886,
+      "eval_PRM F1 AUC": 0.8129910948140389,
+      "eval_PRM F1 AUC (fixed)": 0.8038239916186485,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5806451612903226,
+      "eval_PRM Precision": 0.9333333333333333,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.24092192947864532,
+      "eval_runtime": 14.7974,
+      "eval_samples_per_second": 2.974,
+      "eval_steps_per_second": 0.135,
+      "step": 1365
+    },
+    {
+      "epoch": 0.35375999482049786,
+      "grad_norm": 4.851902543247538,
+      "learning_rate": 1.0206486940619207e-06,
+      "loss": 0.3503,
+      "step": 1366
+    },
+    {
+      "epoch": 0.3540189699265158,
+      "grad_norm": 3.260733464307621,
+      "learning_rate": 1.0202110013633235e-06,
+      "loss": 0.2659,
+      "step": 1367
+    },
+    {
+      "epoch": 0.35427794503253374,
+      "grad_norm": 4.77562481552069,
+      "learning_rate": 1.0197729854663925e-06,
+      "loss": 0.3689,
+      "step": 1368
+    },
+    {
+      "epoch": 0.3545369201385517,
+      "grad_norm": 6.9020702863177705,
+      "learning_rate": 1.0193346467293314e-06,
+      "loss": 0.3497,
+      "step": 1369
+    },
+    {
+      "epoch": 0.3547958952445696,
+      "grad_norm": 2.8641402943880014,
+      "learning_rate": 1.0188959855106082e-06,
+      "loss": 0.2729,
+      "step": 1370
+    },
+    {
+      "epoch": 0.3547958952445696,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8846153846153846,
+      "eval_PRM F1 AUC": 0.8287061288632793,
+      "eval_PRM F1 AUC (fixed)": 0.7909900471451021,
+      "eval_PRM F1 Neg": 0.6785714285714286,
+      "eval_PRM NPV": 0.5757575757575758,
+      "eval_PRM Precision": 0.9452054794520548,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.2476367950439453,
+      "eval_runtime": 14.9235,
+      "eval_samples_per_second": 2.948,
+      "eval_steps_per_second": 0.134,
+      "step": 1370
+    },
+    {
+      "epoch": 0.3550548703505875,
+      "grad_norm": 4.912052749316654,
+      "learning_rate": 1.0184570021689536e-06,
+      "loss": 0.3502,
+      "step": 1371
+    },
+    {
+      "epoch": 0.3553138454566055,
+      "grad_norm": 5.308943310093734,
+      "learning_rate": 1.018017697063363e-06,
+      "loss": 0.3365,
+      "step": 1372
+    },
+    {
+      "epoch": 0.3555728205626234,
+      "grad_norm": 3.630549995233943,
+      "learning_rate": 1.0175780705530935e-06,
+      "loss": 0.4088,
+      "step": 1373
+    },
+    {
+      "epoch": 0.35583179566864137,
+      "grad_norm": 7.2185639503008545,
+      "learning_rate": 1.0171381229976667e-06,
+      "loss": 0.3197,
+      "step": 1374
+    },
+    {
+      "epoch": 0.3560907707746593,
+      "grad_norm": 8.163397684150947,
+      "learning_rate": 1.0166978547568656e-06,
+      "loss": 0.2647,
+      "step": 1375
+    },
+    {
+      "epoch": 0.3560907707746593,
+      "eval_PRM Accuracy": 0.8207547169811321,
+      "eval_PRM F1": 0.8789808917197452,
+      "eval_PRM F1 AUC": 0.8069669984284967,
+      "eval_PRM F1 AUC (fixed)": 0.788108957569408,
+      "eval_PRM F1 Neg": 0.6545454545454545,
+      "eval_PRM NPV": 0.5625,
+      "eval_PRM Precision": 0.9324324324324325,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.24819716811180115,
+      "eval_runtime": 14.7698,
+      "eval_samples_per_second": 2.979,
+      "eval_steps_per_second": 0.135,
+      "step": 1375
+    },
+    {
+      "epoch": 0.3563497458806772,
+      "grad_norm": 6.313737507680141,
+      "learning_rate": 1.0162572661907358e-06,
+      "loss": 0.3255,
+      "step": 1376
+    },
+    {
+      "epoch": 0.35660872098669516,
+      "grad_norm": 4.288938839171069,
+      "learning_rate": 1.0158163576595846e-06,
+      "loss": 0.3833,
+      "step": 1377
+    },
+    {
+      "epoch": 0.35686769609271307,
+      "grad_norm": 4.158728708310663,
+      "learning_rate": 1.0153751295239813e-06,
+      "loss": 0.464,
+      "step": 1378
+    },
+    {
+      "epoch": 0.35712667119873104,
+      "grad_norm": 6.984820199164077,
+      "learning_rate": 1.0149335821447565e-06,
+      "loss": 0.3083,
+      "step": 1379
+    },
+    {
+      "epoch": 0.35738564630474895,
+      "grad_norm": 7.100930397132101,
+      "learning_rate": 1.0144917158830015e-06,
+      "loss": 0.3468,
+      "step": 1380
+    },
+    {
+      "epoch": 0.35738564630474895,
+      "eval_PRM Accuracy": 0.8207547169811321,
+      "eval_PRM F1": 0.8789808917197452,
+      "eval_PRM F1 AUC": 0.8069669984284967,
+      "eval_PRM F1 AUC (fixed)": 0.7870612886327921,
+      "eval_PRM F1 Neg": 0.6545454545454545,
+      "eval_PRM NPV": 0.5625,
+      "eval_PRM Precision": 0.9324324324324325,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2420676201581955,
+      "eval_runtime": 14.5031,
+      "eval_samples_per_second": 3.034,
+      "eval_steps_per_second": 0.138,
+      "step": 1380
+    },
+    {
+      "epoch": 0.3576446214107669,
+      "grad_norm": 3.402060831951842,
+      "learning_rate": 1.014049531100069e-06,
+      "loss": 0.3431,
+      "step": 1381
+    },
+    {
+      "epoch": 0.3579035965167848,
+      "grad_norm": 4.1631232404476215,
+      "learning_rate": 1.0136070281575718e-06,
+      "loss": 0.4072,
+      "step": 1382
+    },
+    {
+      "epoch": 0.35816257162280274,
+      "grad_norm": 2.96097909341508,
+      "learning_rate": 1.013164207417383e-06,
+      "loss": 0.2762,
+      "step": 1383
+    },
+    {
+      "epoch": 0.3584215467288207,
+      "grad_norm": 3.589280367075051,
+      "learning_rate": 1.0127210692416356e-06,
+      "loss": 0.3656,
+      "step": 1384
+    },
+    {
+      "epoch": 0.3586805218348386,
+      "grad_norm": 10.198150056204957,
+      "learning_rate": 1.012277613992722e-06,
+      "loss": 0.3689,
+      "step": 1385
+    },
+    {
+      "epoch": 0.3586805218348386,
+      "eval_PRM Accuracy": 0.8867924528301887,
+      "eval_PRM F1": 0.927710843373494,
+      "eval_PRM F1 AUC": 0.8334206390780513,
+      "eval_PRM F1 AUC (fixed)": 0.7888947092718701,
+      "eval_PRM F1 Neg": 0.7391304347826086,
+      "eval_PRM NPV": 0.7391304347826086,
+      "eval_PRM Precision": 0.927710843373494,
+      "eval_PRM Recall": 0.927710843373494,
+      "eval_PRM Specificty": 0.7391304347826086,
+      "eval_loss": 0.2418714016675949,
+      "eval_runtime": 14.7389,
+      "eval_samples_per_second": 2.985,
+      "eval_steps_per_second": 0.136,
+      "step": 1385
+    },
+    {
+      "epoch": 0.3589394969408566,
+      "grad_norm": 9.174095092421487,
+      "learning_rate": 1.011833842033294e-06,
+      "loss": 0.385,
+      "step": 1386
+    },
+    {
+      "epoch": 0.3591984720468745,
+      "grad_norm": 5.068293049956948,
+      "learning_rate": 1.0113897537262627e-06,
+      "loss": 0.314,
+      "step": 1387
+    },
+    {
+      "epoch": 0.3594574471528924,
+      "grad_norm": 6.1186335582351745,
+      "learning_rate": 1.0109453494347973e-06,
+      "loss": 0.3665,
+      "step": 1388
+    },
+    {
+      "epoch": 0.3597164222589104,
+      "grad_norm": 3.0993215013454383,
+      "learning_rate": 1.010500629522326e-06,
+      "loss": 0.3367,
+      "step": 1389
+    },
+    {
+      "epoch": 0.3599753973649283,
+      "grad_norm": 7.933153861235534,
+      "learning_rate": 1.0100555943525348e-06,
+      "loss": 0.3925,
+      "step": 1390
+    },
+    {
+      "epoch": 0.3599753973649283,
+      "eval_PRM Accuracy": 0.8207547169811321,
+      "eval_PRM F1": 0.8789808917197452,
+      "eval_PRM F1 AUC": 0.8069669984284967,
+      "eval_PRM F1 AUC (fixed)": 0.7891566265060241,
+      "eval_PRM F1 Neg": 0.6545454545454545,
+      "eval_PRM NPV": 0.5625,
+      "eval_PRM Precision": 0.9324324324324325,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.24478855729103088,
+      "eval_runtime": 14.5608,
+      "eval_samples_per_second": 3.022,
+      "eval_steps_per_second": 0.137,
+      "step": 1390
+    },
+    {
+      "epoch": 0.36023437247094625,
+      "grad_norm": 3.69707566141284,
+      "learning_rate": 1.0096102442893676e-06,
+      "loss": 0.4158,
+      "step": 1391
+    },
+    {
+      "epoch": 0.36049334757696416,
+      "grad_norm": 5.0661368363238175,
+      "learning_rate": 1.0091645796970257e-06,
+      "loss": 0.3552,
+      "step": 1392
+    },
+    {
+      "epoch": 0.3607523226829821,
+      "grad_norm": 6.248551686579097,
+      "learning_rate": 1.008718600939968e-06,
+      "loss": 0.342,
+      "step": 1393
+    },
+    {
+      "epoch": 0.36101129778900004,
+      "grad_norm": 6.792166057295491,
+      "learning_rate": 1.0082723083829096e-06,
+      "loss": 0.323,
+      "step": 1394
+    },
+    {
+      "epoch": 0.36127027289501795,
+      "grad_norm": 3.779026986393951,
+      "learning_rate": 1.007825702390823e-06,
+      "loss": 0.3358,
+      "step": 1395
+    },
+    {
+      "epoch": 0.36127027289501795,
+      "eval_PRM Accuracy": 0.8207547169811321,
+      "eval_PRM F1": 0.8789808917197452,
+      "eval_PRM F1 AUC": 0.8069669984284967,
+      "eval_PRM F1 AUC (fixed)": 0.784180199057098,
+      "eval_PRM F1 Neg": 0.6545454545454545,
+      "eval_PRM NPV": 0.5625,
+      "eval_PRM Precision": 0.9324324324324325,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.25908514857292175,
+      "eval_runtime": 14.8271,
+      "eval_samples_per_second": 2.968,
+      "eval_steps_per_second": 0.135,
+      "step": 1395
+    },
+    {
+      "epoch": 0.3615292480010359,
+      "grad_norm": 7.177709456902315,
+      "learning_rate": 1.0073787833289364e-06,
+      "loss": 0.339,
+      "step": 1396
+    },
+    {
+      "epoch": 0.36178822310705383,
+      "grad_norm": 4.534515548735088,
+      "learning_rate": 1.0069315515627346e-06,
+      "loss": 0.3624,
+      "step": 1397
+    },
+    {
+      "epoch": 0.36204719821307174,
+      "grad_norm": 3.516634251586425,
+      "learning_rate": 1.0064840074579578e-06,
+      "loss": 0.3755,
+      "step": 1398
+    },
+    {
+      "epoch": 0.3623061733190897,
+      "grad_norm": 2.9834443537357753,
+      "learning_rate": 1.0060361513806013e-06,
+      "loss": 0.2756,
+      "step": 1399
+    },
+    {
+      "epoch": 0.3625651484251076,
+      "grad_norm": 6.302837815954074,
+      "learning_rate": 1.0055879836969164e-06,
+      "loss": 0.3814,
+      "step": 1400
+    },
+    {
+      "epoch": 0.3625651484251076,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8860759493670886,
+      "eval_PRM F1 AUC": 0.8129910948140389,
+      "eval_PRM F1 AUC (fixed)": 0.7894185437401781,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5806451612903226,
+      "eval_PRM Precision": 0.9333333333333333,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2521251142024994,
+      "eval_runtime": 14.7735,
+      "eval_samples_per_second": 2.978,
+      "eval_steps_per_second": 0.135,
+      "step": 1400
+    },
+    {
+      "epoch": 0.3628241235311256,
+      "grad_norm": 5.898802333208595,
+      "learning_rate": 1.0051395047734083e-06,
+      "loss": 0.3526,
+      "step": 1401
+    },
+    {
+      "epoch": 0.3630830986371435,
+      "grad_norm": 3.827032648322295,
+      "learning_rate": 1.004690714976837e-06,
+      "loss": 0.3202,
+      "step": 1402
+    },
+    {
+      "epoch": 0.36334207374316146,
+      "grad_norm": 3.767391984694187,
+      "learning_rate": 1.0042416146742175e-06,
+      "loss": 0.3372,
+      "step": 1403
+    },
+    {
+      "epoch": 0.3636010488491794,
+      "grad_norm": 4.634860029918238,
+      "learning_rate": 1.0037922042328177e-06,
+      "loss": 0.4127,
+      "step": 1404
+    },
+    {
+      "epoch": 0.3638600239551973,
+      "grad_norm": 3.1248109063152127,
+      "learning_rate": 1.0033424840201595e-06,
+      "loss": 0.3281,
+      "step": 1405
+    },
+    {
+      "epoch": 0.3638600239551973,
+      "eval_PRM Accuracy": 0.8207547169811321,
+      "eval_PRM F1": 0.8789808917197452,
+      "eval_PRM F1 AUC": 0.8069669984284967,
+      "eval_PRM F1 AUC (fixed)": 0.788108957569408,
+      "eval_PRM F1 Neg": 0.6545454545454545,
+      "eval_PRM NPV": 0.5625,
+      "eval_PRM Precision": 0.9324324324324325,
+      "eval_PRM Recall": 0.8313253012048193,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.24834133684635162,
+      "eval_runtime": 14.6414,
+      "eval_samples_per_second": 3.005,
+      "eval_steps_per_second": 0.137,
+      "step": 1405
+    },
+    {
+      "epoch": 0.36411899906121525,
+      "grad_norm": 5.545453446821229,
+      "learning_rate": 1.0028924544040179e-06,
+      "loss": 0.384,
+      "step": 1406
+    },
+    {
+      "epoch": 0.36437797416723317,
+      "grad_norm": 4.211034137415862,
+      "learning_rate": 1.0024421157524216e-06,
+      "loss": 0.3684,
+      "step": 1407
+    },
+    {
+      "epoch": 0.36463694927325113,
+      "grad_norm": 4.057108424391074,
+      "learning_rate": 1.0019914684336517e-06,
+      "loss": 0.4328,
+      "step": 1408
+    },
+    {
+      "epoch": 0.36489592437926904,
+      "grad_norm": 3.3320674863925537,
+      "learning_rate": 1.0015405128162412e-06,
+      "loss": 0.3834,
+      "step": 1409
+    },
+    {
+      "epoch": 0.36515489948528695,
+      "grad_norm": 8.681780340750507,
+      "learning_rate": 1.0010892492689758e-06,
+      "loss": 0.351,
+      "step": 1410
+    },
+    {
+      "epoch": 0.36515489948528695,
+      "eval_PRM Accuracy": 0.8301886792452831,
+      "eval_PRM F1": 0.8860759493670886,
+      "eval_PRM F1 AUC": 0.8129910948140389,
+      "eval_PRM F1 AUC (fixed)": 0.788108957569408,
+      "eval_PRM F1 Neg": 0.6666666666666666,
+      "eval_PRM NPV": 0.5806451612903226,
+      "eval_PRM Precision": 0.9333333333333333,
+      "eval_PRM Recall": 0.8433734939759037,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.24854445457458496,
+      "eval_runtime": 14.7704,
+      "eval_samples_per_second": 2.979,
+      "eval_steps_per_second": 0.135,
+      "step": 1410
+    },
+    {
+      "epoch": 0.3654138745913049,
+      "grad_norm": 3.47683496398654,
+      "learning_rate": 1.000637678160893e-06,
+      "loss": 0.3208,
+      "step": 1411
+    },
+    {
+      "epoch": 0.36567284969732283,
+      "grad_norm": 3.9465011870396873,
+      "learning_rate": 1.0001857998612815e-06,
+      "loss": 0.4328,
+      "step": 1412
+    },
+    {
+      "epoch": 0.3659318248033408,
+      "grad_norm": 2.7448030317458754,
+      "learning_rate": 9.997336147396816e-07,
+      "loss": 0.3005,
+      "step": 1413
+    },
+    {
+      "epoch": 0.3661907999093587,
+      "grad_norm": 4.164297634945185,
+      "learning_rate": 9.99281123165884e-07,
+      "loss": 0.2506,
+      "step": 1414
+    },
+    {
+      "epoch": 0.3664497750153766,
+      "grad_norm": 3.4588831820316877,
+      "learning_rate": 9.988283255099306e-07,
+      "loss": 0.3232,
+      "step": 1415
+    },
+    {
+      "epoch": 0.3664497750153766,
+      "eval_PRM Accuracy": 0.8773584905660378,
+      "eval_PRM F1": 0.9202453987730062,
+      "eval_PRM F1 AUC": 0.8431115767417497,
+      "eval_PRM F1 AUC (fixed)": 0.7909900471451021,
+      "eval_PRM F1 Neg": 0.7346938775510204,
+      "eval_PRM NPV": 0.6923076923076923,
+      "eval_PRM Precision": 0.9375,
+      "eval_PRM Recall": 0.9036144578313253,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2446984201669693,
+      "eval_runtime": 14.2678,
+      "eval_samples_per_second": 3.084,
+      "eval_steps_per_second": 0.14,
+      "step": 1415
+    },
+    {
+      "epoch": 0.3667087501213946,
+      "grad_norm": 5.711828100772439,
+      "learning_rate": 9.983752221421134e-07,
+      "loss": 0.3872,
+      "step": 1416
+    },
+    {
+      "epoch": 0.3669677252274125,
+      "grad_norm": 3.83260643758672,
+      "learning_rate": 9.979218134329739e-07,
+      "loss": 0.2705,
+      "step": 1417
+    },
+    {
+      "epoch": 0.36722670033343047,
+      "grad_norm": 7.755924384672744,
+      "learning_rate": 9.974680997533043e-07,
+      "loss": 0.4048,
+      "step": 1418
+    },
+    {
+      "epoch": 0.3674856754394484,
+      "grad_norm": 3.4136788910922937,
+      "learning_rate": 9.970140814741452e-07,
+      "loss": 0.2815,
+      "step": 1419
+    },
+    {
+      "epoch": 0.3677446505454663,
+      "grad_norm": 3.3743340350957682,
+      "learning_rate": 9.965597589667871e-07,
+      "loss": 0.3282,
+      "step": 1420
+    },
+    {
+      "epoch": 0.3677446505454663,
+      "eval_PRM Accuracy": 0.8867924528301887,
+      "eval_PRM F1": 0.926829268292683,
+      "eval_PRM F1 AUC": 0.8491356731272918,
+      "eval_PRM F1 AUC (fixed)": 0.8014667365112624,
+      "eval_PRM F1 Neg": 0.75,
+      "eval_PRM NPV": 0.72,
+      "eval_PRM Precision": 0.9382716049382716,
+      "eval_PRM Recall": 0.9156626506024096,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.23952960968017578,
+      "eval_runtime": 14.9505,
+      "eval_samples_per_second": 2.943,
+      "eval_steps_per_second": 0.134,
+      "step": 1420
+    },
+    {
+      "epoch": 0.36800362565148426,
+      "grad_norm": 3.4721221499465535,
+      "learning_rate": 9.961051326027688e-07,
+      "loss": 0.2982,
+      "step": 1421
+    },
+    {
+      "epoch": 0.36826260075750217,
+      "grad_norm": 6.65201998896593,
+      "learning_rate": 9.956502027538776e-07,
+      "loss": 0.3241,
+      "step": 1422
+    },
+    {
+      "epoch": 0.36852157586352013,
+      "grad_norm": 3.462624885557569,
+      "learning_rate": 9.951949697921493e-07,
+      "loss": 0.2788,
+      "step": 1423
+    },
+    {
+      "epoch": 0.36878055096953805,
+      "grad_norm": 3.3189609048980264,
+      "learning_rate": 9.947394340898675e-07,
+      "loss": 0.3762,
+      "step": 1424
+    },
+    {
+      "epoch": 0.369039526075556,
+      "grad_norm": 2.9790395939751733,
+      "learning_rate": 9.94283596019563e-07,
+      "loss": 0.2558,
+      "step": 1425
+    },
+    {
+      "epoch": 0.369039526075556,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.9,
+      "eval_PRM F1 AUC": 0.8250392875851232,
+      "eval_PRM F1 AUC (fixed)": 0.8043478260869564,
+      "eval_PRM F1 Neg": 0.6923076923076923,
+      "eval_PRM NPV": 0.6206896551724138,
+      "eval_PRM Precision": 0.935064935064935,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2378481775522232,
+      "eval_runtime": 14.6257,
+      "eval_samples_per_second": 3.008,
+      "eval_steps_per_second": 0.137,
+      "step": 1425
+    },
+    {
+      "epoch": 0.3692985011815739,
+      "grad_norm": 3.4004104085051905,
+      "learning_rate": 9.938274559540144e-07,
+      "loss": 0.3402,
+      "step": 1426
+    },
+    {
+      "epoch": 0.36955747628759184,
+      "grad_norm": 4.1750959101791745,
+      "learning_rate": 9.933710142662468e-07,
+      "loss": 0.2943,
+      "step": 1427
+    },
+    {
+      "epoch": 0.3698164513936098,
+      "grad_norm": 3.2247794918939894,
+      "learning_rate": 9.92914271329532e-07,
+      "loss": 0.35,
+      "step": 1428
+    },
+    {
+      "epoch": 0.3700754264996277,
+      "grad_norm": 5.112086961413494,
+      "learning_rate": 9.924572275173889e-07,
+      "loss": 0.2642,
+      "step": 1429
+    },
+    {
+      "epoch": 0.3703344016056457,
+      "grad_norm": 6.439724484325886,
+      "learning_rate": 9.919998832035815e-07,
+      "loss": 0.3536,
+      "step": 1430
+    },
+    {
+      "epoch": 0.3703344016056457,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.9056603773584906,
+      "eval_PRM F1 AUC": 0.8467784180199058,
+      "eval_PRM F1 AUC (fixed)": 0.8035620743844945,
+      "eval_PRM F1 Neg": 0.7169811320754716,
+      "eval_PRM NPV": 0.6333333333333333,
+      "eval_PRM Precision": 0.9473684210526315,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.23704619705677032,
+      "eval_runtime": 14.4407,
+      "eval_samples_per_second": 3.047,
+      "eval_steps_per_second": 0.138,
+      "step": 1430
+    },
+    {
+      "epoch": 0.3705933767116636,
+      "grad_norm": 3.443131454125624,
+      "learning_rate": 9.9154223876212e-07,
+      "loss": 0.3985,
+      "step": 1431
+    },
+    {
+      "epoch": 0.3708523518176815,
+      "grad_norm": 5.567638713314668,
+      "learning_rate": 9.910842945672602e-07,
+      "loss": 0.3216,
+      "step": 1432
+    },
+    {
+      "epoch": 0.37111132692369947,
+      "grad_norm": 2.9108306082811293,
+      "learning_rate": 9.906260509935027e-07,
+      "loss": 0.3545,
+      "step": 1433
+    },
+    {
+      "epoch": 0.3713703020297174,
+      "grad_norm": 3.992555721910898,
+      "learning_rate": 9.901675084155924e-07,
+      "loss": 0.3514,
+      "step": 1434
+    },
+    {
+      "epoch": 0.37162927713573535,
+      "grad_norm": 3.288250771978138,
+      "learning_rate": 9.897086672085205e-07,
+      "loss": 0.3328,
+      "step": 1435
+    },
+    {
+      "epoch": 0.37162927713573535,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.8987341772151899,
+      "eval_PRM F1 AUC": 0.8407543216343635,
+      "eval_PRM F1 AUC (fixed)": 0.8004190675746463,
+      "eval_PRM F1 Neg": 0.7037037037037037,
+      "eval_PRM NPV": 0.6129032258064516,
+      "eval_PRM Precision": 0.9466666666666667,
+      "eval_PRM Recall": 0.8554216867469879,
+      "eval_PRM Specificty": 0.8260869565217391,
+      "eval_loss": 0.23846612870693207,
+      "eval_runtime": 14.7197,
+      "eval_samples_per_second": 2.989,
+      "eval_steps_per_second": 0.136,
+      "step": 1435
+    },
+    {
+      "epoch": 0.37188825224175326,
+      "grad_norm": 3.3613173523286695,
+      "learning_rate": 9.892495277475203e-07,
+      "loss": 0.2902,
+      "step": 1436
+    },
+    {
+      "epoch": 0.37214722734777117,
+      "grad_norm": 4.1674637022810845,
+      "learning_rate": 9.887900904080704e-07,
+      "loss": 0.2901,
+      "step": 1437
+    },
+    {
+      "epoch": 0.37240620245378914,
+      "grad_norm": 4.785496501344485,
+      "learning_rate": 9.883303555658928e-07,
+      "loss": 0.3439,
+      "step": 1438
+    },
+    {
+      "epoch": 0.37266517755980705,
+      "grad_norm": 4.6478897795229335,
+      "learning_rate": 9.878703235969523e-07,
+      "loss": 0.3821,
+      "step": 1439
+    },
+    {
+      "epoch": 0.372924152665825,
+      "grad_norm": 4.519922141366181,
+      "learning_rate": 9.874099948774568e-07,
+      "loss": 0.4066,
+      "step": 1440
+    },
+    {
+      "epoch": 0.372924152665825,
+      "eval_PRM Accuracy": 0.8584905660377359,
+      "eval_PRM F1": 0.906832298136646,
+      "eval_PRM F1 AUC": 0.8310633839706653,
+      "eval_PRM F1 AUC (fixed)": 0.8064431639601886,
+      "eval_PRM F1 Neg": 0.7058823529411765,
+      "eval_PRM NPV": 0.6428571428571429,
+      "eval_PRM Precision": 0.9358974358974359,
+      "eval_PRM Recall": 0.8795180722891566,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.23579718172550201,
+      "eval_runtime": 14.5869,
+      "eval_samples_per_second": 3.016,
+      "eval_steps_per_second": 0.137,
+      "step": 1440
+    },
+    {
+      "epoch": 0.3731831277718429,
+      "grad_norm": 8.082390323683258,
+      "learning_rate": 9.869493697838573e-07,
+      "loss": 0.3807,
+      "step": 1441
+    },
+    {
+      "epoch": 0.3734421028778609,
+      "grad_norm": 3.9871931447775344,
+      "learning_rate": 9.86488448692847e-07,
+      "loss": 0.4278,
+      "step": 1442
+    },
+    {
+      "epoch": 0.3737010779838788,
+      "grad_norm": 5.366527806558145,
+      "learning_rate": 9.860272319813607e-07,
+      "loss": 0.3911,
+      "step": 1443
+    },
+    {
+      "epoch": 0.3739600530898967,
+      "grad_norm": 4.962218269420269,
+      "learning_rate": 9.855657200265755e-07,
+      "loss": 0.3959,
+      "step": 1444
+    },
+    {
+      "epoch": 0.3742190281959147,
+      "grad_norm": 3.682545253283956,
+      "learning_rate": 9.851039132059103e-07,
+      "loss": 0.4014,
+      "step": 1445
+    },
+    {
+      "epoch": 0.3742190281959147,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.9,
+      "eval_PRM F1 AUC": 0.8250392875851232,
+      "eval_PRM F1 AUC (fixed)": 0.7991094814038764,
+      "eval_PRM F1 Neg": 0.6923076923076923,
+      "eval_PRM NPV": 0.6206896551724138,
+      "eval_PRM Precision": 0.935064935064935,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.24163256585597992,
+      "eval_runtime": 14.9003,
+      "eval_samples_per_second": 2.953,
+      "eval_steps_per_second": 0.134,
+      "step": 1445
+    },
+    {
+      "epoch": 0.3744780033019326,
+      "grad_norm": 4.012447848004918,
+      "learning_rate": 9.846418118970238e-07,
+      "loss": 0.3358,
+      "step": 1446
+    },
+    {
+      "epoch": 0.37473697840795056,
+      "grad_norm": 3.6285946249500456,
+      "learning_rate": 9.841794164778167e-07,
+      "loss": 0.3036,
+      "step": 1447
+    },
+    {
+      "epoch": 0.37499595351396847,
+      "grad_norm": 7.966353046705746,
+      "learning_rate": 9.8371672732643e-07,
+      "loss": 0.2241,
+      "step": 1448
+    },
+    {
+      "epoch": 0.3752549286199864,
+      "grad_norm": 3.212966323254794,
+      "learning_rate": 9.832537448212445e-07,
+      "loss": 0.3485,
+      "step": 1449
+    },
+    {
+      "epoch": 0.37551390372600435,
+      "grad_norm": 5.815003987423003,
+      "learning_rate": 9.827904693408814e-07,
+      "loss": 0.34,
+      "step": 1450
+    },
+    {
+      "epoch": 0.37551390372600435,
+      "eval_PRM Accuracy": 0.8773584905660378,
+      "eval_PRM F1": 0.9202453987730062,
+      "eval_PRM F1 AUC": 0.8431115767417497,
+      "eval_PRM F1 AUC (fixed)": 0.8004190675746464,
+      "eval_PRM F1 Neg": 0.7346938775510204,
+      "eval_PRM NPV": 0.6923076923076923,
+      "eval_PRM Precision": 0.9375,
+      "eval_PRM Recall": 0.9036144578313253,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2403801530599594,
+      "eval_runtime": 14.4933,
+      "eval_samples_per_second": 3.036,
+      "eval_steps_per_second": 0.138,
+      "step": 1450
+    },
+    {
+      "epoch": 0.37577287883202226,
+      "grad_norm": 4.760451223227752,
+      "learning_rate": 9.823269012642012e-07,
+      "loss": 0.3352,
+      "step": 1451
+    },
+    {
+      "epoch": 0.37603185393804023,
+      "grad_norm": 4.0186328881753335,
+      "learning_rate": 9.818630409703036e-07,
+      "loss": 0.2568,
+      "step": 1452
+    },
+    {
+      "epoch": 0.37629082904405814,
+      "grad_norm": 4.164063275627754,
+      "learning_rate": 9.813988888385275e-07,
+      "loss": 0.3776,
+      "step": 1453
+    },
+    {
+      "epoch": 0.37654980415007605,
+      "grad_norm": 8.55257640064162,
+      "learning_rate": 9.809344452484508e-07,
+      "loss": 0.3895,
+      "step": 1454
+    },
+    {
+      "epoch": 0.376808779256094,
+      "grad_norm": 4.579909515061625,
+      "learning_rate": 9.804697105798885e-07,
+      "loss": 0.2611,
+      "step": 1455
+    },
+    {
+      "epoch": 0.376808779256094,
+      "eval_PRM Accuracy": 0.8679245283018868,
+      "eval_PRM F1": 0.9135802469135802,
+      "eval_PRM F1 AUC": 0.8370874803562075,
+      "eval_PRM F1 AUC (fixed)": 0.8067050811943426,
+      "eval_PRM F1 Neg": 0.72,
+      "eval_PRM NPV": 0.6666666666666666,
+      "eval_PRM Precision": 0.9367088607594937,
+      "eval_PRM Recall": 0.891566265060241,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.23761196434497833,
+      "eval_runtime": 14.4681,
+      "eval_samples_per_second": 3.041,
+      "eval_steps_per_second": 0.138,
+      "step": 1455
+    },
+    {
+      "epoch": 0.37706775436211193,
+      "grad_norm": 3.5982328749856105,
+      "learning_rate": 9.80004685212895e-07,
+      "loss": 0.3832,
+      "step": 1456
+    },
+    {
+      "epoch": 0.3773267294681299,
+      "grad_norm": 5.440234201873794,
+      "learning_rate": 9.79539369527762e-07,
+      "loss": 0.3383,
+      "step": 1457
+    },
+    {
+      "epoch": 0.3775857045741478,
+      "grad_norm": 5.14995747106743,
+      "learning_rate": 9.790737639050182e-07,
+      "loss": 0.4605,
+      "step": 1458
+    },
+    {
+      "epoch": 0.3778446796801657,
+      "grad_norm": 3.3322124466293124,
+      "learning_rate": 9.786078687254297e-07,
+      "loss": 0.3834,
+      "step": 1459
+    },
+    {
+      "epoch": 0.3781036547861837,
+      "grad_norm": 6.726995927479046,
+      "learning_rate": 9.781416843699999e-07,
+      "loss": 0.305,
+      "step": 1460
+    },
+    {
+      "epoch": 0.3781036547861837,
+      "eval_PRM Accuracy": 0.8679245283018868,
+      "eval_PRM F1": 0.9135802469135802,
+      "eval_PRM F1 AUC": 0.8370874803562075,
+      "eval_PRM F1 AUC (fixed)": 0.8114195914091147,
+      "eval_PRM F1 Neg": 0.72,
+      "eval_PRM NPV": 0.6666666666666666,
+      "eval_PRM Precision": 0.9367088607594937,
+      "eval_PRM Recall": 0.891566265060241,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.23749984800815582,
+      "eval_runtime": 14.8026,
+      "eval_samples_per_second": 2.972,
+      "eval_steps_per_second": 0.135,
+      "step": 1460
+    },
+    {
+      "epoch": 0.3783626298922016,
+      "grad_norm": 3.9906455982204188,
+      "learning_rate": 9.776752112199674e-07,
+      "loss": 0.3707,
+      "step": 1461
+    },
+    {
+      "epoch": 0.37862160499821956,
+      "grad_norm": 5.0238473308596925,
+      "learning_rate": 9.772084496568088e-07,
+      "loss": 0.3443,
+      "step": 1462
+    },
+    {
+      "epoch": 0.3788805801042375,
+      "grad_norm": 6.058458226117506,
+      "learning_rate": 9.767414000622346e-07,
+      "loss": 0.3752,
+      "step": 1463
+    },
+    {
+      "epoch": 0.37913955521025544,
+      "grad_norm": 6.055971624389849,
+      "learning_rate": 9.762740628181923e-07,
+      "loss": 0.3526,
+      "step": 1464
+    },
+    {
+      "epoch": 0.37939853031627335,
+      "grad_norm": 4.379766953792154,
+      "learning_rate": 9.758064383068643e-07,
+      "loss": 0.3024,
+      "step": 1465
+    },
+    {
+      "epoch": 0.37939853031627335,
+      "eval_PRM Accuracy": 0.8867924528301887,
+      "eval_PRM F1": 0.926829268292683,
+      "eval_PRM F1 AUC": 0.8491356731272918,
+      "eval_PRM F1 AUC (fixed)": 0.8171817705605029,
+      "eval_PRM F1 Neg": 0.75,
+      "eval_PRM NPV": 0.72,
+      "eval_PRM Precision": 0.9382716049382716,
+      "eval_PRM Recall": 0.9156626506024096,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.2357960194349289,
+      "eval_runtime": 14.6708,
+      "eval_samples_per_second": 2.999,
+      "eval_steps_per_second": 0.136,
+      "step": 1465
+    },
+    {
+      "epoch": 0.37965750542229126,
+      "grad_norm": 3.721510725794544,
+      "learning_rate": 9.753385269106671e-07,
+      "loss": 0.3405,
+      "step": 1466
+    },
+    {
+      "epoch": 0.37991648052830923,
+      "grad_norm": 4.6197481619434795,
+      "learning_rate": 9.74870329012253e-07,
+      "loss": 0.3346,
+      "step": 1467
+    },
+    {
+      "epoch": 0.38017545563432714,
+      "grad_norm": 3.318853840301337,
+      "learning_rate": 9.744018449945078e-07,
+      "loss": 0.342,
+      "step": 1468
+    },
+    {
+      "epoch": 0.3804344307403451,
+      "grad_norm": 6.607534071714149,
+      "learning_rate": 9.739330752405516e-07,
+      "loss": 0.3281,
+      "step": 1469
+    },
+    {
+      "epoch": 0.380693405846363,
+      "grad_norm": 3.3108665759335176,
+      "learning_rate": 9.73464020133738e-07,
+      "loss": 0.3388,
+      "step": 1470
+    },
+    {
+      "epoch": 0.380693405846363,
+      "eval_PRM Accuracy": 0.8773584905660378,
+      "eval_PRM F1": 0.9212121212121213,
+      "eval_PRM F1 AUC": 0.8273965426925091,
+      "eval_PRM F1 AUC (fixed)": 0.8192771084337349,
+      "eval_PRM F1 Neg": 0.723404255319149,
+      "eval_PRM NPV": 0.7083333333333334,
+      "eval_PRM Precision": 0.926829268292683,
+      "eval_PRM Recall": 0.9156626506024096,
+      "eval_PRM Specificty": 0.7391304347826086,
+      "eval_loss": 0.23642498254776,
+      "eval_runtime": 14.734,
+      "eval_samples_per_second": 2.986,
+      "eval_steps_per_second": 0.136,
+      "step": 1470
+    },
+    {
+      "epoch": 0.38095238095238093,
+      "grad_norm": 4.88496391866845,
+      "learning_rate": 9.729946800576542e-07,
+      "loss": 0.4142,
+      "step": 1471
+    },
+    {
+      "epoch": 0.3812113560583989,
+      "grad_norm": 5.27916049939447,
+      "learning_rate": 9.725250553961202e-07,
+      "loss": 0.3391,
+      "step": 1472
+    },
+    {
+      "epoch": 0.3814703311644168,
+      "grad_norm": 8.900314491547281,
+      "learning_rate": 9.72055146533189e-07,
+      "loss": 0.377,
+      "step": 1473
+    },
+    {
+      "epoch": 0.3817293062704348,
+      "grad_norm": 3.0011588762933292,
+      "learning_rate": 9.71584953853146e-07,
+      "loss": 0.2884,
+      "step": 1474
+    },
+    {
+      "epoch": 0.3819882813764527,
+      "grad_norm": 4.099551127706329,
+      "learning_rate": 9.71114477740508e-07,
+      "loss": 0.3726,
+      "step": 1475
+    },
+    {
+      "epoch": 0.3819882813764527,
+      "eval_PRM Accuracy": 0.8773584905660378,
+      "eval_PRM F1": 0.9212121212121213,
+      "eval_PRM F1 AUC": 0.8273965426925091,
+      "eval_PRM F1 AUC (fixed)": 0.8258250392875852,
+      "eval_PRM F1 Neg": 0.723404255319149,
+      "eval_PRM NPV": 0.7083333333333334,
+      "eval_PRM Precision": 0.926829268292683,
+      "eval_PRM Recall": 0.9156626506024096,
+      "eval_PRM Specificty": 0.7391304347826086,
+      "eval_loss": 0.23649762570858002,
+      "eval_runtime": 14.8796,
+      "eval_samples_per_second": 2.957,
+      "eval_steps_per_second": 0.134,
+      "step": 1475
+    },
+    {
+      "epoch": 0.3822472564824706,
+      "grad_norm": 3.6773421349404165,
+      "learning_rate": 9.706437185800247e-07,
+      "loss": 0.3779,
+      "step": 1476
+    },
+    {
+      "epoch": 0.38250623158848857,
+      "grad_norm": 4.032342903491971,
+      "learning_rate": 9.701726767566764e-07,
+      "loss": 0.4382,
+      "step": 1477
+    },
+    {
+      "epoch": 0.3827652066945065,
+      "grad_norm": 3.5491298285114325,
+      "learning_rate": 9.697013526556751e-07,
+      "loss": 0.3316,
+      "step": 1478
+    },
+    {
+      "epoch": 0.38302418180052444,
+      "grad_norm": 4.341491391745633,
+      "learning_rate": 9.692297466624633e-07,
+      "loss": 0.3436,
+      "step": 1479
+    },
+    {
+      "epoch": 0.38328315690654235,
+      "grad_norm": 2.8643056611618674,
+      "learning_rate": 9.687578591627138e-07,
+      "loss": 0.2758,
+      "step": 1480
+    },
+    {
+      "epoch": 0.38328315690654235,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.9,
+      "eval_PRM F1 AUC": 0.8250392875851232,
+      "eval_PRM F1 AUC (fixed)": 0.8187532739654269,
+      "eval_PRM F1 Neg": 0.6923076923076923,
+      "eval_PRM NPV": 0.6206896551724138,
+      "eval_PRM Precision": 0.935064935064935,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.24352265894412994,
+      "eval_runtime": 14.8616,
+      "eval_samples_per_second": 2.961,
+      "eval_steps_per_second": 0.135,
+      "step": 1480
+    },
+    {
+      "epoch": 0.38354213201256027,
+      "grad_norm": 3.7035412141544444,
+      "learning_rate": 9.682856905423307e-07,
+      "loss": 0.2516,
+      "step": 1481
+    },
+    {
+      "epoch": 0.38380110711857823,
+      "grad_norm": 6.508781566083587,
+      "learning_rate": 9.678132411874468e-07,
+      "loss": 0.4246,
+      "step": 1482
+    },
+    {
+      "epoch": 0.38406008222459614,
+      "grad_norm": 3.258716176187973,
+      "learning_rate": 9.67340511484425e-07,
+      "loss": 0.3599,
+      "step": 1483
+    },
+    {
+      "epoch": 0.3843190573306141,
+      "grad_norm": 3.4622217784743956,
+      "learning_rate": 9.668675018198576e-07,
+      "loss": 0.3031,
+      "step": 1484
+    },
+    {
+      "epoch": 0.384578032436632,
+      "grad_norm": 5.0275928854286045,
+      "learning_rate": 9.66394212580565e-07,
+      "loss": 0.3924,
+      "step": 1485
+    },
+    {
+      "epoch": 0.384578032436632,
+      "eval_PRM Accuracy": 0.8490566037735849,
+      "eval_PRM F1": 0.9,
+      "eval_PRM F1 AUC": 0.8250392875851232,
+      "eval_PRM F1 AUC (fixed)": 0.8171817705605029,
+      "eval_PRM F1 Neg": 0.6923076923076923,
+      "eval_PRM NPV": 0.6206896551724138,
+      "eval_PRM Precision": 0.935064935064935,
+      "eval_PRM Recall": 0.8674698795180723,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.24826860427856445,
+      "eval_runtime": 14.271,
+      "eval_samples_per_second": 3.083,
+      "eval_steps_per_second": 0.14,
+      "step": 1485
+    },
+    {
+      "epoch": 0.38483700754265,
+      "grad_norm": 6.109340461968093,
+      "learning_rate": 9.659206441535976e-07,
+      "loss": 0.3058,
+      "step": 1486
+    },
+    {
+      "epoch": 0.3850959826486679,
+      "grad_norm": 5.412763780216841,
+      "learning_rate": 9.654467969262333e-07,
+      "loss": 0.3662,
+      "step": 1487
+    },
+    {
+      "epoch": 0.3853549577546858,
+      "grad_norm": 4.1727011697393195,
+      "learning_rate": 9.649726712859777e-07,
+      "loss": 0.3745,
+      "step": 1488
+    },
+    {
+      "epoch": 0.3856139328607038,
+      "grad_norm": 7.060653823640019,
+      "learning_rate": 9.64498267620565e-07,
+      "loss": 0.326,
+      "step": 1489
+    },
+    {
+      "epoch": 0.3858729079667217,
+      "grad_norm": 3.036608182108932,
+      "learning_rate": 9.640235863179559e-07,
+      "loss": 0.2627,
+      "step": 1490
+    },
+    {
+      "epoch": 0.3858729079667217,
+      "eval_PRM Accuracy": 0.8773584905660378,
+      "eval_PRM F1": 0.9202453987730062,
+      "eval_PRM F1 AUC": 0.8431115767417497,
+      "eval_PRM F1 AUC (fixed)": 0.8268727082242011,
+      "eval_PRM F1 Neg": 0.7346938775510204,
+      "eval_PRM NPV": 0.6923076923076923,
+      "eval_PRM Precision": 0.9375,
+      "eval_PRM Recall": 0.9036144578313253,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.23949016630649567,
+      "eval_runtime": 14.7217,
+      "eval_samples_per_second": 2.989,
+      "eval_steps_per_second": 0.136,
+      "step": 1490
+    },
+    {
+      "epoch": 0.38613188307273966,
+      "grad_norm": 3.9043233046211663,
+      "learning_rate": 9.635486277663383e-07,
+      "loss": 0.3002,
+      "step": 1491
+    },
+    {
+      "epoch": 0.38639085817875757,
+      "grad_norm": 3.180806958564625,
+      "learning_rate": 9.630733923541277e-07,
+      "loss": 0.2761,
+      "step": 1492
+    },
+    {
+      "epoch": 0.3866498332847755,
+      "grad_norm": 3.4766085563957825,
+      "learning_rate": 9.625978804699646e-07,
+      "loss": 0.2817,
+      "step": 1493
+    },
+    {
+      "epoch": 0.38690880839079345,
+      "grad_norm": 12.109662314263637,
+      "learning_rate": 9.621220925027168e-07,
+      "loss": 0.4113,
+      "step": 1494
+    },
+    {
+      "epoch": 0.38716778349681136,
+      "grad_norm": 4.082401544792815,
+      "learning_rate": 9.616460288414776e-07,
+      "loss": 0.3458,
+      "step": 1495
+    },
+    {
+      "epoch": 0.38716778349681136,
+      "eval_PRM Accuracy": 0.8867924528301887,
+      "eval_PRM F1": 0.9285714285714286,
+      "eval_PRM F1 AUC": 0.817705605028811,
+      "eval_PRM F1 AUC (fixed)": 0.8300157150340493,
+      "eval_PRM F1 Neg": 0.7272727272727273,
+      "eval_PRM NPV": 0.7619047619047619,
+      "eval_PRM Precision": 0.9176470588235294,
+      "eval_PRM Recall": 0.9397590361445783,
+      "eval_PRM Specificty": 0.6956521739130435,
+      "eval_loss": 0.23893995583057404,
+      "eval_runtime": 14.7386,
+      "eval_samples_per_second": 2.985,
+      "eval_steps_per_second": 0.136,
+      "step": 1495
+    },
+    {
+      "epoch": 0.3874267586028293,
+      "grad_norm": 3.5917626862055987,
+      "learning_rate": 9.611696898755649e-07,
+      "loss": 0.2712,
+      "step": 1496
+    },
+    {
+      "epoch": 0.38768573370884724,
+      "grad_norm": 9.289904299091432,
+      "learning_rate": 9.606930759945227e-07,
+      "loss": 0.4151,
+      "step": 1497
+    },
+    {
+      "epoch": 0.38794470881486515,
+      "grad_norm": 6.707271661263045,
+      "learning_rate": 9.602161875881196e-07,
+      "loss": 0.3717,
+      "step": 1498
+    },
+    {
+      "epoch": 0.3882036839208831,
+      "grad_norm": 2.4515236018126743,
+      "learning_rate": 9.59739025046349e-07,
+      "loss": 0.2463,
+      "step": 1499
+    },
+    {
+      "epoch": 0.388462659026901,
+      "grad_norm": 3.005546252622098,
+      "learning_rate": 9.592615887594276e-07,
+      "loss": 0.3076,
+      "step": 1500
+    },
+    {
+      "epoch": 0.388462659026901,
+      "eval_PRM Accuracy": 0.9056603773584906,
+      "eval_PRM F1": 0.9397590361445783,
+      "eval_PRM F1 AUC": 0.8611838658983763,
+      "eval_PRM F1 AUC (fixed)": 0.8328968046097434,
+      "eval_PRM F1 Neg": 0.782608695652174,
+      "eval_PRM NPV": 0.782608695652174,
+      "eval_PRM Precision": 0.9397590361445783,
+      "eval_PRM Recall": 0.9397590361445783,
+      "eval_PRM Specificty": 0.782608695652174,
+      "eval_loss": 0.229969784617424,
+      "eval_runtime": 14.7198,
+      "eval_samples_per_second": 2.989,
+      "eval_steps_per_second": 0.136,
+      "step": 1500
     }
   ],
   "logging_steps": 1,
@@ -5243,7 +15643,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 42279677911040.0,
+  "total_flos": 126724469153792.0,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null