cj453
/

dense_reward_trainer_final_opt__NumTrainEpochs2_SaveStrategiesno_reward_modeling_anthropic_hh

Generated from Trainer

Model card Files Files and versions Community

dense_reward_trainer_final_opt__NumTrainEpochs2_SaveStrategiesno_reward_modeling_anthropic_hh

Commit History

initial commit

555f270
verified

cj453 commited on Sep 15, 2024