cj453
/

dense_reward_trainer_final_opt__NumTrainEpochs2_SaveStrategiesno_reward_modeling_anthropic_hh

Generated from Trainer

Model card Files Files and versions Community

dense_reward_trainer_final_opt__NumTrainEpochs2_SaveStrategiesno_reward_modeling_anthropic_hh

1 contributor

History: 1 commit

cj453's picture

initial commit

555f270 verified 5 months ago

.gitattributes

1.52 kB

initial commit 5 months ago