dctanner
/

sablo-pebble-mistral-dpo-lora-HelpSteer_binarized

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

sablo-pebble-mistral-dpo-lora-HelpSteer_binarized / config.json

Commit History

End of training

fc9d379
verified

dctanner commited on Jan 24

End of training

95d3ec2
verified

dctanner commited on Jan 18