tttx
/

models-faker-step1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

aadityap commited on 5 days ago

Commit

81359fa

·

verified ·

1 Parent(s): 68554c6

End of training

Files changed (1) hide show

README.md +4 -1

README.md CHANGED Viewed

@@ -3,9 +3,12 @@ library_name: peft
 license: mit
 base_model: deepseek-ai/DeepSeek-R1-Distill-Qwen-32B
 tags:
 - trl
 - sft
 - generated_from_trainer
 model-index:
 - name: models-faker-step1
   results: []
@@ -16,7 +19,7 @@ should probably proofread and complete it, then remove this comment. -->
 # models-faker-step1
-This model is a fine-tuned version of [deepseek-ai/DeepSeek-R1-Distill-Qwen-32B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-32B) on an unknown dataset.
 ## Model description

 license: mit
 base_model: deepseek-ai/DeepSeek-R1-Distill-Qwen-32B
 tags:
+- alignment-handbook
 - trl
 - sft
 - generated_from_trainer
+datasets:
+- tttx/faker-step1-collated
 model-index:
 - name: models-faker-step1
   results: []
 # models-faker-step1
+This model is a fine-tuned version of [tttx/sft-32b-020925-19k-5ep](https://huggingface.co/tttx/sft-32b-020925-19k-5ep) on the tttx/faker-step1-collated dataset.
 ## Model description