mehmetkeremturkcan
/

SmollerLM-48M-Instruct-ft-sft

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

mehmetkeremturkcan commited on 5 days ago

Commit

3ad054d

·

verified ·

1 Parent(s): 7e8993f

Update README.md

Files changed (1) hide show

README.md +6 -2

README.md CHANGED Viewed

@@ -1,5 +1,7 @@
 ---
-base_model: mehmetkeremturkcan/SmollerLM-63M-Instruct-Base
 datasets: HuggingFaceTB/smol-smoltalk
 library_name: transformers
 model_name: SmollerLM-48M-Instruct-ft-sft
@@ -12,7 +14,9 @@ licence: license
 # Model Card for SmollerLM-48M-Instruct-ft-sft
-This model is a fine-tuned version of [mehmetkeremturkcan/SmollerLM-63M-Instruct-Base](https://huggingface.co/mehmetkeremturkcan/SmollerLM-63M-Instruct-Base) on the [HuggingFaceTB/smol-smoltalk](https://huggingface.co/datasets/HuggingFaceTB/smol-smoltalk) dataset.
 It has been trained using [TRL](https://github.com/huggingface/trl).
 ## Quick start

 ---
+base_model:
+- mehmetkeremturkcan/SmollerLM-63M-Instruct-Base
+- HuggingFaceTB/SmolLM2-135M-Instruct
 datasets: HuggingFaceTB/smol-smoltalk
 library_name: transformers
 model_name: SmollerLM-48M-Instruct-ft-sft
 # Model Card for SmollerLM-48M-Instruct-ft-sft
+A post-pruning SFT-finetuned model based on [HuggingFaceTB/SmolLM2-135M-Instruct](https://huggingface.co/mehmetkeremturkcan/HuggingFaceTB/SmolLM2-135M-Instruct).
+This model is a fine-tuned version of [mehmetkeremturkcan/SmollerLM-63M-Instruct-Base](https://huggingface.co/mehmetkeremturkcan/SmollerLM-63M-Instruct-Base) (improperly labeled) on the [HuggingFaceTB/smol-smoltalk](https://huggingface.co/datasets/HuggingFaceTB/smol-smoltalk) dataset.
 It has been trained using [TRL](https://github.com/huggingface/trl).
 ## Quick start