qingy2024
/

Qwarkstar-4B-Instruct-Preview

Text Generation

Model card Files Files and versions Community

qingy2024 commited on 11 days ago

Commit

cd93b13

·

verified ·

1 Parent(s): 9321d4c

Update README.md

Files changed (1) hide show

README.md +13 -2

README.md CHANGED Viewed

@@ -1,6 +1,12 @@
 ---
 base_model:
 - qingy2024/Qwarkstar-4B
 ---
 ## Qwarkstar 4B Instruct (Preview)
@@ -8,6 +14,11 @@ base_model:
 > [!NOTE]
 > Training complete!
-Fine tuned with SFT on 100k samples from HuggingfaceTB/smoltalk.
-It uses the ChatML template.

 ---
 base_model:
 - qingy2024/Qwarkstar-4B
+license: apache-2.0
+datasets:
+- HuggingFaceTB/smoltalk
+language:
+- en
+pipeline_tag: text-generation
 ---
 ## Qwarkstar 4B Instruct (Preview)
 > [!NOTE]
 > Training complete!
+This model is fine-tuned using Supervised Fine-Tuning (SFT) on 100k samples from the `HuggingFaceTB/smoltalk` dataset.
+It follows the ChatML input-output formatting template.
+### Training Details:
+- **Base Model**: `qingy2024/Qwarkstar-4B`
+- **Batch Size**: 32 (2 H100s x 8 per GPU)
+- **Max Gradient Norm**: 1.0
+- **Final Loss**: ~0.59