sartifyllc
/

pawa-min-alpha

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Mollel commited on Dec 2, 2024

Commit

9b01814

·

verified ·

1 Parent(s): 5094158

Update README.md

Files changed (1) hide show

README.md +2 -1

README.md CHANGED Viewed

@@ -93,7 +93,8 @@ _ = model.generate(input_ids=inputs, streamer=text_streamer, max_new_tokens=128,
 ---
 ### Training and Fine-Tuning Details
-- **Base Model**: Gemma-2-2B
 - **Fine-tuning**: Enhanced with Swahili SFT datasets for improved contextual understanding.
 - **Optimization**: Includes DPO for deterministic and consistent responses.

 ---
 ### Training and Fine-Tuning Details
+- **Base Model**: Gemma-2-2B
+- **Continue Pre-Training**: 3B Swahili Tokens
 - **Fine-tuning**: Enhanced with Swahili SFT datasets for improved contextual understanding.
 - **Optimization**: Includes DPO for deterministic and consistent responses.