alan918727
/

qwen2.5_3B_grpo_v1

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

qwen2.5_3B_grpo_v1 / model-00002-of-00002.safetensors

Commit History

Trained with Unsloth

22f7dfd
verified

alan918727 commited on 22 days ago