riddickz
/

Qwen2.5-1.5B-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-1.5B-Open-R1-GRPO / model.safetensors

Commit History

Model save

d7e6c6f
verified

riddickz commited on 7 days ago

Model save

47028fb
verified

riddickz commited on 7 days ago

Model save

6ddfb3e
verified

riddickz commited on 8 days ago