riddickz
/

Qwen2.5-1.5B-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-1.5B-Open-R1-GRPO / train_results.json

Commit History

Model save

e2e5b66
verified

riddickz commited on about 23 hours ago

Model save

d7e6c6f
verified

riddickz commited on about 23 hours ago

Model save

47028fb
verified

riddickz commited on 1 day ago

Model save

6ddfb3e
verified

riddickz commited on 2 days ago