andrewsiah
/

Qwen2.5-1.5B-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-1.5B-Open-R1-GRPO

Commit History

End of training

fa40932
verified

andrewsiah commited on 17 days ago

Model save

a6fbf6b
verified

andrewsiah commited on 17 days ago

End of training

daa9dd2
verified

andrewsiah commited on 17 days ago

Model save

afff409
verified

andrewsiah commited on 17 days ago

initial commit

536bc73
verified

andrewsiah commited on 18 days ago