qgallouedec
/

Qwen2.5-0.5B-GRPO-2873

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Qwen2.5-0.5B-GRPO-2873 / training_args.bin

Commit History

End of training

d60dea3
verified

qgallouedec HF staff commited on 9 days ago