unakar
/

Qwen7B-1M-GRPO-5ppl-200steps

Feature Extraction

text-generation-inference

text-embeddings-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen7B-1M-GRPO-5ppl-200steps

Commit History

Upload tokenizer

6a01bd5
verified

unakar commited on 10 days ago

Upload model

02e28e7
verified

unakar commited on 10 days ago

initial commit

3b915f8
verified

unakar commited on 10 days ago