line-corporation
/

p-sacpo

Reinforcement Learning

text-generation

reinforcement-learning-from-human-feedback

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

3 contributors

History: 5 commits

akifumiwachi's picture

Update README.md

2901c06 verified 5 months ago