Junxiao Song's picture

1 4

Junxiao Song

haha-point

·

AI & ML interests

None yet

Recent Activity

authored a paper 3 days ago

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

authored a paper 5 months ago

DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search

upvoted a paper 5 months ago

DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search

View all activity

Organizations

None yet

Papers 6

arxiv:2501.12948

arxiv:2408.08152

arxiv:2406.11931

arxiv:2405.04434

models

None public yet

datasets

None public yet