Shuai Wang's picture

26 2

Shuai Wang

Shuaiii

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 3 days ago

Kimi k1.5: Scaling Reinforcement Learning with LLMs

upvoted a paper 3 days ago

Test-Time Preference Optimization: On-the-Fly Alignment via Iterative Textual Feedback

upvoted a paper 3 days ago

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

View all activity

Organizations

None yet

Papers 3

arxiv:2406.18532

arxiv:2401.17268

arxiv:2309.07870

models

None public yet

datasets

None public yet