Lei Wang's picture

2 147

Lei Wang

demolei

·

https://demoleiwang.github.io/HomePage/

AI & ML interests

LLMs

Recent Activity

upvoted a paper about 4 hours ago

O1-Pruner: Length-Harmonizing Fine-Tuning for O1-Like Reasoning Pruning

upvoted a paper about 5 hours ago

Kimi k1.5: Scaling Reinforcement Learning with LLMs

upvoted a paper about 5 hours ago

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

View all activity

Organizations

Collections 3

Papers 9

arxiv:2410.04698

arxiv:2407.21018

arxiv:2310.16535

arxiv:2310.08395

models 1

demolei/sft_openassistant-guanaco

Updated Jun 28, 2024

datasets

None public yet