18 4 4

Hanbin Wang

hanbin

https://wanghanbinpanda.github.io/

wanghanbinpanda

AI & ML interests

Code Intelligence and LLM Reasoning (Code, Math)

Recent Activity

updated a dataset 3 days ago

PRIME-RL/Eurus-2-RL-Data

new activity 3 days ago

PRIME-RL/Eurus-2-RL-Data:some empty code ground truths (roughly 1k in train)

updated a model 17 days ago

PRIME-RL/Eurus-2-7B-PRIME

View all activity

Articles

Process Reinforcement through Implicit Rewards

28 days ago

• 20

Organizations

hanbin's activity

updated a dataset 3 days ago

PRIME-RL/Eurus-2-RL-Data

Viewer • Updated 3 days ago • 483k • 687 • 23

New activity in PRIME-RL/Eurus-2-RL-Data 3 days ago

some empty code ground truths (roughly 1k in train)

#3 opened 3 days ago by

rawsh

updated 2 models 17 days ago

PRIME-RL/Eurus-2-7B-PRIME

Text Generation • Updated 17 days ago • 2.34k • 58

PRIME-RL/Eurus-2-7B-SFT

Updated 17 days ago • 7.69k • 2

updated 2 models 26 days ago

PRIME-RL/EurusPRM-Stage1

Updated 17 days ago • 172 • 4

PRIME-RL/EurusPRM-Stage2

Updated 14 days ago • 750 • 6

New activity in PRIME-RL/Eurus-2-7B-PRIME 26 days ago

Evaluation

#1 opened 27 days ago by

tugstugi

Add library_name and pipeline_tag

#2 opened 27 days ago by

nielsr

upvoted an article 28 days ago

Article

Process Reinforcement through Implicit Rewards

•

28 days ago

• 20

liked a model 29 days ago

PRIME-RL/Eurus-2-7B-PRIME

Text Generation • Updated 17 days ago • 2.34k • 58

updated 2 datasets 29 days ago

PRIME-RL/Eurus-2-SFT-Data

Viewer • Updated 29 days ago • 230k • 287 • 9

PRIME-RL/Eurus-2-RL-Data

Viewer • Updated 3 days ago • 483k • 687 • 23

updated 2 models 29 days ago

PRIME-RL/Eurus-2-7B-PRIME

Text Generation • Updated 17 days ago • 2.34k • 58

PRIME-RL/Eurus-2-7B-SFT

Updated 17 days ago • 7.69k • 2

updated a dataset 29 days ago

PRIME-RL/Eurus-2-SFT-Data

Viewer • Updated 29 days ago • 230k • 287 • 9

updated a model about 1 month ago

PRIME-RL/EurusPRM-Stage2

Updated 14 days ago • 750 • 6

updated a dataset about 1 month ago

PRIME-RL/Eurus-2-SFT-Data

Viewer • Updated 29 days ago • 230k • 287 • 9

updated 2 models about 1 month ago

PRIME-RL/Eurus-2-7B-SFT

Updated 17 days ago • 7.69k • 2

PRIME-RL/EurusPRM-Stage1

Updated 17 days ago • 172 • 4