Jiang's picture

5 6 1

Jiang

Dongwei

·

Some-random

AI & ML interests

None yet

Recent Activity

liked a model 8 days ago

Dongwei/Qwen-2.5-7B_Base_Math_smalllr

updated a model 13 days ago

Dongwei/Qwen-2.5-7B_Base_Math_smalllr_newdata

published a model 14 days ago

Dongwei/Qwen-2.5-7B_Base_Math_smalllr_newdata

View all activity

Organizations

Papers 3

arxiv:2410.01044

arxiv:2409.12183

arxiv:2407.09007

models 17

Dongwei/Qwen-2.5-7B_Base_Math_smalllr_newdata

Text Generation • Updated 13 days ago • 16

Dongwei/Qwen-2.5-7B_Base_Math_smalllr_longer

Text Generation • Updated 14 days ago • 21

Dongwei/Qwen-2.5-7B_Base_Math_smallestlr

Text Generation • Updated 15 days ago • 69

Dongwei/Qwen-2.5-7B_Base_Math_smallestlr_newdata

Text Generation • Updated 21 days ago • 24

Dongwei/Qwen-2.5-7B_Base_Math_smalllr

Text Generation • Updated 21 days ago • 205 • 6

Dongwei/DeepSeek-R1-Distill-Qwen-7B-GRPO_Math_lowlr

Text Generation • Updated 21 days ago • 18

Dongwei/DeepSeek-R1-Distill-Qwen-1.5B-GRPO_Math_smalllr

Text Generation • Updated 21 days ago • 11

Dongwei/Qwen2.5-1.5B-Open-R1-GRPO_Math_smalllr

Text Generation • Updated 21 days ago • 39

Dongwei/Qwen-2.5-7B_Math_smalllr

Text Generation • Updated 21 days ago • 39

Dongwei/DeepSeek-R1-Distill-Qwen-7B-GRPO_Math

Text Generation • Updated 22 days ago • 81

datasets 2

Dongwei/Math_8K_for_GRPO

Viewer • Updated 21 days ago • 8.89k • 76 • 1

Dongwei/reasoning_world_model

Viewer • Updated Apr 22, 2024 • 15.2k • 20 • 5