5 1

Junrulu

https://www.linkedin.com/in/junrulu/

LuJunru

AI & ML interests

None yet

Recent Activity

published an article 6 days ago

结合Deepseek代码探讨MLA的改进及收益

published an article 6 days ago

大模型偏好优化技术：DPO及其变种

authored a paper 7 days ago

RoleMRC: A Fine-Grained Composite Benchmark for Role-Playing and Instruction-Following

View all activity

Organizations

None yet

Articles 2

Article

结合Deepseek代码探讨MLA的改进及收益

Article

大模型偏好优化技术：DPO及其变种

View all Articles

Collections 3

Papers 12

models 7

datasets 5

Junrulu/RoleMRC

Preview • Updated 7 days ago • 56

Junrulu/Reproduced-tulu2-test-sets

Preview • Updated Mar 25, 2024 • 10

Junrulu/MT-Bench-Plus

Viewer • Updated Mar 12, 2024 • 54 • 80 • 2

Junrulu/MemoChat_Instructions

Viewer • Updated Mar 12, 2024 • 10k • 61 • 1

Junrulu/Prompt_Preference_Dataset

Viewer • Updated Feb 19, 2024 • 30k • 67 • 1

Junrulu

AI & ML interests

Recent Activity

Organizations

Articles 2

结合Deepseek代码探讨MLA的改进及收益

大模型偏好优化技术：DPO及其变种

Collections 3

Junrulu/RoleMRC

RoleMRC: A Fine-Grained Composite Benchmark for Role-Playing and Instruction-Following

jiazhengli/Pythia-2.8B-HH-RLHF-Iterative-SamPO

jiazhengli/Pythia-2.8B-TLDR-Iterative-SamPO

Junrulu/Llama-3-8B-Instruct-Iterative-SamPO

Eliminating Biased Length Reliance of Direct Preference Optimization via Down-Sampled KL Divergence

Papers 12

models 7

Junrulu/Llama-3-8B-Instruct-Iterative-SamPO

Junrulu/Reproduced-tulu2-dpo-13b

Junrulu/MemoChat-Vicuna-13B

Junrulu/MemoChat-Fastchat-T5-3B

Junrulu/MemoChat-Vicuna-7B

Junrulu/MemoChat-Vicuna-33B

Junrulu/FIPO-IPL-IPO-Tulu2-70B

datasets 5

Junrulu/RoleMRC

Junrulu/Reproduced-tulu2-test-sets

Junrulu/MT-Bench-Plus

Junrulu/MemoChat_Instructions

Junrulu/Prompt_Preference_Dataset

Junrulu

AI & ML interests

Recent Activity

Organizations

Articles 2

结合Deepseek代码探讨MLA的改进及收益

大模型偏好优化技术：DPO及其变种

Collections 3

Papers 12

models 7 Sort: Recently updated

datasets 5 Sort: Recently updated

models 7

datasets 5