7 6 231

jeff zhao

jeff31415

AI & ML interests

None yet

Recent Activity

updated a dataset 7 days ago

jeff31415/misc_1

liked a model 7 days ago

Qwen/Qwen2.5-VL-72B-Instruct

liked a Space 7 days ago

nanotron/ultrascale-playbook

View all activity

Organizations

jeff31415's activity

updated a dataset 7 days ago

jeff31415/misc_1

Updated 7 days ago • 24

liked a model 7 days ago

Qwen/Qwen2.5-VL-72B-Instruct

Image-Text-to-Text • Updated 12 days ago • 244k • 332

liked a Space 7 days ago

1.67k

The Ultra-Scale Playbook

🌌

The ultimate guide to training LLM on large GPU Clusters

liked 4 models 7 days ago

liked a dataset 7 days ago

agentica-org/DeepScaleR-Preview-Dataset

Viewer • Updated 17 days ago • 40.3k • 1.65k • 67

liked a model 8 days ago

microsoft/OmniParser-v2.0

Image-Text-to-Text • Updated 9 days ago • 5.89k • 984

liked a dataset 9 days ago

RUC-AIBOX/STILL-3-Preview-RL-Data

Viewer • Updated Jan 26 • 29.9k • 1.84k • 10

liked a model 9 days ago

agentica-org/DeepScaleR-1.5B-Preview

Text Generation • Updated 4 days ago • 32.9k • • 479

liked a model 10 days ago

stepfun-ai/stepvideo-t2v

Text-to-Video • Updated 8 days ago • 1.41k • 389

liked a dataset 10 days ago

thu-coai/SafetyBench

Viewer • Updated Sep 14, 2023 • 25k • 352 • 19

liked a model 12 days ago

ValueFX9507/Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4

Reinforcement Learning • Updated 4 days ago • 36.6k • 197

liked 5 datasets 12 days ago

proj-persona/PersonaHub

Viewer • Updated 12 days ago • 375k • 5.05k • 527

AI4Math/MathVista

Viewer • Updated Feb 11, 2024 • 6.14k • 6.57k • 130

ceval/ceval-exam

Viewer • Updated Aug 31, 2023 • 13.9k • 72.9k • 254

xmj2002/Chinese_modern_classical

Viewer • Updated May 30, 2023 • 972k • 211 • 37

TIGER-Lab/AceCode-87K

Viewer • Updated 19 days ago • 87.1k • 1.07k • 32

upvoted a paper 15 days ago

Scaling up Test-Time Compute with Latent Reasoning: A Recurrent Depth Approach

Paper • 2502.05171 • Published 19 days ago • 118