1 33 86

momo

wzc991222

AI & ML interests

None yet

Recent Activity

liked a model 4 days ago

microsoft/phi-4

commented a paper 9 days ago

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

upvoted a paper 13 days ago

DeepSeek-V3 Technical Report

View all activity

Organizations

wzc991222's activity

liked a model 4 days ago

microsoft/phi-4

Text Generation • Updated 4 days ago • 42.8k • 1.05k

commented a paper 9 days ago

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

Paper • 2501.00958 • Published 11 days ago • 92 •

upvoted a paper 13 days ago

DeepSeek-V3 Technical Report

Paper • 2412.19437 • Published 17 days ago • 20

upvoted a collection 13 days ago

Deepseek Papers

Collection

Deepseek papers collection • 14 items • Updated 14 days ago • 9

upvoted a paper 16 days ago

YuLan-Mini: An Open Data-efficient Language Model

Paper • 2412.17743 • Published 20 days ago • 61

liked a model 17 days ago

deepseek-ai/DeepSeek-V3

Updated 14 days ago • 112k • 1.71k

liked a model 18 days ago

deepseek-ai/DeepSeek-V3-Base

Updated 14 days ago • 11.8k • 1.23k

liked a model 25 days ago

deepseek-ai/deepseek-vl2

Image-Text-to-Text • Updated 26 days ago • 2.4k • 131

liked a Space 26 days ago

Running

460

📈

Scaling test-time compute

liked a model 29 days ago

rhysjones/gpt2-124M-edu-fineweb-10B

Text Generation • Updated Jun 19, 2024 • 108 • 6

upvoted a paper about 1 month ago

Phi-4 Technical Report

Paper • 2412.08905 • Published Dec 12, 2024 • 101

liked a model about 1 month ago

recursal/QRWKV6-32B-Instruct-Preview-v0.1

Text Generation • Updated 21 days ago • 425 • 64

liked a Space about 1 month ago

Running

🔥

OPEN-MOE-LLM-LEADERBOARD

upvoted a paper about 1 month ago

Training Large Language Models to Reason in a Continuous Latent Space

Paper • 2412.06769 • Published Dec 9, 2024 • 71

liked a Space about 1 month ago

Running on Zero

2.87k

🏢

TRELLIS

Scalable and Versatile 3D Generation from images

upvoted a paper about 1 month ago

Structured 3D Latents for Scalable and Versatile 3D Generation

Paper • 2412.01506 • Published Dec 2, 2024 • 51

liked a model about 1 month ago

HuggingFaceTB/SmolLM2-135M

Text Generation • Updated Nov 23, 2024 • 143k • 44

upvoted 3 papers about 1 month ago