9 21 16

Huiqiang Jiang PRO

iofu728

https://www.microsoft.com/en-us/research/people/hjiang/

AI & ML interests

None yet

Recent Activity

liked a model 3 days ago

moonshotai/Moonlight-16B-A3B

upvoted a paper 28 days ago

Optimizing Large Language Model Training Using FP4 Quantization

liked a model about 1 month ago

Qwen/Qwen2.5-14B-Instruct-1M

View all activity

Organizations

iofu728's activity

liked a model 3 days ago

moonshotai/Moonlight-16B-A3B

Text Generation • Updated 3 days ago • 612 • 56

upvoted a paper 28 days ago

Optimizing Large Language Model Training Using FP4 Quantization

Paper • 2501.17116 • Published 28 days ago • 36

liked a model about 1 month ago

Qwen/Qwen2.5-14B-Instruct-1M

Text Generation • Updated 28 days ago • 39.6k • 260

upvoted a paper about 1 month ago

Sigma: Differential Rescaling of Query, Key and Value for Efficient Language Models

Paper • 2501.13629 • Published Jan 23 • 44

liked 2 models about 1 month ago

deepseek-ai/DeepSeek-R1-Distill-Qwen-32B

Text Generation • Updated 2 days ago • 1.11M • • 1.18k

deepseek-ai/DeepSeek-R1

Text Generation • Updated 2 days ago • 4.52M • • 10.2k

upvoted a paper about 2 months ago

rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking

Paper • 2501.04519 • Published Jan 8 • 257

updated a dataset 2 months ago

microsoft/SCBench

Viewer • Updated Dec 24, 2024 • 922 • 1.78k • 6

upvoted a paper 2 months ago

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 346

authored a paper 2 months ago

SCBench: A KV Cache-Centric Analysis of Long-Context Methods

Paper • 2412.10319 • Published Dec 13, 2024 • 10

upvoted a paper 2 months ago

SCBench: A KV Cache-Centric Analysis of Long-Context Methods

Paper • 2412.10319 • Published Dec 13, 2024 • 10

commented a paper 2 months ago

SCBench: A KV Cache-Centric Analysis of Long-Context Methods

Paper • 2412.10319 • Published Dec 13, 2024 • 10 •

New activity in microsoft/SCBench 2 months ago

rename

#2 opened 2 months ago by

liyucheng

updated a dataset 2 months ago

MInference/SCBench

Viewer • Updated Dec 13, 2024 • 922 • 243

upvoted a paper 2 months ago

Multimodal Latent Language Modeling with Next-Token Diffusion

Paper • 2412.08635 • Published Dec 11, 2024 • 44

updated a Space 4 months ago

MInference

🌍

Generate text responses to user queries

upvoted a paper 5 months ago

Differential Transformer

Paper • 2410.05258 • Published Oct 7, 2024 • 171

upvoted an article 5 months ago

Article

Fine-tuning LLMs to 1.58bit: extreme quantization made easy

Sep 18, 2024

• 223

authored a paper 5 months ago

RetrievalAttention: Accelerating Long-Context LLM Inference via Vector Retrieval

Paper • 2409.10516 • Published Sep 16, 2024 • 41

upvoted a paper 5 months ago

RetrievalAttention: Accelerating Long-Context LLM Inference via Vector Retrieval

Paper • 2409.10516 • Published Sep 16, 2024 • 41