zzz's picture

11

zzz

xlbqc

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 13 days ago

Enhancing Human-Like Responses in Large Language Models

upvoted a paper about 2 months ago

Large Language Model-Brained GUI Agents: A Survey

upvoted a paper 8 months ago

Transformers are SSMs: Generalized Models and Efficient Algorithms Through Structured State Space Duality

View all activity

Organizations

xlbqc's activity

upvoted a paper 13 days ago

Enhancing Human-Like Responses in Large Language Models

Paper • 2501.05032 • Published 17 days ago • 49

upvoted a paper about 2 months ago

Large Language Model-Brained GUI Agents: A Survey

Paper • 2411.18279 • Published Nov 27, 2024 • 29

upvoted a paper 8 months ago

Transformers are SSMs: Generalized Models and Efficient Algorithms Through Structured State Space Duality

Paper • 2405.21060 • Published May 31, 2024 • 64

upvoted a paper 9 months ago

Hunyuan-DiT: A Powerful Multi-Resolution Diffusion Transformer with Fine-Grained Chinese Understanding

Paper • 2405.08748 • Published May 14, 2024 • 22

upvoted 3 papers 11 months ago

An Image is Worth 1/2 Tokens After Layer 2: Plug-and-Play Inference Acceleration for Large Vision-Language Models

Paper • 2403.06764 • Published Mar 11, 2024 • 26

Adding NVMe SSDs to Enable and Accelerate 100B Model Fine-tuning on a Single GPU

Paper • 2403.06504 • Published Mar 11, 2024 • 53

The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

Paper • 2402.17764 • Published Feb 27, 2024 • 608

updated a collection 11 months ago

Focus on the paper

重点关注的论文 • 1 item • Updated Feb 28, 2024

upvoted 2 papers 11 months ago

MegaScale: Scaling Large Language Model Training to More Than 10,000 GPUs

Paper • 2402.15627 • Published Feb 23, 2024 • 35

Neural Network Diffusion

Paper • 2402.13144 • Published Feb 20, 2024 • 95

upvoted 2 papers about 1 year ago

Small Language Model Meets with Reinforced Vision Vocabulary

Paper • 2401.12503 • Published Jan 23, 2024 • 32

E^2-LLM: Efficient and Extreme Length Extension of Large Language Models

Paper • 2401.06951 • Published Jan 13, 2024 • 26