Haihao Shen's picture

Haihao Shen

Haihao

·

https://github.com/intel/auto-round

AI & ML interests

LLM quantization, sparsity, and acceleration

Recent Activity

liked a model 28 days ago

OPEA/MiniMax-Text-01-int4-sym-inc-preview

liked a model 28 days ago

OPEA/Meta-Llama-3.1-405B-Instruct-int4-sym-inc

liked a model 28 days ago

OPEA/DeepSeek-V3-int4-sym-awq-inc

View all activity

Organizations

Articles 2

Article

12

Building Cost-Efficient Enterprise RAG applications with Intel Gaudi 2 and Intel Xeon

Article

9

Accelerate StarCoder with 🤗 Optimum Intel on Xeon: Q8/Q4 and Speculative Decoding

View all Articles

Papers 10

arxiv:2411.19542

arxiv:2311.16133

arxiv:2311.00502

arxiv:2310.10944

models

None public yet

datasets

None public yet