neuralmagic
/

Qwen2-72B-Instruct-quantized.w8a8

Text Generation

text-generation-inference

Inference Endpoints

8-bit precision

compressed-tensors

Model card Files Files and versions Community

Qwen2-72B-Instruct-quantized.w8a8

Commit History

Updated compression_config to quantization_config

058453c
verified

mgoin commited on Oct 9, 2024

Update README.md

82d7ef8
verified

alexmarques commited on Jul 18, 2024

Create README.md

41bb75f
verified

alexmarques commited on Jul 18, 2024

Upload folder using huggingface_hub

171139d
verified

alexmarques commited on Jul 15, 2024

initial commit

ae83852
verified

alexmarques commited on Jul 15, 2024