neuralmagic
/

Llama-3.2-1B-Instruct-quantized.w8a8

Text Generation

8-bit precision

compressed-tensors

Model card Files Files and versions Community

Llama-3.2-1B-Instruct-quantized.w8a8

Commit History

Update README.md

c1dce56
verified

alexmarques commited on about 1 month ago

Updated compression_config to quantization_config

fb30d43
verified

mgoin commited on Oct 9

Update README.md

012b9c0
verified

alexmarques commited on Sep 26

Update README.md

e0f0220
verified

alexmarques commited on Sep 26

Update README.md

0c8a3b8
verified

alexmarques commited on Sep 26

Update README.md

0f03d3a
verified

alexmarques commited on Sep 26

Create README.md

111b268
verified

alexmarques commited on Sep 26

Upload folder using huggingface_hub

7f1db53
verified

alexmarques commited on Sep 25

initial commit

848afec
verified

alexmarques commited on Sep 25