neuralmagic
/

Meta-Llama-3.1-8B-Instruct-quantized.w8a16

Text Generation

text-generation-inference

Inference Endpoints

compressed-tensors

Model card Files Files and versions Community

Meta-Llama-3.1-8B-Instruct-quantized.w8a16

Commit History

Update README.md

7e4ac27
verified

alexmarques commited on Jul 26

Update README.md

44b6153
verified

alexmarques commited on Jul 25

Update README.md

edc122e
verified

alexmarques commited on Jul 24

Create README.md

8b65aea
verified

alexmarques commited on Jul 24

Upload folder using huggingface_hub

b892d70
verified

alexmarques commited on Jul 24

initial commit

c08f05e
verified

alexmarques commited on Jul 24