neuralmagic
/

Meta-Llama-3.1-70B-FP8

Text Generation

text-generation-inference

Inference Endpoints

compressed-tensors

Model card Files Files and versions Community

Meta-Llama-3.1-70B-FP8

Commit History

Updated compression_config to quantization_config

b47be60
verified

mgoin commited on Oct 9

Update README.md

bc708ae
verified

alexmarques commited on Aug 13

Create README.md

ece48d1
verified

Lin-K76 commited on Jul 31

Upload folder using huggingface_hub

4960456
verified

Lin-K76 commited on Jul 31

initial commit

21814a0
verified

Lin-K76 commited on Jul 31