Moses25
/

LlaMA-3-8B-32K-INT8

Text Generation

Inference Endpoints

8-bit precision

Model card Files Files and versions Community

LlaMA-3-8B-32K-INT8 / gptq_model-8bit-128g.safetensors

Commit History

add int8

cb2ae37

Moses25 commited on Jul 28, 2024