neuralmagic
/

Sparse-Llama-3.1-8B-ultrachat_200k-2of4-quantized.w4a16

Text Generation

compressed-tensors

Model card Files Files and versions Community

Sparse-Llama-3.1-8B-ultrachat_200k-2of4-quantized.w4a16

2 contributors

History: 5 commits

nm-research's picture

Update README.md

0c2a256 verified about 2 months ago