LLM Model, Can I run it?

*This does not support gated or private repos

GPU (optional)

Model (unquantized)

Context Size

Quant Format

GGUF

EXL2

GPTQ (coming soon)

BPW

KV Cache

Quantization Size

Batch Size

Model Size (GB)

4.20

Context Size (GB)

6.90

Total Size (GB)

420.69