Upload folder using huggingface_hub (#2)

Browse files

- 7d584c2cc1409f45581c06945190e64a08f89a27b070745b85af704b748d4dce (ba540fa13d0361d7d2805275e4086eb58190b193)
- 654b5a2990ec170da7f18d66faf3f47430d311013e37f4566451237f42ce0f86 (bbb68316241c4124a2db946065b22aa81654013a)

Co-authored-by: schroneko <[email protected]>

Files changed (4) hide show

README.md +7 -7
config.json +0 -8
model.safetensors +2 -2
model.safetensors.index.json +1 -397

README.md CHANGED Viewed

@@ -4,11 +4,11 @@ tags:
 - mlx
 ---
-# mlx-community/deepseek-r1-distill-qwen-1.5b
-The Model [mlx-community/deepseek-r1-distill-qwen-1.5b](https://huggingface.co/mlx-community/deepseek-r1-distill-qwen-1.5b) was
 converted to MLX format from [deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B)
-using mlx-lm version **0.21.1**.
 ## Use with mlx
@@ -19,14 +19,14 @@ pip install mlx-lm
 ```python
 from mlx_lm import load, generate
-model, tokenizer = load("mlx-community/deepseek-r1-distill-qwen-1.5b")
-prompt = "hello"
-if tokenizer.chat_template is not None:
     messages = [{"role": "user", "content": prompt}]
     prompt = tokenizer.apply_chat_template(
-        messages, add_generation_prompt=True
     )
 response = generate(model, tokenizer, prompt=prompt, verbose=True)

 - mlx
 ---
+# mlx-community/DeepSeek-R1-Distill-Qwen-1.5B
+The Model [mlx-community/DeepSeek-R1-Distill-Qwen-1.5B](https://huggingface.co/mlx-community/DeepSeek-R1-Distill-Qwen-1.5B) was
 converted to MLX format from [deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B)
+using mlx-lm version **0.20.2**.
 ## Use with mlx
 ```python
 from mlx_lm import load, generate
+model, tokenizer = load("mlx-community/DeepSeek-R1-Distill-Qwen-1.5B")
+prompt="hello"
+if hasattr(tokenizer, "apply_chat_template") and tokenizer.chat_template is not None:
     messages = [{"role": "user", "content": prompt}]
     prompt = tokenizer.apply_chat_template(
+        messages, tokenize=False, add_generation_prompt=True
     )
 response = generate(model, tokenizer, prompt=prompt, verbose=True)

config.json CHANGED Viewed

@@ -15,14 +15,6 @@
     "num_attention_heads": 12,
     "num_hidden_layers": 28,
     "num_key_value_heads": 2,
-    "quantization": {
-        "group_size": 64,
-        "bits": 4
-    },
-    "quantization_config": {
-        "group_size": 64,
-        "bits": 4
-    },
     "rms_norm_eps": 1e-06,
     "rope_theta": 10000,
     "sliding_window": 4096,

     "num_attention_heads": 12,
     "num_hidden_layers": 28,
     "num_key_value_heads": 2,
     "rms_norm_eps": 1e-06,
     "rope_theta": 10000,
     "sliding_window": 4096,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e37c5a7b2015dc7dfed3feb810cafefc02330910578f7994814f280757de0681
-size 999901608

 version https://git-lfs.github.com/spec/v1
+oid sha256:e00b9b280553ddd88f1e953e201a35132f307fd7519ca20b5eaa7e216464c83c
+size 3554214153

model.safetensors.index.json CHANGED Viewed

@@ -1,741 +1,345 @@
 {
     "metadata": {
-        "total_size": 999820288
     },
     "weight_map": {
-        "lm_head.biases": "model.safetensors",
-        "lm_head.scales": "model.safetensors",
         "lm_head.weight": "model.safetensors",
-        "model.embed_tokens.biases": "model.safetensors",
-        "model.embed_tokens.scales": "model.safetensors",
         "model.embed_tokens.weight": "model.safetensors",
         "model.layers.0.input_layernorm.weight": "model.safetensors",
-        "model.layers.0.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.0.mlp.down_proj.scales": "model.safetensors",
         "model.layers.0.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.0.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.0.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.0.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.0.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.0.mlp.up_proj.scales": "model.safetensors",
         "model.layers.0.mlp.up_proj.weight": "model.safetensors",
         "model.layers.0.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.0.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.0.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.0.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.0.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.0.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.0.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.0.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.0.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.0.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.0.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.0.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.0.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.0.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.0.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.0.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.1.input_layernorm.weight": "model.safetensors",
-        "model.layers.1.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.1.mlp.down_proj.scales": "model.safetensors",
         "model.layers.1.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.1.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.1.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.1.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.1.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.1.mlp.up_proj.scales": "model.safetensors",
         "model.layers.1.mlp.up_proj.weight": "model.safetensors",
         "model.layers.1.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.1.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.1.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.1.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.1.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.1.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.1.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.1.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.1.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.1.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.1.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.1.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.1.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.1.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.1.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.1.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.10.input_layernorm.weight": "model.safetensors",
-        "model.layers.10.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.10.mlp.down_proj.scales": "model.safetensors",
         "model.layers.10.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.10.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.10.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.10.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.10.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.10.mlp.up_proj.scales": "model.safetensors",
         "model.layers.10.mlp.up_proj.weight": "model.safetensors",
         "model.layers.10.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.10.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.10.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.10.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.10.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.10.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.10.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.10.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.10.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.10.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.10.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.10.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.10.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.10.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.10.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.10.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.11.input_layernorm.weight": "model.safetensors",
-        "model.layers.11.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.11.mlp.down_proj.scales": "model.safetensors",
         "model.layers.11.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.11.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.11.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.11.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.11.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.11.mlp.up_proj.scales": "model.safetensors",
         "model.layers.11.mlp.up_proj.weight": "model.safetensors",
         "model.layers.11.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.11.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.11.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.11.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.11.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.11.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.11.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.11.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.11.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.11.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.11.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.11.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.11.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.11.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.11.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.11.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.12.input_layernorm.weight": "model.safetensors",
-        "model.layers.12.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.12.mlp.down_proj.scales": "model.safetensors",
         "model.layers.12.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.12.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.12.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.12.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.12.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.12.mlp.up_proj.scales": "model.safetensors",
         "model.layers.12.mlp.up_proj.weight": "model.safetensors",
         "model.layers.12.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.12.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.12.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.12.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.12.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.12.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.12.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.12.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.12.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.12.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.12.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.12.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.12.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.12.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.12.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.12.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.13.input_layernorm.weight": "model.safetensors",
-        "model.layers.13.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.13.mlp.down_proj.scales": "model.safetensors",
         "model.layers.13.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.13.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.13.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.13.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.13.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.13.mlp.up_proj.scales": "model.safetensors",
         "model.layers.13.mlp.up_proj.weight": "model.safetensors",
         "model.layers.13.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.13.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.13.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.13.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.13.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.13.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.13.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.13.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.13.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.13.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.13.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.13.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.13.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.13.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.13.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.13.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.14.input_layernorm.weight": "model.safetensors",
-        "model.layers.14.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.14.mlp.down_proj.scales": "model.safetensors",
         "model.layers.14.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.14.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.14.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.14.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.14.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.14.mlp.up_proj.scales": "model.safetensors",
         "model.layers.14.mlp.up_proj.weight": "model.safetensors",
         "model.layers.14.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.14.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.14.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.14.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.14.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.14.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.14.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.14.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.14.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.14.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.14.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.14.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.14.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.14.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.14.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.14.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.15.input_layernorm.weight": "model.safetensors",
-        "model.layers.15.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.15.mlp.down_proj.scales": "model.safetensors",
         "model.layers.15.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.15.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.15.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.15.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.15.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.15.mlp.up_proj.scales": "model.safetensors",
         "model.layers.15.mlp.up_proj.weight": "model.safetensors",
         "model.layers.15.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.15.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.15.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.15.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.15.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.15.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.15.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.15.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.15.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.15.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.15.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.15.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.15.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.15.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.15.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.15.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.16.input_layernorm.weight": "model.safetensors",
-        "model.layers.16.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.16.mlp.down_proj.scales": "model.safetensors",
         "model.layers.16.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.16.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.16.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.16.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.16.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.16.mlp.up_proj.scales": "model.safetensors",
         "model.layers.16.mlp.up_proj.weight": "model.safetensors",
         "model.layers.16.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.16.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.16.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.16.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.16.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.16.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.16.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.16.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.16.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.16.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.16.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.16.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.16.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.16.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.16.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.16.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.17.input_layernorm.weight": "model.safetensors",
-        "model.layers.17.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.17.mlp.down_proj.scales": "model.safetensors",
         "model.layers.17.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.17.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.17.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.17.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.17.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.17.mlp.up_proj.scales": "model.safetensors",
         "model.layers.17.mlp.up_proj.weight": "model.safetensors",
         "model.layers.17.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.17.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.17.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.17.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.17.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.17.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.17.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.17.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.17.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.17.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.17.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.17.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.17.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.17.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.17.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.17.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.18.input_layernorm.weight": "model.safetensors",
-        "model.layers.18.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.18.mlp.down_proj.scales": "model.safetensors",
         "model.layers.18.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.18.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.18.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.18.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.18.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.18.mlp.up_proj.scales": "model.safetensors",
         "model.layers.18.mlp.up_proj.weight": "model.safetensors",
         "model.layers.18.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.18.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.18.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.18.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.18.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.18.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.18.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.18.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.18.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.18.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.18.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.18.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.18.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.18.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.18.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.18.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.19.input_layernorm.weight": "model.safetensors",
-        "model.layers.19.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.19.mlp.down_proj.scales": "model.safetensors",
         "model.layers.19.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.19.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.19.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.19.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.19.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.19.mlp.up_proj.scales": "model.safetensors",
         "model.layers.19.mlp.up_proj.weight": "model.safetensors",
         "model.layers.19.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.19.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.19.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.19.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.19.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.19.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.19.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.19.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.19.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.19.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.19.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.19.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.19.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.19.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.19.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.19.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.2.input_layernorm.weight": "model.safetensors",
-        "model.layers.2.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.2.mlp.down_proj.scales": "model.safetensors",
         "model.layers.2.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.2.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.2.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.2.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.2.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.2.mlp.up_proj.scales": "model.safetensors",
         "model.layers.2.mlp.up_proj.weight": "model.safetensors",
         "model.layers.2.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.2.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.2.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.2.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.2.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.2.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.2.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.2.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.2.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.2.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.2.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.2.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.2.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.2.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.2.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.2.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.20.input_layernorm.weight": "model.safetensors",
-        "model.layers.20.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.20.mlp.down_proj.scales": "model.safetensors",
         "model.layers.20.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.20.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.20.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.20.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.20.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.20.mlp.up_proj.scales": "model.safetensors",
         "model.layers.20.mlp.up_proj.weight": "model.safetensors",
         "model.layers.20.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.20.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.20.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.20.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.20.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.20.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.20.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.20.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.20.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.20.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.20.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.20.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.20.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.20.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.20.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.20.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.21.input_layernorm.weight": "model.safetensors",
-        "model.layers.21.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.21.mlp.down_proj.scales": "model.safetensors",
         "model.layers.21.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.21.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.21.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.21.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.21.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.21.mlp.up_proj.scales": "model.safetensors",
         "model.layers.21.mlp.up_proj.weight": "model.safetensors",
         "model.layers.21.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.21.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.21.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.21.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.21.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.21.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.21.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.21.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.21.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.21.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.21.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.21.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.21.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.21.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.21.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.21.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.22.input_layernorm.weight": "model.safetensors",
-        "model.layers.22.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.22.mlp.down_proj.scales": "model.safetensors",
         "model.layers.22.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.22.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.22.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.22.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.22.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.22.mlp.up_proj.scales": "model.safetensors",
         "model.layers.22.mlp.up_proj.weight": "model.safetensors",
         "model.layers.22.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.22.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.22.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.22.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.22.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.22.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.22.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.22.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.22.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.22.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.22.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.22.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.22.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.22.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.22.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.22.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.23.input_layernorm.weight": "model.safetensors",
-        "model.layers.23.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.23.mlp.down_proj.scales": "model.safetensors",
         "model.layers.23.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.23.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.23.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.23.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.23.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.23.mlp.up_proj.scales": "model.safetensors",
         "model.layers.23.mlp.up_proj.weight": "model.safetensors",
         "model.layers.23.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.23.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.23.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.23.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.23.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.23.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.23.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.23.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.23.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.23.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.23.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.23.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.23.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.23.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.23.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.23.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.24.input_layernorm.weight": "model.safetensors",
-        "model.layers.24.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.24.mlp.down_proj.scales": "model.safetensors",
         "model.layers.24.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.24.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.24.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.24.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.24.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.24.mlp.up_proj.scales": "model.safetensors",
         "model.layers.24.mlp.up_proj.weight": "model.safetensors",
         "model.layers.24.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.24.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.24.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.24.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.24.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.24.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.24.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.24.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.24.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.24.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.24.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.24.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.24.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.24.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.24.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.24.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.25.input_layernorm.weight": "model.safetensors",
-        "model.layers.25.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.25.mlp.down_proj.scales": "model.safetensors",
         "model.layers.25.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.25.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.25.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.25.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.25.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.25.mlp.up_proj.scales": "model.safetensors",
         "model.layers.25.mlp.up_proj.weight": "model.safetensors",
         "model.layers.25.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.25.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.25.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.25.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.25.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.25.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.25.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.25.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.25.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.25.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.25.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.25.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.25.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.25.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.25.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.25.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.26.input_layernorm.weight": "model.safetensors",
-        "model.layers.26.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.26.mlp.down_proj.scales": "model.safetensors",
         "model.layers.26.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.26.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.26.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.26.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.26.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.26.mlp.up_proj.scales": "model.safetensors",
         "model.layers.26.mlp.up_proj.weight": "model.safetensors",
         "model.layers.26.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.26.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.26.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.26.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.26.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.26.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.26.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.26.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.26.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.26.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.26.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.26.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.26.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.26.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.26.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.26.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.27.input_layernorm.weight": "model.safetensors",
-        "model.layers.27.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.27.mlp.down_proj.scales": "model.safetensors",
         "model.layers.27.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.27.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.27.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.27.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.27.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.27.mlp.up_proj.scales": "model.safetensors",
         "model.layers.27.mlp.up_proj.weight": "model.safetensors",
         "model.layers.27.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.27.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.27.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.27.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.27.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.27.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.27.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.27.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.27.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.27.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.27.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.27.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.27.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.27.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.27.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.27.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.3.input_layernorm.weight": "model.safetensors",
-        "model.layers.3.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.3.mlp.down_proj.scales": "model.safetensors",
         "model.layers.3.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.3.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.3.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.3.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.3.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.3.mlp.up_proj.scales": "model.safetensors",
         "model.layers.3.mlp.up_proj.weight": "model.safetensors",
         "model.layers.3.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.3.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.3.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.3.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.3.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.3.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.3.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.3.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.3.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.3.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.3.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.3.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.3.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.3.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.3.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.3.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.4.input_layernorm.weight": "model.safetensors",
-        "model.layers.4.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.4.mlp.down_proj.scales": "model.safetensors",
         "model.layers.4.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.4.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.4.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.4.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.4.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.4.mlp.up_proj.scales": "model.safetensors",
         "model.layers.4.mlp.up_proj.weight": "model.safetensors",
         "model.layers.4.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.4.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.4.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.4.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.4.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.4.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.4.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.4.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.4.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.4.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.4.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.4.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.4.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.4.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.4.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.4.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.5.input_layernorm.weight": "model.safetensors",
-        "model.layers.5.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.5.mlp.down_proj.scales": "model.safetensors",
         "model.layers.5.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.5.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.5.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.5.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.5.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.5.mlp.up_proj.scales": "model.safetensors",
         "model.layers.5.mlp.up_proj.weight": "model.safetensors",
         "model.layers.5.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.5.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.5.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.5.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.5.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.5.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.5.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.5.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.5.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.5.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.5.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.5.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.5.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.5.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.5.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.5.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.6.input_layernorm.weight": "model.safetensors",
-        "model.layers.6.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.6.mlp.down_proj.scales": "model.safetensors",
         "model.layers.6.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.6.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.6.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.6.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.6.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.6.mlp.up_proj.scales": "model.safetensors",
         "model.layers.6.mlp.up_proj.weight": "model.safetensors",
         "model.layers.6.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.6.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.6.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.6.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.6.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.6.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.6.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.6.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.6.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.6.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.6.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.6.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.6.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.6.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.6.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.6.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.7.input_layernorm.weight": "model.safetensors",
-        "model.layers.7.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.7.mlp.down_proj.scales": "model.safetensors",
         "model.layers.7.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.7.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.7.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.7.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.7.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.7.mlp.up_proj.scales": "model.safetensors",
         "model.layers.7.mlp.up_proj.weight": "model.safetensors",
         "model.layers.7.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.7.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.7.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.7.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.7.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.7.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.7.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.7.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.7.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.7.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.7.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.7.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.7.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.7.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.7.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.7.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.8.input_layernorm.weight": "model.safetensors",
-        "model.layers.8.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.8.mlp.down_proj.scales": "model.safetensors",
         "model.layers.8.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.8.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.8.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.8.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.8.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.8.mlp.up_proj.scales": "model.safetensors",
         "model.layers.8.mlp.up_proj.weight": "model.safetensors",
         "model.layers.8.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.8.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.8.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.8.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.8.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.8.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.8.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.8.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.8.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.8.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.8.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.8.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.8.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.8.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.8.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.8.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.9.input_layernorm.weight": "model.safetensors",
-        "model.layers.9.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.9.mlp.down_proj.scales": "model.safetensors",
         "model.layers.9.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.9.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.9.mlp.gate_proj.scales": "model.safetensors",
         "model.layers.9.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.9.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.9.mlp.up_proj.scales": "model.safetensors",
         "model.layers.9.mlp.up_proj.weight": "model.safetensors",
         "model.layers.9.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.9.self_attn.k_proj.bias": "model.safetensors",
-        "model.layers.9.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.9.self_attn.k_proj.scales": "model.safetensors",
         "model.layers.9.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.9.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.9.self_attn.o_proj.scales": "model.safetensors",
         "model.layers.9.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.9.self_attn.q_proj.bias": "model.safetensors",
-        "model.layers.9.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.9.self_attn.q_proj.scales": "model.safetensors",
         "model.layers.9.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.9.self_attn.v_proj.bias": "model.safetensors",
-        "model.layers.9.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.9.self_attn.v_proj.scales": "model.safetensors",
         "model.layers.9.self_attn.v_proj.weight": "model.safetensors",
         "model.norm.weight": "model.safetensors"
     }

 {
     "metadata": {
+        "total_size": 3554176000
     },
     "weight_map": {
         "lm_head.weight": "model.safetensors",
         "model.embed_tokens.weight": "model.safetensors",
         "model.layers.0.input_layernorm.weight": "model.safetensors",
         "model.layers.0.mlp.down_proj.weight": "model.safetensors",
         "model.layers.0.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.0.mlp.up_proj.weight": "model.safetensors",
         "model.layers.0.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.0.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.0.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.0.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.0.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.0.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.0.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.0.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.1.input_layernorm.weight": "model.safetensors",
         "model.layers.1.mlp.down_proj.weight": "model.safetensors",
         "model.layers.1.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.1.mlp.up_proj.weight": "model.safetensors",
         "model.layers.1.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.1.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.1.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.1.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.1.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.1.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.1.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.1.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.10.input_layernorm.weight": "model.safetensors",
         "model.layers.10.mlp.down_proj.weight": "model.safetensors",
         "model.layers.10.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.10.mlp.up_proj.weight": "model.safetensors",
         "model.layers.10.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.10.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.10.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.10.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.10.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.10.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.10.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.10.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.11.input_layernorm.weight": "model.safetensors",
         "model.layers.11.mlp.down_proj.weight": "model.safetensors",
         "model.layers.11.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.11.mlp.up_proj.weight": "model.safetensors",
         "model.layers.11.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.11.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.11.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.11.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.11.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.11.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.11.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.11.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.12.input_layernorm.weight": "model.safetensors",
         "model.layers.12.mlp.down_proj.weight": "model.safetensors",
         "model.layers.12.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.12.mlp.up_proj.weight": "model.safetensors",
         "model.layers.12.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.12.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.12.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.12.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.12.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.12.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.12.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.12.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.13.input_layernorm.weight": "model.safetensors",
         "model.layers.13.mlp.down_proj.weight": "model.safetensors",
         "model.layers.13.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.13.mlp.up_proj.weight": "model.safetensors",
         "model.layers.13.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.13.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.13.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.13.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.13.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.13.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.13.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.13.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.14.input_layernorm.weight": "model.safetensors",
         "model.layers.14.mlp.down_proj.weight": "model.safetensors",
         "model.layers.14.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.14.mlp.up_proj.weight": "model.safetensors",
         "model.layers.14.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.14.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.14.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.14.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.14.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.14.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.14.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.14.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.15.input_layernorm.weight": "model.safetensors",
         "model.layers.15.mlp.down_proj.weight": "model.safetensors",
         "model.layers.15.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.15.mlp.up_proj.weight": "model.safetensors",
         "model.layers.15.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.15.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.15.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.15.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.15.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.15.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.15.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.15.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.16.input_layernorm.weight": "model.safetensors",
         "model.layers.16.mlp.down_proj.weight": "model.safetensors",
         "model.layers.16.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.16.mlp.up_proj.weight": "model.safetensors",
         "model.layers.16.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.16.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.16.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.16.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.16.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.16.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.16.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.16.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.17.input_layernorm.weight": "model.safetensors",
         "model.layers.17.mlp.down_proj.weight": "model.safetensors",
         "model.layers.17.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.17.mlp.up_proj.weight": "model.safetensors",
         "model.layers.17.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.17.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.17.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.17.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.17.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.17.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.17.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.17.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.18.input_layernorm.weight": "model.safetensors",
         "model.layers.18.mlp.down_proj.weight": "model.safetensors",
         "model.layers.18.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.18.mlp.up_proj.weight": "model.safetensors",
         "model.layers.18.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.18.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.18.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.18.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.18.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.18.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.18.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.18.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.19.input_layernorm.weight": "model.safetensors",
         "model.layers.19.mlp.down_proj.weight": "model.safetensors",
         "model.layers.19.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.19.mlp.up_proj.weight": "model.safetensors",
         "model.layers.19.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.19.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.19.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.19.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.19.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.19.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.19.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.19.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.2.input_layernorm.weight": "model.safetensors",
         "model.layers.2.mlp.down_proj.weight": "model.safetensors",
         "model.layers.2.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.2.mlp.up_proj.weight": "model.safetensors",
         "model.layers.2.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.2.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.2.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.2.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.2.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.2.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.2.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.2.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.20.input_layernorm.weight": "model.safetensors",
         "model.layers.20.mlp.down_proj.weight": "model.safetensors",
         "model.layers.20.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.20.mlp.up_proj.weight": "model.safetensors",
         "model.layers.20.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.20.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.20.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.20.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.20.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.20.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.20.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.20.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.21.input_layernorm.weight": "model.safetensors",
         "model.layers.21.mlp.down_proj.weight": "model.safetensors",
         "model.layers.21.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.21.mlp.up_proj.weight": "model.safetensors",
         "model.layers.21.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.21.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.21.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.21.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.21.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.21.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.21.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.21.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.22.input_layernorm.weight": "model.safetensors",
         "model.layers.22.mlp.down_proj.weight": "model.safetensors",
         "model.layers.22.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.22.mlp.up_proj.weight": "model.safetensors",
         "model.layers.22.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.22.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.22.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.22.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.22.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.22.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.22.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.22.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.23.input_layernorm.weight": "model.safetensors",
         "model.layers.23.mlp.down_proj.weight": "model.safetensors",
         "model.layers.23.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.23.mlp.up_proj.weight": "model.safetensors",
         "model.layers.23.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.23.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.23.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.23.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.23.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.23.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.23.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.23.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.24.input_layernorm.weight": "model.safetensors",
         "model.layers.24.mlp.down_proj.weight": "model.safetensors",
         "model.layers.24.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.24.mlp.up_proj.weight": "model.safetensors",
         "model.layers.24.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.24.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.24.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.24.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.24.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.24.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.24.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.24.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.25.input_layernorm.weight": "model.safetensors",
         "model.layers.25.mlp.down_proj.weight": "model.safetensors",
         "model.layers.25.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.25.mlp.up_proj.weight": "model.safetensors",
         "model.layers.25.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.25.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.25.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.25.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.25.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.25.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.25.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.25.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.26.input_layernorm.weight": "model.safetensors",
         "model.layers.26.mlp.down_proj.weight": "model.safetensors",
         "model.layers.26.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.26.mlp.up_proj.weight": "model.safetensors",
         "model.layers.26.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.26.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.26.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.26.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.26.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.26.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.26.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.26.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.27.input_layernorm.weight": "model.safetensors",
         "model.layers.27.mlp.down_proj.weight": "model.safetensors",
         "model.layers.27.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.27.mlp.up_proj.weight": "model.safetensors",
         "model.layers.27.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.27.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.27.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.27.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.27.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.27.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.27.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.27.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.3.input_layernorm.weight": "model.safetensors",
         "model.layers.3.mlp.down_proj.weight": "model.safetensors",
         "model.layers.3.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.3.mlp.up_proj.weight": "model.safetensors",
         "model.layers.3.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.3.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.3.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.3.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.3.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.3.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.3.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.3.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.4.input_layernorm.weight": "model.safetensors",
         "model.layers.4.mlp.down_proj.weight": "model.safetensors",
         "model.layers.4.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.4.mlp.up_proj.weight": "model.safetensors",
         "model.layers.4.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.4.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.4.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.4.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.4.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.4.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.4.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.4.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.5.input_layernorm.weight": "model.safetensors",
         "model.layers.5.mlp.down_proj.weight": "model.safetensors",
         "model.layers.5.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.5.mlp.up_proj.weight": "model.safetensors",
         "model.layers.5.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.5.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.5.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.5.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.5.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.5.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.5.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.5.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.6.input_layernorm.weight": "model.safetensors",
         "model.layers.6.mlp.down_proj.weight": "model.safetensors",
         "model.layers.6.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.6.mlp.up_proj.weight": "model.safetensors",
         "model.layers.6.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.6.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.6.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.6.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.6.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.6.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.6.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.6.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.7.input_layernorm.weight": "model.safetensors",
         "model.layers.7.mlp.down_proj.weight": "model.safetensors",
         "model.layers.7.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.7.mlp.up_proj.weight": "model.safetensors",
         "model.layers.7.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.7.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.7.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.7.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.7.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.7.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.7.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.7.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.8.input_layernorm.weight": "model.safetensors",
         "model.layers.8.mlp.down_proj.weight": "model.safetensors",
         "model.layers.8.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.8.mlp.up_proj.weight": "model.safetensors",
         "model.layers.8.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.8.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.8.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.8.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.8.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.8.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.8.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.8.self_attn.v_proj.weight": "model.safetensors",
         "model.layers.9.input_layernorm.weight": "model.safetensors",
         "model.layers.9.mlp.down_proj.weight": "model.safetensors",
         "model.layers.9.mlp.gate_proj.weight": "model.safetensors",
         "model.layers.9.mlp.up_proj.weight": "model.safetensors",
         "model.layers.9.post_attention_layernorm.weight": "model.safetensors",
         "model.layers.9.self_attn.k_proj.bias": "model.safetensors",
         "model.layers.9.self_attn.k_proj.weight": "model.safetensors",
         "model.layers.9.self_attn.o_proj.weight": "model.safetensors",
         "model.layers.9.self_attn.q_proj.bias": "model.safetensors",
         "model.layers.9.self_attn.q_proj.weight": "model.safetensors",
         "model.layers.9.self_attn.v_proj.bias": "model.safetensors",
         "model.layers.9.self_attn.v_proj.weight": "model.safetensors",
         "model.norm.weight": "model.safetensors"
     }