Adding `safetensors` variant of this model

by SFconvertbot - opened 3 days ago

base: refs/heads/main

←

from: refs/pr/2

Discussion Files changed

+1136

-0

This view is limited to 50 files because it contains too many changes. See the raw diff here.

Files changed (50) hide show

.gitattributes +71 -0
model.safetensors.index.json +852 -0
model_00001-of-00072.safetensors +3 -0
model_00002-of-00072.safetensors +3 -0
model_00003-of-00072.safetensors +3 -0
model_00004-of-00072.safetensors +3 -0
model_00005-of-00072.safetensors +3 -0
model_00006-of-00072.safetensors +3 -0
model_00007-of-00072.safetensors +3 -0
model_00008-of-00072.safetensors +3 -0
model_00009-of-00072.safetensors +3 -0
model_00010-of-00072.safetensors +3 -0
model_00011-of-00072.safetensors +3 -0
model_00012-of-00072.safetensors +3 -0
model_00013-of-00072.safetensors +3 -0
model_00014-of-00072.safetensors +3 -0
model_00015-of-00072.safetensors +3 -0
model_00016-of-00072.safetensors +3 -0
model_00017-of-00072.safetensors +3 -0
model_00018-of-00072.safetensors +3 -0
model_00019-of-00072.safetensors +3 -0
model_00020-of-00072.safetensors +3 -0
model_00021-of-00072.safetensors +3 -0
model_00022-of-00072.safetensors +3 -0
model_00023-of-00072.safetensors +3 -0
model_00024-of-00072.safetensors +3 -0
model_00025-of-00072.safetensors +3 -0
model_00026-of-00072.safetensors +3 -0
model_00027-of-00072.safetensors +3 -0
model_00028-of-00072.safetensors +3 -0
model_00029-of-00072.safetensors +3 -0
model_00030-of-00072.safetensors +3 -0
model_00031-of-00072.safetensors +3 -0
model_00032-of-00072.safetensors +3 -0
model_00033-of-00072.safetensors +3 -0
model_00034-of-00072.safetensors +3 -0
model_00035-of-00072.safetensors +3 -0
model_00036-of-00072.safetensors +3 -0
model_00037-of-00072.safetensors +3 -0
model_00038-of-00072.safetensors +3 -0
model_00039-of-00072.safetensors +3 -0
model_00040-of-00072.safetensors +3 -0
model_00041-of-00072.safetensors +3 -0
model_00042-of-00072.safetensors +3 -0
model_00043-of-00072.safetensors +3 -0
model_00044-of-00072.safetensors +3 -0
model_00045-of-00072.safetensors +3 -0
model_00046-of-00072.safetensors +3 -0
model_00047-of-00072.safetensors +3 -0
model_00048-of-00072.safetensors +3 -0

.gitattributes CHANGED Viewed

@@ -25,3 +25,74 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zstandard filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zstandard filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+model_00017-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00009-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00043-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00061-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00047-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00051-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00067-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00030-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00036-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00069-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00021-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00037-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00033-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00065-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00040-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00049-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00023-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00050-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00031-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00052-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00055-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00034-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00004-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00022-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00039-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00044-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00042-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00026-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00045-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00048-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00010-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00019-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00002-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00054-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00012-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00041-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00020-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00053-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00062-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00064-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00071-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00011-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00001-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00008-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00060-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00013-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00070-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00032-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00018-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00016-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00029-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00007-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00038-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00057-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00027-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00003-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00005-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00058-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00046-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00035-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00056-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00066-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00025-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00014-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00015-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00059-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00024-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00006-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00068-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00028-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text
+model_00063-of-00072.safetensors filter=lfs diff=lfs merge=lfs -text

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,852 @@

+{
+    "metadata": {
+        "total_size": 352494542848
+    },
+    "weight_map": {
+        "h.0.input_layernorm.bias": "model_00002-of-00072.safetensors",
+        "h.0.input_layernorm.weight": "model_00002-of-00072.safetensors",
+        "h.0.mlp.dense_4h_to_h.bias": "model_00002-of-00072.safetensors",
+        "h.0.mlp.dense_4h_to_h.weight": "model_00002-of-00072.safetensors",
+        "h.0.mlp.dense_h_to_4h.bias": "model_00002-of-00072.safetensors",
+        "h.0.mlp.dense_h_to_4h.weight": "model_00002-of-00072.safetensors",
+        "h.0.post_attention_layernorm.bias": "model_00002-of-00072.safetensors",
+        "h.0.post_attention_layernorm.weight": "model_00002-of-00072.safetensors",
+        "h.0.self_attention.dense.bias": "model_00002-of-00072.safetensors",
+        "h.0.self_attention.dense.weight": "model_00002-of-00072.safetensors",
+        "h.0.self_attention.query_key_value.bias": "model_00002-of-00072.safetensors",
+        "h.0.self_attention.query_key_value.weight": "model_00002-of-00072.safetensors",
+        "h.1.input_layernorm.bias": "model_00003-of-00072.safetensors",
+        "h.1.input_layernorm.weight": "model_00003-of-00072.safetensors",
+        "h.1.mlp.dense_4h_to_h.bias": "model_00003-of-00072.safetensors",
+        "h.1.mlp.dense_4h_to_h.weight": "model_00003-of-00072.safetensors",
+        "h.1.mlp.dense_h_to_4h.bias": "model_00003-of-00072.safetensors",
+        "h.1.mlp.dense_h_to_4h.weight": "model_00003-of-00072.safetensors",
+        "h.1.post_attention_layernorm.bias": "model_00003-of-00072.safetensors",
+        "h.1.post_attention_layernorm.weight": "model_00003-of-00072.safetensors",
+        "h.1.self_attention.dense.bias": "model_00003-of-00072.safetensors",
+        "h.1.self_attention.dense.weight": "model_00003-of-00072.safetensors",
+        "h.1.self_attention.query_key_value.bias": "model_00003-of-00072.safetensors",
+        "h.1.self_attention.query_key_value.weight": "model_00003-of-00072.safetensors",
+        "h.10.input_layernorm.bias": "model_00012-of-00072.safetensors",
+        "h.10.input_layernorm.weight": "model_00012-of-00072.safetensors",
+        "h.10.mlp.dense_4h_to_h.bias": "model_00012-of-00072.safetensors",
+        "h.10.mlp.dense_4h_to_h.weight": "model_00012-of-00072.safetensors",
+        "h.10.mlp.dense_h_to_4h.bias": "model_00012-of-00072.safetensors",
+        "h.10.mlp.dense_h_to_4h.weight": "model_00012-of-00072.safetensors",
+        "h.10.post_attention_layernorm.bias": "model_00012-of-00072.safetensors",
+        "h.10.post_attention_layernorm.weight": "model_00012-of-00072.safetensors",
+        "h.10.self_attention.dense.bias": "model_00012-of-00072.safetensors",
+        "h.10.self_attention.dense.weight": "model_00012-of-00072.safetensors",
+        "h.10.self_attention.query_key_value.bias": "model_00012-of-00072.safetensors",
+        "h.10.self_attention.query_key_value.weight": "model_00012-of-00072.safetensors",
+        "h.11.input_layernorm.bias": "model_00013-of-00072.safetensors",
+        "h.11.input_layernorm.weight": "model_00013-of-00072.safetensors",
+        "h.11.mlp.dense_4h_to_h.bias": "model_00013-of-00072.safetensors",
+        "h.11.mlp.dense_4h_to_h.weight": "model_00013-of-00072.safetensors",
+        "h.11.mlp.dense_h_to_4h.bias": "model_00013-of-00072.safetensors",
+        "h.11.mlp.dense_h_to_4h.weight": "model_00013-of-00072.safetensors",
+        "h.11.post_attention_layernorm.bias": "model_00013-of-00072.safetensors",
+        "h.11.post_attention_layernorm.weight": "model_00013-of-00072.safetensors",
+        "h.11.self_attention.dense.bias": "model_00013-of-00072.safetensors",
+        "h.11.self_attention.dense.weight": "model_00013-of-00072.safetensors",
+        "h.11.self_attention.query_key_value.bias": "model_00013-of-00072.safetensors",
+        "h.11.self_attention.query_key_value.weight": "model_00013-of-00072.safetensors",
+        "h.12.input_layernorm.bias": "model_00014-of-00072.safetensors",
+        "h.12.input_layernorm.weight": "model_00014-of-00072.safetensors",
+        "h.12.mlp.dense_4h_to_h.bias": "model_00014-of-00072.safetensors",
+        "h.12.mlp.dense_4h_to_h.weight": "model_00014-of-00072.safetensors",
+        "h.12.mlp.dense_h_to_4h.bias": "model_00014-of-00072.safetensors",
+        "h.12.mlp.dense_h_to_4h.weight": "model_00014-of-00072.safetensors",
+        "h.12.post_attention_layernorm.bias": "model_00014-of-00072.safetensors",
+        "h.12.post_attention_layernorm.weight": "model_00014-of-00072.safetensors",
+        "h.12.self_attention.dense.bias": "model_00014-of-00072.safetensors",
+        "h.12.self_attention.dense.weight": "model_00014-of-00072.safetensors",
+        "h.12.self_attention.query_key_value.bias": "model_00014-of-00072.safetensors",
+        "h.12.self_attention.query_key_value.weight": "model_00014-of-00072.safetensors",
+        "h.13.input_layernorm.bias": "model_00015-of-00072.safetensors",
+        "h.13.input_layernorm.weight": "model_00015-of-00072.safetensors",
+        "h.13.mlp.dense_4h_to_h.bias": "model_00015-of-00072.safetensors",
+        "h.13.mlp.dense_4h_to_h.weight": "model_00015-of-00072.safetensors",
+        "h.13.mlp.dense_h_to_4h.bias": "model_00015-of-00072.safetensors",
+        "h.13.mlp.dense_h_to_4h.weight": "model_00015-of-00072.safetensors",
+        "h.13.post_attention_layernorm.bias": "model_00015-of-00072.safetensors",
+        "h.13.post_attention_layernorm.weight": "model_00015-of-00072.safetensors",
+        "h.13.self_attention.dense.bias": "model_00015-of-00072.safetensors",
+        "h.13.self_attention.dense.weight": "model_00015-of-00072.safetensors",
+        "h.13.self_attention.query_key_value.bias": "model_00015-of-00072.safetensors",
+        "h.13.self_attention.query_key_value.weight": "model_00015-of-00072.safetensors",
+        "h.14.input_layernorm.bias": "model_00016-of-00072.safetensors",
+        "h.14.input_layernorm.weight": "model_00016-of-00072.safetensors",
+        "h.14.mlp.dense_4h_to_h.bias": "model_00016-of-00072.safetensors",
+        "h.14.mlp.dense_4h_to_h.weight": "model_00016-of-00072.safetensors",
+        "h.14.mlp.dense_h_to_4h.bias": "model_00016-of-00072.safetensors",
+        "h.14.mlp.dense_h_to_4h.weight": "model_00016-of-00072.safetensors",
+        "h.14.post_attention_layernorm.bias": "model_00016-of-00072.safetensors",
+        "h.14.post_attention_layernorm.weight": "model_00016-of-00072.safetensors",
+        "h.14.self_attention.dense.bias": "model_00016-of-00072.safetensors",
+        "h.14.self_attention.dense.weight": "model_00016-of-00072.safetensors",
+        "h.14.self_attention.query_key_value.bias": "model_00016-of-00072.safetensors",
+        "h.14.self_attention.query_key_value.weight": "model_00016-of-00072.safetensors",
+        "h.15.input_layernorm.bias": "model_00017-of-00072.safetensors",
+        "h.15.input_layernorm.weight": "model_00017-of-00072.safetensors",
+        "h.15.mlp.dense_4h_to_h.bias": "model_00017-of-00072.safetensors",
+        "h.15.mlp.dense_4h_to_h.weight": "model_00017-of-00072.safetensors",
+        "h.15.mlp.dense_h_to_4h.bias": "model_00017-of-00072.safetensors",
+        "h.15.mlp.dense_h_to_4h.weight": "model_00017-of-00072.safetensors",
+        "h.15.post_attention_layernorm.bias": "model_00017-of-00072.safetensors",
+        "h.15.post_attention_layernorm.weight": "model_00017-of-00072.safetensors",
+        "h.15.self_attention.dense.bias": "model_00017-of-00072.safetensors",
+        "h.15.self_attention.dense.weight": "model_00017-of-00072.safetensors",
+        "h.15.self_attention.query_key_value.bias": "model_00017-of-00072.safetensors",
+        "h.15.self_attention.query_key_value.weight": "model_00017-of-00072.safetensors",
+        "h.16.input_layernorm.bias": "model_00018-of-00072.safetensors",
+        "h.16.input_layernorm.weight": "model_00018-of-00072.safetensors",
+        "h.16.mlp.dense_4h_to_h.bias": "model_00018-of-00072.safetensors",
+        "h.16.mlp.dense_4h_to_h.weight": "model_00018-of-00072.safetensors",
+        "h.16.mlp.dense_h_to_4h.bias": "model_00018-of-00072.safetensors",
+        "h.16.mlp.dense_h_to_4h.weight": "model_00018-of-00072.safetensors",
+        "h.16.post_attention_layernorm.bias": "model_00018-of-00072.safetensors",
+        "h.16.post_attention_layernorm.weight": "model_00018-of-00072.safetensors",
+        "h.16.self_attention.dense.bias": "model_00018-of-00072.safetensors",
+        "h.16.self_attention.dense.weight": "model_00018-of-00072.safetensors",
+        "h.16.self_attention.query_key_value.bias": "model_00018-of-00072.safetensors",
+        "h.16.self_attention.query_key_value.weight": "model_00018-of-00072.safetensors",
+        "h.17.input_layernorm.bias": "model_00019-of-00072.safetensors",
+        "h.17.input_layernorm.weight": "model_00019-of-00072.safetensors",
+        "h.17.mlp.dense_4h_to_h.bias": "model_00019-of-00072.safetensors",
+        "h.17.mlp.dense_4h_to_h.weight": "model_00019-of-00072.safetensors",
+        "h.17.mlp.dense_h_to_4h.bias": "model_00019-of-00072.safetensors",
+        "h.17.mlp.dense_h_to_4h.weight": "model_00019-of-00072.safetensors",
+        "h.17.post_attention_layernorm.bias": "model_00019-of-00072.safetensors",
+        "h.17.post_attention_layernorm.weight": "model_00019-of-00072.safetensors",
+        "h.17.self_attention.dense.bias": "model_00019-of-00072.safetensors",
+        "h.17.self_attention.dense.weight": "model_00019-of-00072.safetensors",
+        "h.17.self_attention.query_key_value.bias": "model_00019-of-00072.safetensors",
+        "h.17.self_attention.query_key_value.weight": "model_00019-of-00072.safetensors",
+        "h.18.input_layernorm.bias": "model_00020-of-00072.safetensors",
+        "h.18.input_layernorm.weight": "model_00020-of-00072.safetensors",
+        "h.18.mlp.dense_4h_to_h.bias": "model_00020-of-00072.safetensors",
+        "h.18.mlp.dense_4h_to_h.weight": "model_00020-of-00072.safetensors",
+        "h.18.mlp.dense_h_to_4h.bias": "model_00020-of-00072.safetensors",
+        "h.18.mlp.dense_h_to_4h.weight": "model_00020-of-00072.safetensors",
+        "h.18.post_attention_layernorm.bias": "model_00020-of-00072.safetensors",
+        "h.18.post_attention_layernorm.weight": "model_00020-of-00072.safetensors",
+        "h.18.self_attention.dense.bias": "model_00020-of-00072.safetensors",
+        "h.18.self_attention.dense.weight": "model_00020-of-00072.safetensors",
+        "h.18.self_attention.query_key_value.bias": "model_00020-of-00072.safetensors",
+        "h.18.self_attention.query_key_value.weight": "model_00020-of-00072.safetensors",
+        "h.19.input_layernorm.bias": "model_00021-of-00072.safetensors",
+        "h.19.input_layernorm.weight": "model_00021-of-00072.safetensors",
+        "h.19.mlp.dense_4h_to_h.bias": "model_00021-of-00072.safetensors",
+        "h.19.mlp.dense_4h_to_h.weight": "model_00021-of-00072.safetensors",
+        "h.19.mlp.dense_h_to_4h.bias": "model_00021-of-00072.safetensors",
+        "h.19.mlp.dense_h_to_4h.weight": "model_00021-of-00072.safetensors",
+        "h.19.post_attention_layernorm.bias": "model_00021-of-00072.safetensors",
+        "h.19.post_attention_layernorm.weight": "model_00021-of-00072.safetensors",
+        "h.19.self_attention.dense.bias": "model_00021-of-00072.safetensors",
+        "h.19.self_attention.dense.weight": "model_00021-of-00072.safetensors",
+        "h.19.self_attention.query_key_value.bias": "model_00021-of-00072.safetensors",
+        "h.19.self_attention.query_key_value.weight": "model_00021-of-00072.safetensors",
+        "h.2.input_layernorm.bias": "model_00004-of-00072.safetensors",
+        "h.2.input_layernorm.weight": "model_00004-of-00072.safetensors",
+        "h.2.mlp.dense_4h_to_h.bias": "model_00004-of-00072.safetensors",
+        "h.2.mlp.dense_4h_to_h.weight": "model_00004-of-00072.safetensors",
+        "h.2.mlp.dense_h_to_4h.bias": "model_00004-of-00072.safetensors",
+        "h.2.mlp.dense_h_to_4h.weight": "model_00004-of-00072.safetensors",
+        "h.2.post_attention_layernorm.bias": "model_00004-of-00072.safetensors",
+        "h.2.post_attention_layernorm.weight": "model_00004-of-00072.safetensors",
+        "h.2.self_attention.dense.bias": "model_00004-of-00072.safetensors",
+        "h.2.self_attention.dense.weight": "model_00004-of-00072.safetensors",
+        "h.2.self_attention.query_key_value.bias": "model_00004-of-00072.safetensors",
+        "h.2.self_attention.query_key_value.weight": "model_00004-of-00072.safetensors",
+        "h.20.input_layernorm.bias": "model_00022-of-00072.safetensors",
+        "h.20.input_layernorm.weight": "model_00022-of-00072.safetensors",
+        "h.20.mlp.dense_4h_to_h.bias": "model_00022-of-00072.safetensors",
+        "h.20.mlp.dense_4h_to_h.weight": "model_00022-of-00072.safetensors",
+        "h.20.mlp.dense_h_to_4h.bias": "model_00022-of-00072.safetensors",
+        "h.20.mlp.dense_h_to_4h.weight": "model_00022-of-00072.safetensors",
+        "h.20.post_attention_layernorm.bias": "model_00022-of-00072.safetensors",
+        "h.20.post_attention_layernorm.weight": "model_00022-of-00072.safetensors",
+        "h.20.self_attention.dense.bias": "model_00022-of-00072.safetensors",
+        "h.20.self_attention.dense.weight": "model_00022-of-00072.safetensors",
+        "h.20.self_attention.query_key_value.bias": "model_00022-of-00072.safetensors",
+        "h.20.self_attention.query_key_value.weight": "model_00022-of-00072.safetensors",
+        "h.21.input_layernorm.bias": "model_00023-of-00072.safetensors",
+        "h.21.input_layernorm.weight": "model_00023-of-00072.safetensors",
+        "h.21.mlp.dense_4h_to_h.bias": "model_00023-of-00072.safetensors",
+        "h.21.mlp.dense_4h_to_h.weight": "model_00023-of-00072.safetensors",
+        "h.21.mlp.dense_h_to_4h.bias": "model_00023-of-00072.safetensors",
+        "h.21.mlp.dense_h_to_4h.weight": "model_00023-of-00072.safetensors",
+        "h.21.post_attention_layernorm.bias": "model_00023-of-00072.safetensors",
+        "h.21.post_attention_layernorm.weight": "model_00023-of-00072.safetensors",
+        "h.21.self_attention.dense.bias": "model_00023-of-00072.safetensors",
+        "h.21.self_attention.dense.weight": "model_00023-of-00072.safetensors",
+        "h.21.self_attention.query_key_value.bias": "model_00023-of-00072.safetensors",
+        "h.21.self_attention.query_key_value.weight": "model_00023-of-00072.safetensors",
+        "h.22.input_layernorm.bias": "model_00024-of-00072.safetensors",
+        "h.22.input_layernorm.weight": "model_00024-of-00072.safetensors",
+        "h.22.mlp.dense_4h_to_h.bias": "model_00024-of-00072.safetensors",
+        "h.22.mlp.dense_4h_to_h.weight": "model_00024-of-00072.safetensors",
+        "h.22.mlp.dense_h_to_4h.bias": "model_00024-of-00072.safetensors",
+        "h.22.mlp.dense_h_to_4h.weight": "model_00024-of-00072.safetensors",
+        "h.22.post_attention_layernorm.bias": "model_00024-of-00072.safetensors",
+        "h.22.post_attention_layernorm.weight": "model_00024-of-00072.safetensors",
+        "h.22.self_attention.dense.bias": "model_00024-of-00072.safetensors",
+        "h.22.self_attention.dense.weight": "model_00024-of-00072.safetensors",
+        "h.22.self_attention.query_key_value.bias": "model_00024-of-00072.safetensors",
+        "h.22.self_attention.query_key_value.weight": "model_00024-of-00072.safetensors",
+        "h.23.input_layernorm.bias": "model_00025-of-00072.safetensors",
+        "h.23.input_layernorm.weight": "model_00025-of-00072.safetensors",
+        "h.23.mlp.dense_4h_to_h.bias": "model_00025-of-00072.safetensors",
+        "h.23.mlp.dense_4h_to_h.weight": "model_00025-of-00072.safetensors",
+        "h.23.mlp.dense_h_to_4h.bias": "model_00025-of-00072.safetensors",
+        "h.23.mlp.dense_h_to_4h.weight": "model_00025-of-00072.safetensors",
+        "h.23.post_attention_layernorm.bias": "model_00025-of-00072.safetensors",
+        "h.23.post_attention_layernorm.weight": "model_00025-of-00072.safetensors",
+        "h.23.self_attention.dense.bias": "model_00025-of-00072.safetensors",
+        "h.23.self_attention.dense.weight": "model_00025-of-00072.safetensors",
+        "h.23.self_attention.query_key_value.bias": "model_00025-of-00072.safetensors",
+        "h.23.self_attention.query_key_value.weight": "model_00025-of-00072.safetensors",
+        "h.24.input_layernorm.bias": "model_00026-of-00072.safetensors",
+        "h.24.input_layernorm.weight": "model_00026-of-00072.safetensors",
+        "h.24.mlp.dense_4h_to_h.bias": "model_00026-of-00072.safetensors",
+        "h.24.mlp.dense_4h_to_h.weight": "model_00026-of-00072.safetensors",
+        "h.24.mlp.dense_h_to_4h.bias": "model_00026-of-00072.safetensors",
+        "h.24.mlp.dense_h_to_4h.weight": "model_00026-of-00072.safetensors",
+        "h.24.post_attention_layernorm.bias": "model_00026-of-00072.safetensors",
+        "h.24.post_attention_layernorm.weight": "model_00026-of-00072.safetensors",
+        "h.24.self_attention.dense.bias": "model_00026-of-00072.safetensors",
+        "h.24.self_attention.dense.weight": "model_00026-of-00072.safetensors",
+        "h.24.self_attention.query_key_value.bias": "model_00026-of-00072.safetensors",
+        "h.24.self_attention.query_key_value.weight": "model_00026-of-00072.safetensors",
+        "h.25.input_layernorm.bias": "model_00027-of-00072.safetensors",
+        "h.25.input_layernorm.weight": "model_00027-of-00072.safetensors",
+        "h.25.mlp.dense_4h_to_h.bias": "model_00027-of-00072.safetensors",
+        "h.25.mlp.dense_4h_to_h.weight": "model_00027-of-00072.safetensors",
+        "h.25.mlp.dense_h_to_4h.bias": "model_00027-of-00072.safetensors",
+        "h.25.mlp.dense_h_to_4h.weight": "model_00027-of-00072.safetensors",
+        "h.25.post_attention_layernorm.bias": "model_00027-of-00072.safetensors",
+        "h.25.post_attention_layernorm.weight": "model_00027-of-00072.safetensors",
+        "h.25.self_attention.dense.bias": "model_00027-of-00072.safetensors",
+        "h.25.self_attention.dense.weight": "model_00027-of-00072.safetensors",
+        "h.25.self_attention.query_key_value.bias": "model_00027-of-00072.safetensors",
+        "h.25.self_attention.query_key_value.weight": "model_00027-of-00072.safetensors",
+        "h.26.input_layernorm.bias": "model_00028-of-00072.safetensors",
+        "h.26.input_layernorm.weight": "model_00028-of-00072.safetensors",
+        "h.26.mlp.dense_4h_to_h.bias": "model_00028-of-00072.safetensors",
+        "h.26.mlp.dense_4h_to_h.weight": "model_00028-of-00072.safetensors",
+        "h.26.mlp.dense_h_to_4h.bias": "model_00028-of-00072.safetensors",
+        "h.26.mlp.dense_h_to_4h.weight": "model_00028-of-00072.safetensors",
+        "h.26.post_attention_layernorm.bias": "model_00028-of-00072.safetensors",
+        "h.26.post_attention_layernorm.weight": "model_00028-of-00072.safetensors",
+        "h.26.self_attention.dense.bias": "model_00028-of-00072.safetensors",
+        "h.26.self_attention.dense.weight": "model_00028-of-00072.safetensors",
+        "h.26.self_attention.query_key_value.bias": "model_00028-of-00072.safetensors",
+        "h.26.self_attention.query_key_value.weight": "model_00028-of-00072.safetensors",
+        "h.27.input_layernorm.bias": "model_00029-of-00072.safetensors",
+        "h.27.input_layernorm.weight": "model_00029-of-00072.safetensors",
+        "h.27.mlp.dense_4h_to_h.bias": "model_00029-of-00072.safetensors",
+        "h.27.mlp.dense_4h_to_h.weight": "model_00029-of-00072.safetensors",
+        "h.27.mlp.dense_h_to_4h.bias": "model_00029-of-00072.safetensors",
+        "h.27.mlp.dense_h_to_4h.weight": "model_00029-of-00072.safetensors",
+        "h.27.post_attention_layernorm.bias": "model_00029-of-00072.safetensors",
+        "h.27.post_attention_layernorm.weight": "model_00029-of-00072.safetensors",
+        "h.27.self_attention.dense.bias": "model_00029-of-00072.safetensors",
+        "h.27.self_attention.dense.weight": "model_00029-of-00072.safetensors",
+        "h.27.self_attention.query_key_value.bias": "model_00029-of-00072.safetensors",
+        "h.27.self_attention.query_key_value.weight": "model_00029-of-00072.safetensors",
+        "h.28.input_layernorm.bias": "model_00030-of-00072.safetensors",
+        "h.28.input_layernorm.weight": "model_00030-of-00072.safetensors",
+        "h.28.mlp.dense_4h_to_h.bias": "model_00030-of-00072.safetensors",
+        "h.28.mlp.dense_4h_to_h.weight": "model_00030-of-00072.safetensors",
+        "h.28.mlp.dense_h_to_4h.bias": "model_00030-of-00072.safetensors",
+        "h.28.mlp.dense_h_to_4h.weight": "model_00030-of-00072.safetensors",
+        "h.28.post_attention_layernorm.bias": "model_00030-of-00072.safetensors",
+        "h.28.post_attention_layernorm.weight": "model_00030-of-00072.safetensors",
+        "h.28.self_attention.dense.bias": "model_00030-of-00072.safetensors",
+        "h.28.self_attention.dense.weight": "model_00030-of-00072.safetensors",
+        "h.28.self_attention.query_key_value.bias": "model_00030-of-00072.safetensors",
+        "h.28.self_attention.query_key_value.weight": "model_00030-of-00072.safetensors",
+        "h.29.input_layernorm.bias": "model_00031-of-00072.safetensors",
+        "h.29.input_layernorm.weight": "model_00031-of-00072.safetensors",
+        "h.29.mlp.dense_4h_to_h.bias": "model_00031-of-00072.safetensors",
+        "h.29.mlp.dense_4h_to_h.weight": "model_00031-of-00072.safetensors",
+        "h.29.mlp.dense_h_to_4h.bias": "model_00031-of-00072.safetensors",
+        "h.29.mlp.dense_h_to_4h.weight": "model_00031-of-00072.safetensors",
+        "h.29.post_attention_layernorm.bias": "model_00031-of-00072.safetensors",
+        "h.29.post_attention_layernorm.weight": "model_00031-of-00072.safetensors",
+        "h.29.self_attention.dense.bias": "model_00031-of-00072.safetensors",
+        "h.29.self_attention.dense.weight": "model_00031-of-00072.safetensors",
+        "h.29.self_attention.query_key_value.bias": "model_00031-of-00072.safetensors",
+        "h.29.self_attention.query_key_value.weight": "model_00031-of-00072.safetensors",
+        "h.3.input_layernorm.bias": "model_00005-of-00072.safetensors",
+        "h.3.input_layernorm.weight": "model_00005-of-00072.safetensors",
+        "h.3.mlp.dense_4h_to_h.bias": "model_00005-of-00072.safetensors",
+        "h.3.mlp.dense_4h_to_h.weight": "model_00005-of-00072.safetensors",
+        "h.3.mlp.dense_h_to_4h.bias": "model_00005-of-00072.safetensors",
+        "h.3.mlp.dense_h_to_4h.weight": "model_00005-of-00072.safetensors",
+        "h.3.post_attention_layernorm.bias": "model_00005-of-00072.safetensors",
+        "h.3.post_attention_layernorm.weight": "model_00005-of-00072.safetensors",
+        "h.3.self_attention.dense.bias": "model_00005-of-00072.safetensors",
+        "h.3.self_attention.dense.weight": "model_00005-of-00072.safetensors",
+        "h.3.self_attention.query_key_value.bias": "model_00005-of-00072.safetensors",
+        "h.3.self_attention.query_key_value.weight": "model_00005-of-00072.safetensors",
+        "h.30.input_layernorm.bias": "model_00032-of-00072.safetensors",
+        "h.30.input_layernorm.weight": "model_00032-of-00072.safetensors",
+        "h.30.mlp.dense_4h_to_h.bias": "model_00032-of-00072.safetensors",
+        "h.30.mlp.dense_4h_to_h.weight": "model_00032-of-00072.safetensors",
+        "h.30.mlp.dense_h_to_4h.bias": "model_00032-of-00072.safetensors",
+        "h.30.mlp.dense_h_to_4h.weight": "model_00032-of-00072.safetensors",
+        "h.30.post_attention_layernorm.bias": "model_00032-of-00072.safetensors",
+        "h.30.post_attention_layernorm.weight": "model_00032-of-00072.safetensors",
+        "h.30.self_attention.dense.bias": "model_00032-of-00072.safetensors",
+        "h.30.self_attention.dense.weight": "model_00032-of-00072.safetensors",
+        "h.30.self_attention.query_key_value.bias": "model_00032-of-00072.safetensors",
+        "h.30.self_attention.query_key_value.weight": "model_00032-of-00072.safetensors",
+        "h.31.input_layernorm.bias": "model_00033-of-00072.safetensors",
+        "h.31.input_layernorm.weight": "model_00033-of-00072.safetensors",
+        "h.31.mlp.dense_4h_to_h.bias": "model_00033-of-00072.safetensors",
+        "h.31.mlp.dense_4h_to_h.weight": "model_00033-of-00072.safetensors",
+        "h.31.mlp.dense_h_to_4h.bias": "model_00033-of-00072.safetensors",
+        "h.31.mlp.dense_h_to_4h.weight": "model_00033-of-00072.safetensors",
+        "h.31.post_attention_layernorm.bias": "model_00033-of-00072.safetensors",
+        "h.31.post_attention_layernorm.weight": "model_00033-of-00072.safetensors",
+        "h.31.self_attention.dense.bias": "model_00033-of-00072.safetensors",
+        "h.31.self_attention.dense.weight": "model_00033-of-00072.safetensors",
+        "h.31.self_attention.query_key_value.bias": "model_00033-of-00072.safetensors",
+        "h.31.self_attention.query_key_value.weight": "model_00033-of-00072.safetensors",
+        "h.32.input_layernorm.bias": "model_00034-of-00072.safetensors",
+        "h.32.input_layernorm.weight": "model_00034-of-00072.safetensors",
+        "h.32.mlp.dense_4h_to_h.bias": "model_00034-of-00072.safetensors",
+        "h.32.mlp.dense_4h_to_h.weight": "model_00034-of-00072.safetensors",
+        "h.32.mlp.dense_h_to_4h.bias": "model_00034-of-00072.safetensors",
+        "h.32.mlp.dense_h_to_4h.weight": "model_00034-of-00072.safetensors",
+        "h.32.post_attention_layernorm.bias": "model_00034-of-00072.safetensors",
+        "h.32.post_attention_layernorm.weight": "model_00034-of-00072.safetensors",
+        "h.32.self_attention.dense.bias": "model_00034-of-00072.safetensors",
+        "h.32.self_attention.dense.weight": "model_00034-of-00072.safetensors",
+        "h.32.self_attention.query_key_value.bias": "model_00034-of-00072.safetensors",
+        "h.32.self_attention.query_key_value.weight": "model_00034-of-00072.safetensors",
+        "h.33.input_layernorm.bias": "model_00035-of-00072.safetensors",
+        "h.33.input_layernorm.weight": "model_00035-of-00072.safetensors",
+        "h.33.mlp.dense_4h_to_h.bias": "model_00035-of-00072.safetensors",
+        "h.33.mlp.dense_4h_to_h.weight": "model_00035-of-00072.safetensors",
+        "h.33.mlp.dense_h_to_4h.bias": "model_00035-of-00072.safetensors",
+        "h.33.mlp.dense_h_to_4h.weight": "model_00035-of-00072.safetensors",
+        "h.33.post_attention_layernorm.bias": "model_00035-of-00072.safetensors",
+        "h.33.post_attention_layernorm.weight": "model_00035-of-00072.safetensors",
+        "h.33.self_attention.dense.bias": "model_00035-of-00072.safetensors",
+        "h.33.self_attention.dense.weight": "model_00035-of-00072.safetensors",
+        "h.33.self_attention.query_key_value.bias": "model_00035-of-00072.safetensors",
+        "h.33.self_attention.query_key_value.weight": "model_00035-of-00072.safetensors",
+        "h.34.input_layernorm.bias": "model_00036-of-00072.safetensors",
+        "h.34.input_layernorm.weight": "model_00036-of-00072.safetensors",
+        "h.34.mlp.dense_4h_to_h.bias": "model_00036-of-00072.safetensors",
+        "h.34.mlp.dense_4h_to_h.weight": "model_00036-of-00072.safetensors",
+        "h.34.mlp.dense_h_to_4h.bias": "model_00036-of-00072.safetensors",
+        "h.34.mlp.dense_h_to_4h.weight": "model_00036-of-00072.safetensors",
+        "h.34.post_attention_layernorm.bias": "model_00036-of-00072.safetensors",
+        "h.34.post_attention_layernorm.weight": "model_00036-of-00072.safetensors",
+        "h.34.self_attention.dense.bias": "model_00036-of-00072.safetensors",
+        "h.34.self_attention.dense.weight": "model_00036-of-00072.safetensors",
+        "h.34.self_attention.query_key_value.bias": "model_00036-of-00072.safetensors",
+        "h.34.self_attention.query_key_value.weight": "model_00036-of-00072.safetensors",
+        "h.35.input_layernorm.bias": "model_00037-of-00072.safetensors",
+        "h.35.input_layernorm.weight": "model_00037-of-00072.safetensors",
+        "h.35.mlp.dense_4h_to_h.bias": "model_00037-of-00072.safetensors",
+        "h.35.mlp.dense_4h_to_h.weight": "model_00037-of-00072.safetensors",
+        "h.35.mlp.dense_h_to_4h.bias": "model_00037-of-00072.safetensors",
+        "h.35.mlp.dense_h_to_4h.weight": "model_00037-of-00072.safetensors",
+        "h.35.post_attention_layernorm.bias": "model_00037-of-00072.safetensors",
+        "h.35.post_attention_layernorm.weight": "model_00037-of-00072.safetensors",
+        "h.35.self_attention.dense.bias": "model_00037-of-00072.safetensors",
+        "h.35.self_attention.dense.weight": "model_00037-of-00072.safetensors",
+        "h.35.self_attention.query_key_value.bias": "model_00037-of-00072.safetensors",
+        "h.35.self_attention.query_key_value.weight": "model_00037-of-00072.safetensors",
+        "h.36.input_layernorm.bias": "model_00038-of-00072.safetensors",
+        "h.36.input_layernorm.weight": "model_00038-of-00072.safetensors",
+        "h.36.mlp.dense_4h_to_h.bias": "model_00038-of-00072.safetensors",
+        "h.36.mlp.dense_4h_to_h.weight": "model_00038-of-00072.safetensors",
+        "h.36.mlp.dense_h_to_4h.bias": "model_00038-of-00072.safetensors",
+        "h.36.mlp.dense_h_to_4h.weight": "model_00038-of-00072.safetensors",
+        "h.36.post_attention_layernorm.bias": "model_00038-of-00072.safetensors",
+        "h.36.post_attention_layernorm.weight": "model_00038-of-00072.safetensors",
+        "h.36.self_attention.dense.bias": "model_00038-of-00072.safetensors",
+        "h.36.self_attention.dense.weight": "model_00038-of-00072.safetensors",
+        "h.36.self_attention.query_key_value.bias": "model_00038-of-00072.safetensors",
+        "h.36.self_attention.query_key_value.weight": "model_00038-of-00072.safetensors",
+        "h.37.input_layernorm.bias": "model_00039-of-00072.safetensors",
+        "h.37.input_layernorm.weight": "model_00039-of-00072.safetensors",
+        "h.37.mlp.dense_4h_to_h.bias": "model_00039-of-00072.safetensors",
+        "h.37.mlp.dense_4h_to_h.weight": "model_00039-of-00072.safetensors",
+        "h.37.mlp.dense_h_to_4h.bias": "model_00039-of-00072.safetensors",
+        "h.37.mlp.dense_h_to_4h.weight": "model_00039-of-00072.safetensors",
+        "h.37.post_attention_layernorm.bias": "model_00039-of-00072.safetensors",
+        "h.37.post_attention_layernorm.weight": "model_00039-of-00072.safetensors",
+        "h.37.self_attention.dense.bias": "model_00039-of-00072.safetensors",
+        "h.37.self_attention.dense.weight": "model_00039-of-00072.safetensors",
+        "h.37.self_attention.query_key_value.bias": "model_00039-of-00072.safetensors",
+        "h.37.self_attention.query_key_value.weight": "model_00039-of-00072.safetensors",
+        "h.38.input_layernorm.bias": "model_00040-of-00072.safetensors",
+        "h.38.input_layernorm.weight": "model_00040-of-00072.safetensors",
+        "h.38.mlp.dense_4h_to_h.bias": "model_00040-of-00072.safetensors",
+        "h.38.mlp.dense_4h_to_h.weight": "model_00040-of-00072.safetensors",
+        "h.38.mlp.dense_h_to_4h.bias": "model_00040-of-00072.safetensors",
+        "h.38.mlp.dense_h_to_4h.weight": "model_00040-of-00072.safetensors",
+        "h.38.post_attention_layernorm.bias": "model_00040-of-00072.safetensors",
+        "h.38.post_attention_layernorm.weight": "model_00040-of-00072.safetensors",
+        "h.38.self_attention.dense.bias": "model_00040-of-00072.safetensors",
+        "h.38.self_attention.dense.weight": "model_00040-of-00072.safetensors",
+        "h.38.self_attention.query_key_value.bias": "model_00040-of-00072.safetensors",
+        "h.38.self_attention.query_key_value.weight": "model_00040-of-00072.safetensors",
+        "h.39.input_layernorm.bias": "model_00041-of-00072.safetensors",
+        "h.39.input_layernorm.weight": "model_00041-of-00072.safetensors",
+        "h.39.mlp.dense_4h_to_h.bias": "model_00041-of-00072.safetensors",
+        "h.39.mlp.dense_4h_to_h.weight": "model_00041-of-00072.safetensors",
+        "h.39.mlp.dense_h_to_4h.bias": "model_00041-of-00072.safetensors",
+        "h.39.mlp.dense_h_to_4h.weight": "model_00041-of-00072.safetensors",
+        "h.39.post_attention_layernorm.bias": "model_00041-of-00072.safetensors",
+        "h.39.post_attention_layernorm.weight": "model_00041-of-00072.safetensors",
+        "h.39.self_attention.dense.bias": "model_00041-of-00072.safetensors",
+        "h.39.self_attention.dense.weight": "model_00041-of-00072.safetensors",
+        "h.39.self_attention.query_key_value.bias": "model_00041-of-00072.safetensors",
+        "h.39.self_attention.query_key_value.weight": "model_00041-of-00072.safetensors",
+        "h.4.input_layernorm.bias": "model_00006-of-00072.safetensors",
+        "h.4.input_layernorm.weight": "model_00006-of-00072.safetensors",
+        "h.4.mlp.dense_4h_to_h.bias": "model_00006-of-00072.safetensors",
+        "h.4.mlp.dense_4h_to_h.weight": "model_00006-of-00072.safetensors",
+        "h.4.mlp.dense_h_to_4h.bias": "model_00006-of-00072.safetensors",
+        "h.4.mlp.dense_h_to_4h.weight": "model_00006-of-00072.safetensors",
+        "h.4.post_attention_layernorm.bias": "model_00006-of-00072.safetensors",
+        "h.4.post_attention_layernorm.weight": "model_00006-of-00072.safetensors",
+        "h.4.self_attention.dense.bias": "model_00006-of-00072.safetensors",
+        "h.4.self_attention.dense.weight": "model_00006-of-00072.safetensors",
+        "h.4.self_attention.query_key_value.bias": "model_00006-of-00072.safetensors",
+        "h.4.self_attention.query_key_value.weight": "model_00006-of-00072.safetensors",
+        "h.40.input_layernorm.bias": "model_00042-of-00072.safetensors",
+        "h.40.input_layernorm.weight": "model_00042-of-00072.safetensors",
+        "h.40.mlp.dense_4h_to_h.bias": "model_00042-of-00072.safetensors",
+        "h.40.mlp.dense_4h_to_h.weight": "model_00042-of-00072.safetensors",
+        "h.40.mlp.dense_h_to_4h.bias": "model_00042-of-00072.safetensors",
+        "h.40.mlp.dense_h_to_4h.weight": "model_00042-of-00072.safetensors",
+        "h.40.post_attention_layernorm.bias": "model_00042-of-00072.safetensors",
+        "h.40.post_attention_layernorm.weight": "model_00042-of-00072.safetensors",
+        "h.40.self_attention.dense.bias": "model_00042-of-00072.safetensors",
+        "h.40.self_attention.dense.weight": "model_00042-of-00072.safetensors",
+        "h.40.self_attention.query_key_value.bias": "model_00042-of-00072.safetensors",
+        "h.40.self_attention.query_key_value.weight": "model_00042-of-00072.safetensors",
+        "h.41.input_layernorm.bias": "model_00043-of-00072.safetensors",
+        "h.41.input_layernorm.weight": "model_00043-of-00072.safetensors",
+        "h.41.mlp.dense_4h_to_h.bias": "model_00043-of-00072.safetensors",
+        "h.41.mlp.dense_4h_to_h.weight": "model_00043-of-00072.safetensors",
+        "h.41.mlp.dense_h_to_4h.bias": "model_00043-of-00072.safetensors",
+        "h.41.mlp.dense_h_to_4h.weight": "model_00043-of-00072.safetensors",
+        "h.41.post_attention_layernorm.bias": "model_00043-of-00072.safetensors",
+        "h.41.post_attention_layernorm.weight": "model_00043-of-00072.safetensors",
+        "h.41.self_attention.dense.bias": "model_00043-of-00072.safetensors",
+        "h.41.self_attention.dense.weight": "model_00043-of-00072.safetensors",
+        "h.41.self_attention.query_key_value.bias": "model_00043-of-00072.safetensors",
+        "h.41.self_attention.query_key_value.weight": "model_00043-of-00072.safetensors",
+        "h.42.input_layernorm.bias": "model_00044-of-00072.safetensors",
+        "h.42.input_layernorm.weight": "model_00044-of-00072.safetensors",
+        "h.42.mlp.dense_4h_to_h.bias": "model_00044-of-00072.safetensors",
+        "h.42.mlp.dense_4h_to_h.weight": "model_00044-of-00072.safetensors",
+        "h.42.mlp.dense_h_to_4h.bias": "model_00044-of-00072.safetensors",
+        "h.42.mlp.dense_h_to_4h.weight": "model_00044-of-00072.safetensors",
+        "h.42.post_attention_layernorm.bias": "model_00044-of-00072.safetensors",
+        "h.42.post_attention_layernorm.weight": "model_00044-of-00072.safetensors",
+        "h.42.self_attention.dense.bias": "model_00044-of-00072.safetensors",
+        "h.42.self_attention.dense.weight": "model_00044-of-00072.safetensors",
+        "h.42.self_attention.query_key_value.bias": "model_00044-of-00072.safetensors",
+        "h.42.self_attention.query_key_value.weight": "model_00044-of-00072.safetensors",
+        "h.43.input_layernorm.bias": "model_00045-of-00072.safetensors",
+        "h.43.input_layernorm.weight": "model_00045-of-00072.safetensors",
+        "h.43.mlp.dense_4h_to_h.bias": "model_00045-of-00072.safetensors",
+        "h.43.mlp.dense_4h_to_h.weight": "model_00045-of-00072.safetensors",
+        "h.43.mlp.dense_h_to_4h.bias": "model_00045-of-00072.safetensors",
+        "h.43.mlp.dense_h_to_4h.weight": "model_00045-of-00072.safetensors",
+        "h.43.post_attention_layernorm.bias": "model_00045-of-00072.safetensors",
+        "h.43.post_attention_layernorm.weight": "model_00045-of-00072.safetensors",
+        "h.43.self_attention.dense.bias": "model_00045-of-00072.safetensors",
+        "h.43.self_attention.dense.weight": "model_00045-of-00072.safetensors",
+        "h.43.self_attention.query_key_value.bias": "model_00045-of-00072.safetensors",
+        "h.43.self_attention.query_key_value.weight": "model_00045-of-00072.safetensors",
+        "h.44.input_layernorm.bias": "model_00046-of-00072.safetensors",
+        "h.44.input_layernorm.weight": "model_00046-of-00072.safetensors",
+        "h.44.mlp.dense_4h_to_h.bias": "model_00046-of-00072.safetensors",
+        "h.44.mlp.dense_4h_to_h.weight": "model_00046-of-00072.safetensors",
+        "h.44.mlp.dense_h_to_4h.bias": "model_00046-of-00072.safetensors",
+        "h.44.mlp.dense_h_to_4h.weight": "model_00046-of-00072.safetensors",
+        "h.44.post_attention_layernorm.bias": "model_00046-of-00072.safetensors",
+        "h.44.post_attention_layernorm.weight": "model_00046-of-00072.safetensors",
+        "h.44.self_attention.dense.bias": "model_00046-of-00072.safetensors",
+        "h.44.self_attention.dense.weight": "model_00046-of-00072.safetensors",
+        "h.44.self_attention.query_key_value.bias": "model_00046-of-00072.safetensors",
+        "h.44.self_attention.query_key_value.weight": "model_00046-of-00072.safetensors",
+        "h.45.input_layernorm.bias": "model_00047-of-00072.safetensors",
+        "h.45.input_layernorm.weight": "model_00047-of-00072.safetensors",
+        "h.45.mlp.dense_4h_to_h.bias": "model_00047-of-00072.safetensors",
+        "h.45.mlp.dense_4h_to_h.weight": "model_00047-of-00072.safetensors",
+        "h.45.mlp.dense_h_to_4h.bias": "model_00047-of-00072.safetensors",
+        "h.45.mlp.dense_h_to_4h.weight": "model_00047-of-00072.safetensors",
+        "h.45.post_attention_layernorm.bias": "model_00047-of-00072.safetensors",
+        "h.45.post_attention_layernorm.weight": "model_00047-of-00072.safetensors",
+        "h.45.self_attention.dense.bias": "model_00047-of-00072.safetensors",
+        "h.45.self_attention.dense.weight": "model_00047-of-00072.safetensors",
+        "h.45.self_attention.query_key_value.bias": "model_00047-of-00072.safetensors",
+        "h.45.self_attention.query_key_value.weight": "model_00047-of-00072.safetensors",
+        "h.46.input_layernorm.bias": "model_00048-of-00072.safetensors",
+        "h.46.input_layernorm.weight": "model_00048-of-00072.safetensors",
+        "h.46.mlp.dense_4h_to_h.bias": "model_00048-of-00072.safetensors",
+        "h.46.mlp.dense_4h_to_h.weight": "model_00048-of-00072.safetensors",
+        "h.46.mlp.dense_h_to_4h.bias": "model_00048-of-00072.safetensors",
+        "h.46.mlp.dense_h_to_4h.weight": "model_00048-of-00072.safetensors",
+        "h.46.post_attention_layernorm.bias": "model_00048-of-00072.safetensors",
+        "h.46.post_attention_layernorm.weight": "model_00048-of-00072.safetensors",
+        "h.46.self_attention.dense.bias": "model_00048-of-00072.safetensors",
+        "h.46.self_attention.dense.weight": "model_00048-of-00072.safetensors",
+        "h.46.self_attention.query_key_value.bias": "model_00048-of-00072.safetensors",
+        "h.46.self_attention.query_key_value.weight": "model_00048-of-00072.safetensors",
+        "h.47.input_layernorm.bias": "model_00049-of-00072.safetensors",
+        "h.47.input_layernorm.weight": "model_00049-of-00072.safetensors",
+        "h.47.mlp.dense_4h_to_h.bias": "model_00049-of-00072.safetensors",
+        "h.47.mlp.dense_4h_to_h.weight": "model_00049-of-00072.safetensors",
+        "h.47.mlp.dense_h_to_4h.bias": "model_00049-of-00072.safetensors",
+        "h.47.mlp.dense_h_to_4h.weight": "model_00049-of-00072.safetensors",
+        "h.47.post_attention_layernorm.bias": "model_00049-of-00072.safetensors",
+        "h.47.post_attention_layernorm.weight": "model_00049-of-00072.safetensors",
+        "h.47.self_attention.dense.bias": "model_00049-of-00072.safetensors",
+        "h.47.self_attention.dense.weight": "model_00049-of-00072.safetensors",
+        "h.47.self_attention.query_key_value.bias": "model_00049-of-00072.safetensors",
+        "h.47.self_attention.query_key_value.weight": "model_00049-of-00072.safetensors",
+        "h.48.input_layernorm.bias": "model_00050-of-00072.safetensors",
+        "h.48.input_layernorm.weight": "model_00050-of-00072.safetensors",
+        "h.48.mlp.dense_4h_to_h.bias": "model_00050-of-00072.safetensors",
+        "h.48.mlp.dense_4h_to_h.weight": "model_00050-of-00072.safetensors",
+        "h.48.mlp.dense_h_to_4h.bias": "model_00050-of-00072.safetensors",
+        "h.48.mlp.dense_h_to_4h.weight": "model_00050-of-00072.safetensors",
+        "h.48.post_attention_layernorm.bias": "model_00050-of-00072.safetensors",
+        "h.48.post_attention_layernorm.weight": "model_00050-of-00072.safetensors",
+        "h.48.self_attention.dense.bias": "model_00050-of-00072.safetensors",
+        "h.48.self_attention.dense.weight": "model_00050-of-00072.safetensors",
+        "h.48.self_attention.query_key_value.bias": "model_00050-of-00072.safetensors",
+        "h.48.self_attention.query_key_value.weight": "model_00050-of-00072.safetensors",
+        "h.49.input_layernorm.bias": "model_00051-of-00072.safetensors",
+        "h.49.input_layernorm.weight": "model_00051-of-00072.safetensors",
+        "h.49.mlp.dense_4h_to_h.bias": "model_00051-of-00072.safetensors",
+        "h.49.mlp.dense_4h_to_h.weight": "model_00051-of-00072.safetensors",
+        "h.49.mlp.dense_h_to_4h.bias": "model_00051-of-00072.safetensors",
+        "h.49.mlp.dense_h_to_4h.weight": "model_00051-of-00072.safetensors",
+        "h.49.post_attention_layernorm.bias": "model_00051-of-00072.safetensors",
+        "h.49.post_attention_layernorm.weight": "model_00051-of-00072.safetensors",
+        "h.49.self_attention.dense.bias": "model_00051-of-00072.safetensors",
+        "h.49.self_attention.dense.weight": "model_00051-of-00072.safetensors",
+        "h.49.self_attention.query_key_value.bias": "model_00051-of-00072.safetensors",
+        "h.49.self_attention.query_key_value.weight": "model_00051-of-00072.safetensors",
+        "h.5.input_layernorm.bias": "model_00007-of-00072.safetensors",
+        "h.5.input_layernorm.weight": "model_00007-of-00072.safetensors",
+        "h.5.mlp.dense_4h_to_h.bias": "model_00007-of-00072.safetensors",
+        "h.5.mlp.dense_4h_to_h.weight": "model_00007-of-00072.safetensors",
+        "h.5.mlp.dense_h_to_4h.bias": "model_00007-of-00072.safetensors",
+        "h.5.mlp.dense_h_to_4h.weight": "model_00007-of-00072.safetensors",
+        "h.5.post_attention_layernorm.bias": "model_00007-of-00072.safetensors",
+        "h.5.post_attention_layernorm.weight": "model_00007-of-00072.safetensors",
+        "h.5.self_attention.dense.bias": "model_00007-of-00072.safetensors",
+        "h.5.self_attention.dense.weight": "model_00007-of-00072.safetensors",
+        "h.5.self_attention.query_key_value.bias": "model_00007-of-00072.safetensors",
+        "h.5.self_attention.query_key_value.weight": "model_00007-of-00072.safetensors",
+        "h.50.input_layernorm.bias": "model_00052-of-00072.safetensors",
+        "h.50.input_layernorm.weight": "model_00052-of-00072.safetensors",
+        "h.50.mlp.dense_4h_to_h.bias": "model_00052-of-00072.safetensors",
+        "h.50.mlp.dense_4h_to_h.weight": "model_00052-of-00072.safetensors",
+        "h.50.mlp.dense_h_to_4h.bias": "model_00052-of-00072.safetensors",
+        "h.50.mlp.dense_h_to_4h.weight": "model_00052-of-00072.safetensors",
+        "h.50.post_attention_layernorm.bias": "model_00052-of-00072.safetensors",
+        "h.50.post_attention_layernorm.weight": "model_00052-of-00072.safetensors",
+        "h.50.self_attention.dense.bias": "model_00052-of-00072.safetensors",
+        "h.50.self_attention.dense.weight": "model_00052-of-00072.safetensors",
+        "h.50.self_attention.query_key_value.bias": "model_00052-of-00072.safetensors",
+        "h.50.self_attention.query_key_value.weight": "model_00052-of-00072.safetensors",
+        "h.51.input_layernorm.bias": "model_00053-of-00072.safetensors",
+        "h.51.input_layernorm.weight": "model_00053-of-00072.safetensors",
+        "h.51.mlp.dense_4h_to_h.bias": "model_00053-of-00072.safetensors",
+        "h.51.mlp.dense_4h_to_h.weight": "model_00053-of-00072.safetensors",
+        "h.51.mlp.dense_h_to_4h.bias": "model_00053-of-00072.safetensors",
+        "h.51.mlp.dense_h_to_4h.weight": "model_00053-of-00072.safetensors",
+        "h.51.post_attention_layernorm.bias": "model_00053-of-00072.safetensors",
+        "h.51.post_attention_layernorm.weight": "model_00053-of-00072.safetensors",
+        "h.51.self_attention.dense.bias": "model_00053-of-00072.safetensors",
+        "h.51.self_attention.dense.weight": "model_00053-of-00072.safetensors",
+        "h.51.self_attention.query_key_value.bias": "model_00053-of-00072.safetensors",
+        "h.51.self_attention.query_key_value.weight": "model_00053-of-00072.safetensors",
+        "h.52.input_layernorm.bias": "model_00054-of-00072.safetensors",
+        "h.52.input_layernorm.weight": "model_00054-of-00072.safetensors",
+        "h.52.mlp.dense_4h_to_h.bias": "model_00054-of-00072.safetensors",
+        "h.52.mlp.dense_4h_to_h.weight": "model_00054-of-00072.safetensors",
+        "h.52.mlp.dense_h_to_4h.bias": "model_00054-of-00072.safetensors",
+        "h.52.mlp.dense_h_to_4h.weight": "model_00054-of-00072.safetensors",
+        "h.52.post_attention_layernorm.bias": "model_00054-of-00072.safetensors",
+        "h.52.post_attention_layernorm.weight": "model_00054-of-00072.safetensors",
+        "h.52.self_attention.dense.bias": "model_00054-of-00072.safetensors",
+        "h.52.self_attention.dense.weight": "model_00054-of-00072.safetensors",
+        "h.52.self_attention.query_key_value.bias": "model_00054-of-00072.safetensors",
+        "h.52.self_attention.query_key_value.weight": "model_00054-of-00072.safetensors",
+        "h.53.input_layernorm.bias": "model_00055-of-00072.safetensors",
+        "h.53.input_layernorm.weight": "model_00055-of-00072.safetensors",
+        "h.53.mlp.dense_4h_to_h.bias": "model_00055-of-00072.safetensors",
+        "h.53.mlp.dense_4h_to_h.weight": "model_00055-of-00072.safetensors",
+        "h.53.mlp.dense_h_to_4h.bias": "model_00055-of-00072.safetensors",
+        "h.53.mlp.dense_h_to_4h.weight": "model_00055-of-00072.safetensors",
+        "h.53.post_attention_layernorm.bias": "model_00055-of-00072.safetensors",
+        "h.53.post_attention_layernorm.weight": "model_00055-of-00072.safetensors",
+        "h.53.self_attention.dense.bias": "model_00055-of-00072.safetensors",
+        "h.53.self_attention.dense.weight": "model_00055-of-00072.safetensors",
+        "h.53.self_attention.query_key_value.bias": "model_00055-of-00072.safetensors",
+        "h.53.self_attention.query_key_value.weight": "model_00055-of-00072.safetensors",
+        "h.54.input_layernorm.bias": "model_00056-of-00072.safetensors",
+        "h.54.input_layernorm.weight": "model_00056-of-00072.safetensors",
+        "h.54.mlp.dense_4h_to_h.bias": "model_00056-of-00072.safetensors",
+        "h.54.mlp.dense_4h_to_h.weight": "model_00056-of-00072.safetensors",
+        "h.54.mlp.dense_h_to_4h.bias": "model_00056-of-00072.safetensors",
+        "h.54.mlp.dense_h_to_4h.weight": "model_00056-of-00072.safetensors",
+        "h.54.post_attention_layernorm.bias": "model_00056-of-00072.safetensors",
+        "h.54.post_attention_layernorm.weight": "model_00056-of-00072.safetensors",
+        "h.54.self_attention.dense.bias": "model_00056-of-00072.safetensors",
+        "h.54.self_attention.dense.weight": "model_00056-of-00072.safetensors",
+        "h.54.self_attention.query_key_value.bias": "model_00056-of-00072.safetensors",
+        "h.54.self_attention.query_key_value.weight": "model_00056-of-00072.safetensors",
+        "h.55.input_layernorm.bias": "model_00057-of-00072.safetensors",
+        "h.55.input_layernorm.weight": "model_00057-of-00072.safetensors",
+        "h.55.mlp.dense_4h_to_h.bias": "model_00057-of-00072.safetensors",
+        "h.55.mlp.dense_4h_to_h.weight": "model_00057-of-00072.safetensors",
+        "h.55.mlp.dense_h_to_4h.bias": "model_00057-of-00072.safetensors",
+        "h.55.mlp.dense_h_to_4h.weight": "model_00057-of-00072.safetensors",
+        "h.55.post_attention_layernorm.bias": "model_00057-of-00072.safetensors",
+        "h.55.post_attention_layernorm.weight": "model_00057-of-00072.safetensors",
+        "h.55.self_attention.dense.bias": "model_00057-of-00072.safetensors",
+        "h.55.self_attention.dense.weight": "model_00057-of-00072.safetensors",
+        "h.55.self_attention.query_key_value.bias": "model_00057-of-00072.safetensors",
+        "h.55.self_attention.query_key_value.weight": "model_00057-of-00072.safetensors",
+        "h.56.input_layernorm.bias": "model_00058-of-00072.safetensors",
+        "h.56.input_layernorm.weight": "model_00058-of-00072.safetensors",
+        "h.56.mlp.dense_4h_to_h.bias": "model_00058-of-00072.safetensors",
+        "h.56.mlp.dense_4h_to_h.weight": "model_00058-of-00072.safetensors",
+        "h.56.mlp.dense_h_to_4h.bias": "model_00058-of-00072.safetensors",
+        "h.56.mlp.dense_h_to_4h.weight": "model_00058-of-00072.safetensors",
+        "h.56.post_attention_layernorm.bias": "model_00058-of-00072.safetensors",
+        "h.56.post_attention_layernorm.weight": "model_00058-of-00072.safetensors",
+        "h.56.self_attention.dense.bias": "model_00058-of-00072.safetensors",
+        "h.56.self_attention.dense.weight": "model_00058-of-00072.safetensors",
+        "h.56.self_attention.query_key_value.bias": "model_00058-of-00072.safetensors",
+        "h.56.self_attention.query_key_value.weight": "model_00058-of-00072.safetensors",
+        "h.57.input_layernorm.bias": "model_00059-of-00072.safetensors",
+        "h.57.input_layernorm.weight": "model_00059-of-00072.safetensors",
+        "h.57.mlp.dense_4h_to_h.bias": "model_00059-of-00072.safetensors",
+        "h.57.mlp.dense_4h_to_h.weight": "model_00059-of-00072.safetensors",
+        "h.57.mlp.dense_h_to_4h.bias": "model_00059-of-00072.safetensors",
+        "h.57.mlp.dense_h_to_4h.weight": "model_00059-of-00072.safetensors",
+        "h.57.post_attention_layernorm.bias": "model_00059-of-00072.safetensors",
+        "h.57.post_attention_layernorm.weight": "model_00059-of-00072.safetensors",
+        "h.57.self_attention.dense.bias": "model_00059-of-00072.safetensors",
+        "h.57.self_attention.dense.weight": "model_00059-of-00072.safetensors",
+        "h.57.self_attention.query_key_value.bias": "model_00059-of-00072.safetensors",
+        "h.57.self_attention.query_key_value.weight": "model_00059-of-00072.safetensors",
+        "h.58.input_layernorm.bias": "model_00060-of-00072.safetensors",
+        "h.58.input_layernorm.weight": "model_00060-of-00072.safetensors",
+        "h.58.mlp.dense_4h_to_h.bias": "model_00060-of-00072.safetensors",
+        "h.58.mlp.dense_4h_to_h.weight": "model_00060-of-00072.safetensors",
+        "h.58.mlp.dense_h_to_4h.bias": "model_00060-of-00072.safetensors",
+        "h.58.mlp.dense_h_to_4h.weight": "model_00060-of-00072.safetensors",
+        "h.58.post_attention_layernorm.bias": "model_00060-of-00072.safetensors",
+        "h.58.post_attention_layernorm.weight": "model_00060-of-00072.safetensors",
+        "h.58.self_attention.dense.bias": "model_00060-of-00072.safetensors",
+        "h.58.self_attention.dense.weight": "model_00060-of-00072.safetensors",
+        "h.58.self_attention.query_key_value.bias": "model_00060-of-00072.safetensors",
+        "h.58.self_attention.query_key_value.weight": "model_00060-of-00072.safetensors",
+        "h.59.input_layernorm.bias": "model_00061-of-00072.safetensors",
+        "h.59.input_layernorm.weight": "model_00061-of-00072.safetensors",
+        "h.59.mlp.dense_4h_to_h.bias": "model_00061-of-00072.safetensors",
+        "h.59.mlp.dense_4h_to_h.weight": "model_00061-of-00072.safetensors",
+        "h.59.mlp.dense_h_to_4h.bias": "model_00061-of-00072.safetensors",
+        "h.59.mlp.dense_h_to_4h.weight": "model_00061-of-00072.safetensors",
+        "h.59.post_attention_layernorm.bias": "model_00061-of-00072.safetensors",
+        "h.59.post_attention_layernorm.weight": "model_00061-of-00072.safetensors",
+        "h.59.self_attention.dense.bias": "model_00061-of-00072.safetensors",
+        "h.59.self_attention.dense.weight": "model_00061-of-00072.safetensors",
+        "h.59.self_attention.query_key_value.bias": "model_00061-of-00072.safetensors",
+        "h.59.self_attention.query_key_value.weight": "model_00061-of-00072.safetensors",
+        "h.6.input_layernorm.bias": "model_00008-of-00072.safetensors",
+        "h.6.input_layernorm.weight": "model_00008-of-00072.safetensors",
+        "h.6.mlp.dense_4h_to_h.bias": "model_00008-of-00072.safetensors",
+        "h.6.mlp.dense_4h_to_h.weight": "model_00008-of-00072.safetensors",
+        "h.6.mlp.dense_h_to_4h.bias": "model_00008-of-00072.safetensors",
+        "h.6.mlp.dense_h_to_4h.weight": "model_00008-of-00072.safetensors",
+        "h.6.post_attention_layernorm.bias": "model_00008-of-00072.safetensors",
+        "h.6.post_attention_layernorm.weight": "model_00008-of-00072.safetensors",
+        "h.6.self_attention.dense.bias": "model_00008-of-00072.safetensors",
+        "h.6.self_attention.dense.weight": "model_00008-of-00072.safetensors",
+        "h.6.self_attention.query_key_value.bias": "model_00008-of-00072.safetensors",
+        "h.6.self_attention.query_key_value.weight": "model_00008-of-00072.safetensors",
+        "h.60.input_layernorm.bias": "model_00062-of-00072.safetensors",
+        "h.60.input_layernorm.weight": "model_00062-of-00072.safetensors",
+        "h.60.mlp.dense_4h_to_h.bias": "model_00062-of-00072.safetensors",
+        "h.60.mlp.dense_4h_to_h.weight": "model_00062-of-00072.safetensors",
+        "h.60.mlp.dense_h_to_4h.bias": "model_00062-of-00072.safetensors",
+        "h.60.mlp.dense_h_to_4h.weight": "model_00062-of-00072.safetensors",
+        "h.60.post_attention_layernorm.bias": "model_00062-of-00072.safetensors",
+        "h.60.post_attention_layernorm.weight": "model_00062-of-00072.safetensors",
+        "h.60.self_attention.dense.bias": "model_00062-of-00072.safetensors",
+        "h.60.self_attention.dense.weight": "model_00062-of-00072.safetensors",
+        "h.60.self_attention.query_key_value.bias": "model_00062-of-00072.safetensors",
+        "h.60.self_attention.query_key_value.weight": "model_00062-of-00072.safetensors",
+        "h.61.input_layernorm.bias": "model_00063-of-00072.safetensors",
+        "h.61.input_layernorm.weight": "model_00063-of-00072.safetensors",
+        "h.61.mlp.dense_4h_to_h.bias": "model_00063-of-00072.safetensors",
+        "h.61.mlp.dense_4h_to_h.weight": "model_00063-of-00072.safetensors",
+        "h.61.mlp.dense_h_to_4h.bias": "model_00063-of-00072.safetensors",
+        "h.61.mlp.dense_h_to_4h.weight": "model_00063-of-00072.safetensors",
+        "h.61.post_attention_layernorm.bias": "model_00063-of-00072.safetensors",
+        "h.61.post_attention_layernorm.weight": "model_00063-of-00072.safetensors",
+        "h.61.self_attention.dense.bias": "model_00063-of-00072.safetensors",
+        "h.61.self_attention.dense.weight": "model_00063-of-00072.safetensors",
+        "h.61.self_attention.query_key_value.bias": "model_00063-of-00072.safetensors",
+        "h.61.self_attention.query_key_value.weight": "model_00063-of-00072.safetensors",
+        "h.62.input_layernorm.bias": "model_00064-of-00072.safetensors",
+        "h.62.input_layernorm.weight": "model_00064-of-00072.safetensors",
+        "h.62.mlp.dense_4h_to_h.bias": "model_00064-of-00072.safetensors",
+        "h.62.mlp.dense_4h_to_h.weight": "model_00064-of-00072.safetensors",
+        "h.62.mlp.dense_h_to_4h.bias": "model_00064-of-00072.safetensors",
+        "h.62.mlp.dense_h_to_4h.weight": "model_00064-of-00072.safetensors",
+        "h.62.post_attention_layernorm.bias": "model_00064-of-00072.safetensors",
+        "h.62.post_attention_layernorm.weight": "model_00064-of-00072.safetensors",
+        "h.62.self_attention.dense.bias": "model_00064-of-00072.safetensors",
+        "h.62.self_attention.dense.weight": "model_00064-of-00072.safetensors",
+        "h.62.self_attention.query_key_value.bias": "model_00064-of-00072.safetensors",
+        "h.62.self_attention.query_key_value.weight": "model_00064-of-00072.safetensors",
+        "h.63.input_layernorm.bias": "model_00065-of-00072.safetensors",
+        "h.63.input_layernorm.weight": "model_00065-of-00072.safetensors",
+        "h.63.mlp.dense_4h_to_h.bias": "model_00065-of-00072.safetensors",
+        "h.63.mlp.dense_4h_to_h.weight": "model_00065-of-00072.safetensors",
+        "h.63.mlp.dense_h_to_4h.bias": "model_00065-of-00072.safetensors",
+        "h.63.mlp.dense_h_to_4h.weight": "model_00065-of-00072.safetensors",
+        "h.63.post_attention_layernorm.bias": "model_00065-of-00072.safetensors",
+        "h.63.post_attention_layernorm.weight": "model_00065-of-00072.safetensors",
+        "h.63.self_attention.dense.bias": "model_00065-of-00072.safetensors",
+        "h.63.self_attention.dense.weight": "model_00065-of-00072.safetensors",
+        "h.63.self_attention.query_key_value.bias": "model_00065-of-00072.safetensors",
+        "h.63.self_attention.query_key_value.weight": "model_00065-of-00072.safetensors",
+        "h.64.input_layernorm.bias": "model_00066-of-00072.safetensors",
+        "h.64.input_layernorm.weight": "model_00066-of-00072.safetensors",
+        "h.64.mlp.dense_4h_to_h.bias": "model_00066-of-00072.safetensors",
+        "h.64.mlp.dense_4h_to_h.weight": "model_00066-of-00072.safetensors",
+        "h.64.mlp.dense_h_to_4h.bias": "model_00066-of-00072.safetensors",
+        "h.64.mlp.dense_h_to_4h.weight": "model_00066-of-00072.safetensors",
+        "h.64.post_attention_layernorm.bias": "model_00066-of-00072.safetensors",
+        "h.64.post_attention_layernorm.weight": "model_00066-of-00072.safetensors",
+        "h.64.self_attention.dense.bias": "model_00066-of-00072.safetensors",
+        "h.64.self_attention.dense.weight": "model_00066-of-00072.safetensors",
+        "h.64.self_attention.query_key_value.bias": "model_00066-of-00072.safetensors",
+        "h.64.self_attention.query_key_value.weight": "model_00066-of-00072.safetensors",
+        "h.65.input_layernorm.bias": "model_00067-of-00072.safetensors",
+        "h.65.input_layernorm.weight": "model_00067-of-00072.safetensors",
+        "h.65.mlp.dense_4h_to_h.bias": "model_00067-of-00072.safetensors",
+        "h.65.mlp.dense_4h_to_h.weight": "model_00067-of-00072.safetensors",
+        "h.65.mlp.dense_h_to_4h.bias": "model_00067-of-00072.safetensors",
+        "h.65.mlp.dense_h_to_4h.weight": "model_00067-of-00072.safetensors",
+        "h.65.post_attention_layernorm.bias": "model_00067-of-00072.safetensors",
+        "h.65.post_attention_layernorm.weight": "model_00067-of-00072.safetensors",
+        "h.65.self_attention.dense.bias": "model_00067-of-00072.safetensors",
+        "h.65.self_attention.dense.weight": "model_00067-of-00072.safetensors",
+        "h.65.self_attention.query_key_value.bias": "model_00067-of-00072.safetensors",
+        "h.65.self_attention.query_key_value.weight": "model_00067-of-00072.safetensors",
+        "h.66.input_layernorm.bias": "model_00068-of-00072.safetensors",
+        "h.66.input_layernorm.weight": "model_00068-of-00072.safetensors",
+        "h.66.mlp.dense_4h_to_h.bias": "model_00068-of-00072.safetensors",
+        "h.66.mlp.dense_4h_to_h.weight": "model_00068-of-00072.safetensors",
+        "h.66.mlp.dense_h_to_4h.bias": "model_00068-of-00072.safetensors",
+        "h.66.mlp.dense_h_to_4h.weight": "model_00068-of-00072.safetensors",
+        "h.66.post_attention_layernorm.bias": "model_00068-of-00072.safetensors",
+        "h.66.post_attention_layernorm.weight": "model_00068-of-00072.safetensors",
+        "h.66.self_attention.dense.bias": "model_00068-of-00072.safetensors",
+        "h.66.self_attention.dense.weight": "model_00068-of-00072.safetensors",
+        "h.66.self_attention.query_key_value.bias": "model_00068-of-00072.safetensors",
+        "h.66.self_attention.query_key_value.weight": "model_00068-of-00072.safetensors",
+        "h.67.input_layernorm.bias": "model_00069-of-00072.safetensors",
+        "h.67.input_layernorm.weight": "model_00069-of-00072.safetensors",
+        "h.67.mlp.dense_4h_to_h.bias": "model_00069-of-00072.safetensors",
+        "h.67.mlp.dense_4h_to_h.weight": "model_00069-of-00072.safetensors",
+        "h.67.mlp.dense_h_to_4h.bias": "model_00069-of-00072.safetensors",
+        "h.67.mlp.dense_h_to_4h.weight": "model_00069-of-00072.safetensors",
+        "h.67.post_attention_layernorm.bias": "model_00069-of-00072.safetensors",
+        "h.67.post_attention_layernorm.weight": "model_00069-of-00072.safetensors",
+        "h.67.self_attention.dense.bias": "model_00069-of-00072.safetensors",
+        "h.67.self_attention.dense.weight": "model_00069-of-00072.safetensors",
+        "h.67.self_attention.query_key_value.bias": "model_00069-of-00072.safetensors",
+        "h.67.self_attention.query_key_value.weight": "model_00069-of-00072.safetensors",
+        "h.68.input_layernorm.bias": "model_00070-of-00072.safetensors",
+        "h.68.input_layernorm.weight": "model_00070-of-00072.safetensors",
+        "h.68.mlp.dense_4h_to_h.bias": "model_00070-of-00072.safetensors",
+        "h.68.mlp.dense_4h_to_h.weight": "model_00070-of-00072.safetensors",
+        "h.68.mlp.dense_h_to_4h.bias": "model_00070-of-00072.safetensors",
+        "h.68.mlp.dense_h_to_4h.weight": "model_00070-of-00072.safetensors",
+        "h.68.post_attention_layernorm.bias": "model_00070-of-00072.safetensors",
+        "h.68.post_attention_layernorm.weight": "model_00070-of-00072.safetensors",
+        "h.68.self_attention.dense.bias": "model_00070-of-00072.safetensors",
+        "h.68.self_attention.dense.weight": "model_00070-of-00072.safetensors",
+        "h.68.self_attention.query_key_value.bias": "model_00070-of-00072.safetensors",
+        "h.68.self_attention.query_key_value.weight": "model_00070-of-00072.safetensors",
+        "h.69.input_layernorm.bias": "model_00071-of-00072.safetensors",
+        "h.69.input_layernorm.weight": "model_00071-of-00072.safetensors",
+        "h.69.mlp.dense_4h_to_h.bias": "model_00071-of-00072.safetensors",
+        "h.69.mlp.dense_4h_to_h.weight": "model_00071-of-00072.safetensors",
+        "h.69.mlp.dense_h_to_4h.bias": "model_00071-of-00072.safetensors",
+        "h.69.mlp.dense_h_to_4h.weight": "model_00071-of-00072.safetensors",
+        "h.69.post_attention_layernorm.bias": "model_00071-of-00072.safetensors",
+        "h.69.post_attention_layernorm.weight": "model_00071-of-00072.safetensors",
+        "h.69.self_attention.dense.bias": "model_00071-of-00072.safetensors",
+        "h.69.self_attention.dense.weight": "model_00071-of-00072.safetensors",
+        "h.69.self_attention.query_key_value.bias": "model_00071-of-00072.safetensors",
+        "h.69.self_attention.query_key_value.weight": "model_00071-of-00072.safetensors",
+        "h.7.input_layernorm.bias": "model_00009-of-00072.safetensors",
+        "h.7.input_layernorm.weight": "model_00009-of-00072.safetensors",
+        "h.7.mlp.dense_4h_to_h.bias": "model_00009-of-00072.safetensors",
+        "h.7.mlp.dense_4h_to_h.weight": "model_00009-of-00072.safetensors",
+        "h.7.mlp.dense_h_to_4h.bias": "model_00009-of-00072.safetensors",
+        "h.7.mlp.dense_h_to_4h.weight": "model_00009-of-00072.safetensors",
+        "h.7.post_attention_layernorm.bias": "model_00009-of-00072.safetensors",
+        "h.7.post_attention_layernorm.weight": "model_00009-of-00072.safetensors",
+        "h.7.self_attention.dense.bias": "model_00009-of-00072.safetensors",
+        "h.7.self_attention.dense.weight": "model_00009-of-00072.safetensors",
+        "h.7.self_attention.query_key_value.bias": "model_00009-of-00072.safetensors",
+        "h.7.self_attention.query_key_value.weight": "model_00009-of-00072.safetensors",
+        "h.8.input_layernorm.bias": "model_00010-of-00072.safetensors",
+        "h.8.input_layernorm.weight": "model_00010-of-00072.safetensors",
+        "h.8.mlp.dense_4h_to_h.bias": "model_00010-of-00072.safetensors",
+        "h.8.mlp.dense_4h_to_h.weight": "model_00010-of-00072.safetensors",
+        "h.8.mlp.dense_h_to_4h.bias": "model_00010-of-00072.safetensors",
+        "h.8.mlp.dense_h_to_4h.weight": "model_00010-of-00072.safetensors",
+        "h.8.post_attention_layernorm.bias": "model_00010-of-00072.safetensors",
+        "h.8.post_attention_layernorm.weight": "model_00010-of-00072.safetensors",
+        "h.8.self_attention.dense.bias": "model_00010-of-00072.safetensors",
+        "h.8.self_attention.dense.weight": "model_00010-of-00072.safetensors",
+        "h.8.self_attention.query_key_value.bias": "model_00010-of-00072.safetensors",
+        "h.8.self_attention.query_key_value.weight": "model_00010-of-00072.safetensors",
+        "h.9.input_layernorm.bias": "model_00011-of-00072.safetensors",
+        "h.9.input_layernorm.weight": "model_00011-of-00072.safetensors",
+        "h.9.mlp.dense_4h_to_h.bias": "model_00011-of-00072.safetensors",
+        "h.9.mlp.dense_4h_to_h.weight": "model_00011-of-00072.safetensors",
+        "h.9.mlp.dense_h_to_4h.bias": "model_00011-of-00072.safetensors",
+        "h.9.mlp.dense_h_to_4h.weight": "model_00011-of-00072.safetensors",
+        "h.9.post_attention_layernorm.bias": "model_00011-of-00072.safetensors",
+        "h.9.post_attention_layernorm.weight": "model_00011-of-00072.safetensors",
+        "h.9.self_attention.dense.bias": "model_00011-of-00072.safetensors",
+        "h.9.self_attention.dense.weight": "model_00011-of-00072.safetensors",
+        "h.9.self_attention.query_key_value.bias": "model_00011-of-00072.safetensors",
+        "h.9.self_attention.query_key_value.weight": "model_00011-of-00072.safetensors",
+        "ln_f.bias": "model_00072-of-00072.safetensors",
+        "ln_f.weight": "model_00072-of-00072.safetensors",
+        "word_embeddings.weight": "model_00001-of-00072.safetensors",
+        "word_embeddings_layernorm.bias": "model_00001-of-00072.safetensors",
+        "word_embeddings_layernorm.weight": "model_00001-of-00072.safetensors"
+    }
+}

model_00001-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ccaadb03de0ecb34f0713a81b963b99ff335107bcaa0e26f4ad21c94c3758580
+size 7193289056

model_00002-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a2f3a0fc9ed3bdae81caba85ab832ee8bee11c9df05f4347405f68d738dd8a17
+size 4932875536

model_00003-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:79b9ca2811987dac4d0eec9d3ea5a1a9a111850a6d4fcd5d697df7ae3bf2ac7a
+size 4932875536

model_00004-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:39d2203f87653f45f461ea2b92485501e41d8f5677a3693fc7ea3d9c21f8b910
+size 4932875536

model_00005-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7791b61be909694aa8fc001f38eda6b70c3684f2b5d506c82bf66956c1f0a4c5
+size 4932875536

model_00006-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:84b0bdc56c40d186bb4be617db37357d828048c7682577b2ba1f10bd851b4f0e
+size 4932875536

model_00007-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fbe8ef04324271421590367ad7e2d8ae893c3baa2a089c45a1619c136ddeb14a
+size 4932875536

model_00008-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fdd2f9eb32e517d84a573c4012085d64929166331af4fdf1d80d8f9aeb93a244
+size 4932875536

model_00009-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:43282e855865353891be19c07a05f2762ad4f3e5da7c36bf850d4117e07dad24
+size 4932875536

model_00010-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:af765a535f90dc5e603ec782896aef60e73f24ff834d33bf6a78ecb4ea2e702e
+size 4932875536

model_00011-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0c39d26d5b9b6de3f7bfbd0fe5130f903ad4bc2b98cbd511154fc212b4509c22
+size 4932875536

model_00012-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:15ccbad7526f3db1f52b59a28eb7aee7cea34e32e61112db0c3581852b64ab97
+size 4932875544

model_00013-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ad5c909b4d47c4e5b5da60184f0b1c67bcc5a12c8acbc77bae021ab45864e7f7
+size 4932875544

model_00014-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:078faaecad6b08938d3a414ed9bbf7acb05911514747117e3ada4a4d04c4a617
+size 4932875544

model_00015-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e8ca30c1f907606fe691617d4168e229f5c673d970981cff1463dce7906f45a1
+size 4932875544

model_00016-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:56642c68839f903bf8eb4fa8a495cd0648fcbdce4f39a6867c07c7b2f78f3fa8
+size 4932875544

model_00017-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ef361bd2bec63046786c43dd09122caad34936b3a80f1dc22ca5782f92b983b6
+size 4932875544

model_00018-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e9b645f95cb9803fde56919d8a39f5cf4adc8c952b83be7535ecaf2e92883a4d
+size 4932875544

model_00019-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e148bd3f2d4eaebad7f13c848789d346d9c5f50fdfc223feb514f4128b42f9e9
+size 4932875544

model_00020-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e78f285c14c298e396b9bb987c6d73fdc24b049c0ae1c0adc3a6bda8266ccf20
+size 4932875544

model_00021-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a3fa35447c4baec10e9d72eac0e3ec9ddaa0f6ef538312877e8ba087ca89cbf4
+size 4932875544

model_00022-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c55155216e0ba14d38a030fb3b1defae8f69f31b936f0d734e4f430333bee15b
+size 4932875544

model_00023-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fcc343c1472d66b2e10d8e8a46dd066180100ad8a5c7d6af879127023d3c5b52
+size 4932875544

model_00024-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b0463ccca005c64ea64c353050419b941bf82ce9f2de1a89657d8739dd00da3f
+size 4932875544

model_00025-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bec094c2d552102112319925bdc4e1539ebec80a34a90a79403d07cb38b6286e
+size 4932875544

model_00026-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7914d6fd8c549ab2905a075c000ec63750b268667b260505055dba8bd15a0265
+size 4932875544

model_00027-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:75b955edbb9eeaa1eaf24820aa16817628c2ab554a512e74874a680bf3886dc3
+size 4932875544

model_00028-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4d2d0329f410e2f590dc7dad4cb8ee7a80e3c737afa74a69e41ce13d99a05934
+size 4932875544

model_00029-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7ec31b130d248c057b8e0a187566dfaf71a5a1360e317d672d40286a27370fad
+size 4932875544

model_00030-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7dd9336a2676603518021eb4549c437ec850ac820c95bcdfb0561aa72be25eca
+size 4932875544

model_00031-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9dbda61f9d27ec958293ae6c2153e516988d811d18d6e89cf77a1ff13195571d
+size 4932875544

model_00032-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2fbc545336993f49b5af362f9fc020e36642edd28cede52616a1aa6894cd5162
+size 4932875544

model_00033-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:86bef57091aa4f28564aea885aadfa9a4673e7baaf3c2b01b9ef6d20f8c877b1
+size 4932875544

model_00034-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6e76c425a74a2dd21bb80e9661f77b46dd55a8a103b025c988c1c57318f88a63
+size 4932875544

model_00035-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9b3bf545bbe4181175769c28385a10022a11c85d2bab8e9f9539bc653ef745e6
+size 4932875544

model_00036-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dcd0a9bc706213d7a9182826cdbe39031de81ac6235b5d6d24c38e517cfc67a3
+size 4932875544

model_00037-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d6c58c29e0b2ec3881e76efceb0e28948d5bcb7fd005cf136cc7658d502d616f
+size 4932875544

model_00038-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ce879f851a6f6464e8bdd88882d8ffb1992c68293c8577c5a3982809193127b3
+size 4932875544

model_00039-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e560d9f57d83aab78efa1d753988be9baba30feafa45473fd25704845074aa62
+size 4932875544

model_00040-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3ce6b7830bde0f065b0f7d1c2de65b00c40da3f908dce613bbfa8fc9510c4969
+size 4932875544

model_00041-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:453c494dc146aded6e508af05b3c2b62b69163351243ab6a5e3b1f7317f2d3cd
+size 4932875544

model_00042-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8fd8a7d9ae15f488dfc01d8ece2855f8fb8a450d32fcc46f5f01cb61389495b9
+size 4932875544

model_00043-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:526e230f35cc6ae726770e0192f7f53f3229dbb3ea5b22ee4f49366b0f94f9c5
+size 4932875544

model_00044-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e0821ff2f6ddb0c1379dc3d4e82563cffd72e4b07262b967e007df32758de4c3
+size 4932875544

model_00045-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ad10fc79545aca3a50f453cecd8e470e6138c71d2485a71609020efaa367e0dc
+size 4932875544

model_00046-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:79a7aaff1326c0e09d735e7ac6d6720bb9ebe6b007a4699c381cd25f6f35b3f8
+size 4932875544

model_00047-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c3b8a18ecf6d583f9d15bd05d0372b1393c615440fea0a4647dec4b5971beec4
+size 4932875544

model_00048-of-00072.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c6cbd6bea94083891a75fef77f77ad76cf4566cbd69803b6124db9a9f4f33247
+size 4932875544