Add files using upload-large-folder tool

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.gitattributes +93 -0
config.json +30 -0
generation_config.json +7 -0
merges.txt +0 -0
model.layers.0.input_layernorm.weight +0 -0
model.layers.0.post_attention_layernorm.weight +0 -0
model.layers.1.input_layernorm.weight +0 -0
model.layers.1.post_attention_layernorm.weight +0 -0
model.layers.10.input_layernorm.weight +0 -0
model.layers.10.post_attention_layernorm.weight +0 -0
model.layers.11.input_layernorm.weight +0 -0
model.layers.11.post_attention_layernorm.weight +0 -0
model.layers.12.input_layernorm.weight +0 -0
model.layers.12.post_attention_layernorm.weight +0 -0
model.layers.13.input_layernorm.weight +0 -0
model.layers.13.post_attention_layernorm.weight +0 -0
model.layers.14.input_layernorm.weight +0 -0
model.layers.14.post_attention_layernorm.weight +0 -0
model.layers.15.input_layernorm.weight +0 -0
model.layers.15.post_attention_layernorm.weight +0 -0
model.layers.16.input_layernorm.weight +0 -0
model.layers.16.post_attention_layernorm.weight +0 -0
model.layers.17.input_layernorm.weight +0 -0
model.layers.17.post_attention_layernorm.weight +0 -0
model.layers.18.input_layernorm.weight +0 -0
model.layers.18.post_attention_layernorm.weight +0 -0
model.layers.19.input_layernorm.weight +0 -0
model.layers.19.post_attention_layernorm.weight +0 -0
model.layers.2.input_layernorm.weight +0 -0
model.layers.2.post_attention_layernorm.weight +0 -0
model.layers.20.input_layernorm.weight +0 -0
model.layers.20.post_attention_layernorm.weight +0 -0
model.layers.21.input_layernorm.weight +0 -0
model.layers.21.post_attention_layernorm.weight +0 -0
model.layers.22.input_layernorm.weight +0 -0
model.layers.22.post_attention_layernorm.weight +0 -0
model.layers.23.input_layernorm.weight +0 -0
model.layers.23.post_attention_layernorm.weight +0 -0
model.layers.3.input_layernorm.weight +0 -0
model.layers.3.post_attention_layernorm.weight +0 -0
model.layers.4.input_layernorm.weight +0 -0
model.layers.4.post_attention_layernorm.weight +0 -0
model.layers.5.input_layernorm.weight +0 -0
model.layers.5.post_attention_layernorm.weight +0 -0
model.layers.6.input_layernorm.weight +0 -0
model.layers.6.post_attention_layernorm.weight +0 -0
model.layers.7.input_layernorm.weight +0 -0
model.layers.7.post_attention_layernorm.weight +0 -0
model.layers.8.input_layernorm.weight +0 -0
model.layers.8.post_attention_layernorm.weight +0 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,96 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5365 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5335 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5190 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5244 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5248 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5598 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5103 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4930 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5163 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4954 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5596 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5278 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5044 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5597 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4957 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5336 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5481 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5221 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4959 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5250 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5418 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5186 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5366 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5277 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5129 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5015 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5131 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5043 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5477 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5247 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5191 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5074 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5511 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5274 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5218 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5534 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5624 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4984 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5479 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5189 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5625 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5623 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5507 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5482 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4987 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5279 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5592 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5451 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5042 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5161 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5192 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5099 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5391 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5422 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5506 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5361 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5041 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5564 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5393 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5104 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5158 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4989 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5394 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5447 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5076 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5568 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5188 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5539 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5538 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5159 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5453 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5478 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4983 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5334 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5302 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5362 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5018 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5508 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5333 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5275 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5133 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5105 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4956 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5249 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5305 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5102 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5509 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5128 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5220 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4960 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5245 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5017 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5215 filter=lfs diff=lfs merge=lfs -text

config.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "_attn_implementation_autoset": true,
+  "_name_or_path": "numind/NuExtract-1.5-smol",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "bos_token_id": 0,
+  "eos_token_id": 0,
+  "head_dim": 64,
+  "hidden_act": "silu",
+  "hidden_size": 2048,
+  "initializer_range": 0.02,
+  "intermediate_size": 8192,
+  "max_position_embeddings": 8192,
+  "mlp_bias": false,
+  "model_type": "llama",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 24,
+  "num_key_value_heads": 32,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": null,
+  "rope_theta": 130000,
+  "tie_word_embeddings": true,
+  "transformers_version": "4.46.2",
+  "use_cache": true,
+  "vocab_size": 49152
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "_from_model_config": true,
+  "bos_token_id": 0,
+  "eos_token_id": 0,
+  "pad_token_id": 0,
+  "transformers_version": "4.46.2"
+}

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

model.layers.0.input_layernorm.weight ADDED Viewed