Add new files to repository

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.gitattributes +114 -0
config.json +39 -0
generation_config.json +12 -0
model.embed_tokens.weight +3 -0
model.layers.0.input_layernorm.weight +0 -0
model.layers.0.post_attention_layernorm.weight +0 -0
model.layers.1.input_layernorm.weight +0 -0
model.layers.1.post_attention_layernorm.weight +0 -0
model.layers.10.input_layernorm.weight +0 -0
model.layers.10.post_attention_layernorm.weight +0 -0
model.layers.11.input_layernorm.weight +0 -0
model.layers.11.post_attention_layernorm.weight +0 -0
model.layers.12.input_layernorm.weight +0 -0
model.layers.12.post_attention_layernorm.weight +0 -0
model.layers.13.input_layernorm.weight +0 -0
model.layers.13.post_attention_layernorm.weight +0 -0
model.layers.14.input_layernorm.weight +0 -0
model.layers.14.post_attention_layernorm.weight +0 -0
model.layers.15.input_layernorm.weight +0 -0
model.layers.15.post_attention_layernorm.weight +0 -0
model.layers.2.input_layernorm.weight +0 -0
model.layers.2.post_attention_layernorm.weight +0 -0
model.layers.3.input_layernorm.weight +0 -0
model.layers.3.post_attention_layernorm.weight +0 -0
model.layers.4.input_layernorm.weight +0 -0
model.layers.4.post_attention_layernorm.weight +0 -0
model.layers.5.input_layernorm.weight +0 -0
model.layers.5.post_attention_layernorm.weight +0 -0
model.layers.6.input_layernorm.weight +0 -0
model.layers.6.post_attention_layernorm.weight +0 -0
model.layers.7.input_layernorm.weight +0 -0
model.layers.7.post_attention_layernorm.weight +0 -0
model.layers.8.input_layernorm.weight +0 -0
model.layers.8.post_attention_layernorm.weight +0 -0
model.layers.9.input_layernorm.weight +0 -0
model.layers.9.post_attention_layernorm.weight +0 -0
model.norm.weight +0 -0
model.onnx +3 -0
model_quantized.onnx +3 -0
onnx__MatMul_4851 +3 -0
onnx__MatMul_4852 +3 -0
onnx__MatMul_4853 +3 -0
onnx__MatMul_4878 +3 -0
onnx__MatMul_4879 +3 -0
onnx__MatMul_4880 +3 -0
onnx__MatMul_4881 +3 -0
onnx__MatMul_4882 +3 -0
onnx__MatMul_4883 +3 -0
onnx__MatMul_4884 +3 -0
onnx__MatMul_4909 +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,117 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+model.embed_tokens.weight filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4851 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4852 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4853 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4878 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4879 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4880 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4881 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4882 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4883 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4884 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4909 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4910 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4911 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4912 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4913 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4914 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4915 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4940 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4941 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4942 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4943 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4944 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4945 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4946 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4971 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4972 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4973 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4974 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4975 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4976 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_4977 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5002 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5003 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5004 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5005 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5006 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5007 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5008 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5033 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5034 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5035 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5036 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5037 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5038 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5039 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5064 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5065 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5066 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5067 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5068 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5069 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5070 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5095 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5096 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5097 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5098 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5099 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5100 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5101 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5126 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5127 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5128 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5129 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5130 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5131 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5132 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5157 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5158 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5159 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5160 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5161 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5162 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5163 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5188 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5189 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5190 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5191 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5192 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5193 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5194 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5219 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5220 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5221 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5222 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5223 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5224 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5225 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5250 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5251 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5252 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5253 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5254 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5255 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5256 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5281 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5282 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5283 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5284 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5285 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5286 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5287 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5312 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5313 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5314 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5315 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5316 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5317 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5318 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5343 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5344 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5345 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5346 filter=lfs diff=lfs merge=lfs -text
+onnx__MatMul_5347 filter=lfs diff=lfs merge=lfs -text

config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "_name_or_path": "unsloth/Llama-3.2-1B-Instruct",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "bos_token_id": 128000,
+  "eos_token_id": [
+    128001,
+    128008,
+    128009
+  ],
+  "head_dim": 64,
+  "hidden_act": "silu",
+  "hidden_size": 2048,
+  "initializer_range": 0.02,
+  "intermediate_size": 8192,
+  "max_position_embeddings": 131072,
+  "mlp_bias": false,
+  "model_type": "llama",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 16,
+  "num_key_value_heads": 8,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "factor": 32.0,
+    "high_freq_factor": 4.0,
+    "low_freq_factor": 1.0,
+    "original_max_position_embeddings": 8192,
+    "rope_type": "llama3"
+  },
+  "rope_theta": 500000.0,
+  "tie_word_embeddings": true,
+  "transformers_version": "4.44.2",
+  "use_cache": true,
+  "vocab_size": 128256
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+  "bos_token_id": 128000,
+  "do_sample": true,
+  "eos_token_id": [
+    128001,
+    128008,
+    128009
+  ],
+  "temperature": 0.6,
+  "top_p": 0.9,
+  "transformers_version": "4.44.2"
+}

model.embed_tokens.weight ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d1602ecf8f4e69be360b87191d1a4f6aa4b3fa26002ebf0ea058208613737400
+size 1050673152

model.layers.0.input_layernorm.weight ADDED Viewed