JeremyHibiki
/

bge-m3-onnx-o4

Feature Extraction

Model card Files Files and versions Community

JeremyHibiki commited on 27 days ago

Commit

06034d2

·

verified ·

1 Parent(s): 2a3db96

Upload 4 files

Files changed (3) hide show

config.json +2 -2
model.onnx +2 -2
ort_config.json +1 -3

config.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "_name_or_path": "/data/models/bge-m3-onnx-o4",
   "architectures": [
-    "XLMRobertaModel"
   ],
   "attention_probs_dropout_prob": 0.1,
   "bos_token_id": 0,
@@ -21,7 +21,7 @@
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
-  "transformers_version": "4.47.1",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 250002

 {
   "_name_or_path": "/data/models/bge-m3-onnx-o4",
   "architectures": [
+    "BGEM3InferenceModel"
   ],
   "attention_probs_dropout_prob": 0.1,
   "bos_token_id": 0,
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
+  "transformers_version": "4.46.3",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 250002

model.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:25df7a972d3911279330631a429979da4d56a4786384ad0637d26060970282a3
-size 355288

 version https://git-lfs.github.com/spec/v1
+oid sha256:978c4f95cfbfa29afb0cf2fe5b249a456154a6d9ff5bf93beeb369ec07fcfa3f
+size 352864

ort_config.json CHANGED Viewed

@@ -25,15 +25,13 @@
     "enable_transformers_specific_optimizations": true,
     "fp16": true,
     "no_attention_mask": false,
-    "optimization_level": 2,
     "optimize_for_gpu": true,
     "optimize_with_onnxruntime_only": null,
     "use_mask_index": false,
     "use_multi_head_attention": false,
     "use_raw_attention_mask": false
   },
-  "optimum_version": "1.17.0",
   "quantization": {},
-  "transformers_version": "4.47.1",
   "use_external_data_format": true
 }

     "enable_transformers_specific_optimizations": true,
     "fp16": true,
     "no_attention_mask": false,
+    "optimization_level": 99,
     "optimize_for_gpu": true,
     "optimize_with_onnxruntime_only": null,
     "use_mask_index": false,
     "use_multi_head_attention": false,
     "use_raw_attention_mask": false
   },
   "quantization": {},
   "use_external_data_format": true
 }