Edit model card

SentenceTransformer based on BAAI/bge-m3

This is a sentence-transformers model finetuned from BAAI/bge-m3 on the json dataset. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: BAAI/bge-m3
  • Maximum Sequence Length: 350 tokens
  • Output Dimensionality: 1024 tokens
  • Similarity Function: Cosine Similarity
  • Training Dataset:
    • json

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 350, 'do_lower_case': True}) with Transformer model: XLMRobertaModel 
  (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("tanbinh2210/bge-m3-zalo-trained-0_8-zalo")
# Run inference
sentences = [
    'Mức xử phạt hành vi công chứng bản dịch không đính kèm bản sao của bản chính được quy định như thế nào?',
    'Điều 14. Hành vi vi phạm quy định của công chứng viên về công chứng bản dịch: bản cần dịch. 4. Hình thức xử phạt bổ sung: a) Tước quyền sử dụng thẻ công chứng viên từ 01 tháng đến 03 tháng đối với hành vi vi phạm quy định tại các điểm b và d khoản 3 Điều này; b) Tước quyền sử dụng thẻ công chứng viên từ 03 tháng đến 06 tháng đối với hành vi vi phạm quy định tại các điểm a, c, đ và e khoản 3 Điều này. 5. Biện pháp khắc phục hậu quả: a) Buộc nộp lại số lợi bất hợp pháp có được do thực hiện hành vi vi phạm quy định tại khoản 3 Điều này; b) Buộc tổ chức hành nghề công chứng đang lưu trữ hồ sơ công chứng thông báo trên cổng thông tin điện tử của Sở Tư pháp nơi đặt trụ sở về bản dịch đã được công chứng quy định tại các điểm c, đ và e khoản 3 Điều này.',
    'Điều 428. Đơn phương chấm dứt thực hiện hợp đồng: 1. Một bên có quyền đơn phương chấm dứt thực hiện hợp đồng và không phải bồi thường thiệt hại khi bên kia vi phạm nghiêm trọng nghĩa vụ trong hợp đồng hoặc các bên có thỏa thuận hoặc pháp luật có quy định. 2. Bên đơn phương chấm dứt thực hiện hợp đồng phải thông báo ngay cho bên kia biết về việc chấm dứt hợp đồng, nếu không thông báo mà gây thiệt hại thì phải bồi thường. 3. Khi hợp đồng bị đơn phương chấm dứt thực hiện thì hợp đồng chấm dứt kể từ thời điểm bên kia nhận được thông báo chấm dứt. Các bên không phải tiếp tục thực hiện nghĩa vụ, trừ thỏa thuận về phạt vi phạm, bồi thường thiệt hại và thỏa thuận về giải quyết tranh chấp. Bên đã thực hiện nghĩa vụ có quyền yêu cầu bên kia thanh toán phần nghĩa vụ đã thực hiện. 4. Bên bị thiệt hại do hành vi không thực hiện đúng nghĩa vụ trong hợp đồng của bên kia được bồi thường. 5. Trường hợp việc đơn phương chấm dứt thực hiện hợp đồng không có căn cứ quy định tại khoản',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Training Details

Training Dataset

json

  • Dataset: json
  • Size: 10,363 training samples
  • Columns: query and pos
  • Approximate statistics based on the first 1000 samples:
    query pos
    type string string
    details
    • min: 7 tokens
    • mean: 21.77 tokens
    • max: 41 tokens
    • min: 58 tokens
    • mean: 272.76 tokens
    • max: 350 tokens
  • Samples:
    query pos
    Chỉ tuyển dụng giáo viên mầm non có bằng đại học từ năm 2021 có đúng không? Điều 3. Giáo viên mầm non hạng III - Mã số V.07.02.26: quy định về đạo đức nhà giáo; quy định về hành vi, ứng xử và trang phục. 3. Tiêu chuẩn về trình độ đào tạo, bồi dưỡng a) Có bằng tốt nghiệp cao đẳng sư phạm giáo dục mầm non trở lên; b) Có chứng chỉ bồi dưỡng theo tiêu chuẩn chức danh nghề nghiệp giáo viên mầm non hạng III (đối với giáo viên mầm non mới được tuyển dụng vào giáo viên mầm non hạng III thì phải có chứng chỉ trong thời gian 36 tháng kể từ ngày được tuyển dụng). 4. Tiêu chuẩn về năng lực chuyên môn, nghiệp vụ a) Nắm được chủ trương, đường lối, chính sách, pháp luật của Đảng, Nhà nước, quy định và yêu cầu của ngành, địa phương về giáo dục mầm non và triển khai thực hiện vào nhiệm vụ được giao; b) Thực hiện đúng chương trình giáo dục mầm non; c) Biết phối hợp với đồng nghiệp, cha mẹ trẻ em và cộng đồng trong công tác nuôi dưỡng, chăm sóc, giáo dục trẻ em; d) Biết quản lý, sử dụng, bảo quản và giữ gìn có hiệu quả tài sản cơ sở vật chất, thiết bị của nhóm/Lớp, trường; đ) Có khả năng ứng dụng công nghệ thông tin trong thực hiện các nhiệm vụ của giáo viên mầm non hạng III và có khả năng sử dụng ngoại ngữ hoặc tiếng dân tộc thiểu số trong một số nhiệm vụ cụ thể được giao.
    Trung tâm sát hạch lái xe không niêm yết mức giá các dịch vụ bị phạt bao nhiêu tiền? Điều 37. Xử phạt các hành vi vi phạm quy định về đào tạo, sát hạch lái xe: 5.000.000 đồng đến 10.000.000 đồng đối với cơ sở đào tạo lái xe, trung tâm sát hạch lái xe thực hiện một trong các hành vi vi phạm sau đây: a) Cơ sở đào tạo lái xe tổ chức tuyển sinh, đào tạo vượt quá lưu lượng quy định trong Giấy phép đào tạo lái xe; b) Cơ sở đào tạo lái xe tổ chức đào tạo lái xe ngoài địa điểm được ghi trong Giấy phép đào tạo lái xe; c) Cơ sở đào tạo lái xe không lưu trữ hoặc lưu trữ không đầy đủ hồ sơ theo quy định của 02 khóa đào tạo trở lên; d) Cơ sở đào tạo lái xe bố trí số lượng học viên tập lái trên xe tập lái vượt quá quy định; đ) Cơ sở đào tạo lái xe không có đủ hệ thống phòng học; phòng học không đủ trang thiết bị, mô hình học cụ; e) Cơ sở đào tạo lái xe không có đủ sân tập lái hoặc sân tập lái không đủ điều kiện theo quy định; g) Cơ sở đào tạo lái xe không có đủ số lượng xe tập lái các hạng để đáp ứng với lưu lượng đào tạo thực tế tại các thời điểm hoặc sử dụng xe tập lái không đúng hạng để dạy thực hành lái xe; h) Trung tâm sát hạch lái xe không niêm yết mức thu phí sát hạch, giá các dịch vụ khác theo quy định;
    Vị trí việc làm của viên chức được quy định như thế nào? Điều 7. Vị trí việc làm: 1. Vị trí việc làm là công việc hoặc nhiệm vụ gắn với chức danh nghề nghiệp hoặc chức vụ quản lý tương ứng, là căn cứ xác định số lượng người làm việc, cơ cấu viên chức để thực hiện việc tuyển dụng, sử dụng và quản lý viên chức trong đơn vị sự nghiệp công lập. 2. Chính phủ quy định nguyên tắc, phương pháp xác định vị trí việc làm, thẩm quyền, trình tự, thủ tục quyết định số lượng vị trí việc làm trong đơn vị sự nghiệp công lập.
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Evaluation Dataset

json

  • Dataset: json
  • Size: 10,363 evaluation samples
  • Columns: query and pos
  • Approximate statistics based on the first 1000 samples:
    query pos
    type string string
    details
    • min: 7 tokens
    • mean: 21.75 tokens
    • max: 41 tokens
    • min: 37 tokens
    • mean: 269.62 tokens
    • max: 350 tokens
  • Samples:
    query pos
    Theo quy định pháp luật, dẫn xuất của các loài động vật, thực vật là gì? Điều 3. Giải thích từ ngữ: mục đích thương mại hoặc vì mục đích thương mại. 18. Nuôi sinh trưởng là hình thức nuôi giữ con non, trứng của các loài động vật hoang dã khai thác từ tự nhiên để nuôi lớn, cho ấp nở thành các cá thể con trong môi trường có kiểm soát. 19. Nuôi sinh sản là hình thức nuôi giữ động vật hoang dã để sản sinh ra các thế hệ kế tiếp trong môi trường có kiểm soát. 20. Trồng cấy nhân tạo là hình thức trồng, cấy từ hạt, mầm, hợp tử, ghép cành hoặc các cách nhân giống khác thực vật hoang dã trong môi trường có kiểm soát. 21. Nguồn giống sinh sản là cá thể động vật ban đầu hợp pháp được nuôi trong cơ sở nuôi sinh sản để sản xuất ra các cá thể thế hệ kế tiếp. 22. Thế hệ F1 gồm các cá thể được sinh ra trong môi trường có kiểm soát, trong đó có ít nhất bố hoặc mẹ được khai thác từ tự nhiên. 23. Thế hệ F2 hoặc các thế hệ kế tiếp gồm các cá thể được sinh ra trong môi trường có kiểm soát bởi cặp bố, mẹ thế hệ F1 trở đi. 24. Vật dụng cá nhân, vật dụng hộ gia đình có nguồn gốc động vật, thực vật hoang dã là mẫu vật có nguồn gốc hợp pháp của cá nhân, hộ gia đình. Mẫu vật sống không được coi là vật dụng
    Hỗ trợ hoạt động khởi nghiệp doanh nghiệp khoa học và công nghệ được quy định như thế nào? Điều 5. Nội dung và mức chi ngân sách nhà nước thực hiện hỗ trợ ươm tạo doanh nghiệp khoa học và công nghệ: 1. Hỗ trợ cơ sở ươm tạo doanh nghiệp khoa học và công nghệ: Đối tượng thuộc phạm vi hỗ trợ theo quy định tại Khoản này phải đáp ứng các điều kiện quy định tại Khoản 1 Điều 9 Thông tư số 19/2016/TT-BKHCN ngày 28 tháng 10 năm 2016 của Bộ Khoa học và Công nghệ quy định quản lý Chương trình hỗ trợ phát triển doanh nghiệp khoa học và công nghệ và tổ chức khoa học và công nghệ công lập thực hiện cơ chế tự chủ, tự chịu trách nhiệm (sau đây gọi là Thông tư số 19/2016/TT-BKHCN). Các nội dung hỗ trợ như sau: a) Hỗ trợ kinh phí mua sắm các trang thiết bị dùng chung phục vụ trực tiếp hoạt động ươm tạo công nghệ, ươm tạo doanh nghiệp khoa học và công nghệ của cơ sở ươm tạo doanh nghiệp khoa học và công nghệ (sau đây gọi là cơ sở ươm tạo): Danh mục trang thiết bị dùng chung cho cơ sở ươm tạo được xác định phù hợp theo từng lĩnh vực công nghệ theo quy định của Bộ Khoa học và Công nghệ. Mức hỗ trợ kinh phí mua
    Mức án cao nhất về đồng phạm trong tội bạo loạn là bao nhiêu năm tù? Điều 1. Sửa đổi, bổ sung, bãi bỏ một số điều của Bộ luật Hình sự số 100/2015/QH13: thực vật thông thường hoặc 50 mét khối (m3) trở lên gỗ thuộc Danh mục thực vật rừng, động vật rừng nguy cấp, quý, hiếm Nhóm IIA; b) Khai thác trái phép rừng sản xuất là rừng tự nhiên 40 mét khối (m3) trở lên gỗ loài thực vật thông thường hoặc 30 mét khối (m3) trở lên gỗ thuộc Danh mục thực vật rừng, động vật rừng nguy cấp, quý, hiếm Nhóm IIA; c) Khai thác trái phép rừng phòng hộ là rừng trồng 60 mét khối (m3) trở lên gỗ loài thực vật thông thường hoặc 40 mét khối (m3) trở lên gỗ thuộc Danh mục thực vật rừng, động vật rừng nguy cấp, quý, hiếm Nhóm IIA; d) Khai thác trái phép rừng phòng hộ là rừng tự nhiên 30 mét khối (m3) trở lên gỗ loài thực vật thông thường hoặc 20 mét khối (m3) trở lên gỗ thuộc Danh mục thực vật rừng, động vật rừng nguy cấp, quý, hiếm Nhóm IIA; đ) Khai thác trái phép rừng đặc dụng là rừng trồng 40 mét khối (m3) trở lên gỗ loài thực vật thông thường hoặc 20 mét khối (m3) trở lên gỗ thuộc Danh mục thực vật rừng, động vật rừng nguy cấp, quý, hiếm Nhóm IIA; e) Khai thác trái phép rừng đặc dụng là rừng tự nhiên 15 mét khối (m3) trở lên gỗ loài thực vật thông thường hoặc 10 mét khối (m3) trở lên gỗ thuộc Danh mục thực vật
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • overwrite_output_dir: True
  • per_device_train_batch_size: 7
  • per_device_eval_batch_size: 7
  • learning_rate: 2e-05
  • num_train_epochs: 15
  • lr_scheduler_type: cosine
  • warmup_ratio: 0.1
  • fp16: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: True
  • do_predict: False
  • eval_strategy: no
  • prediction_loss_only: True
  • per_device_train_batch_size: 7
  • per_device_eval_batch_size: 7
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 2e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 15
  • max_steps: -1
  • lr_scheduler_type: cosine
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • eval_use_gather_object: False
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Click to expand
Epoch Step Training Loss
0.0794 100 0.4425
0.1589 200 0.3211
0.2383 300 0.2169
0.3177 400 0.1759
0.3971 500 0.1872
0.4766 600 0.1666
0.5560 700 0.1504
0.6354 800 0.1578
0.7149 900 0.1456
0.7943 1000 0.1393
0.8737 1100 0.1547
0.9531 1200 0.1237
1.0326 1300 0.1351
1.1120 1400 0.1789
1.1914 1500 0.1375
1.2708 1600 0.1368
1.3503 1700 0.114
1.4297 1800 0.1593
1.5091 1900 0.1097
1.5886 2000 0.1299
1.6680 2100 0.1086
1.7474 2200 0.1377
1.8268 2300 0.1323
1.9063 2400 0.3259
1.9857 2500 0.212
2.0651 2600 0.137
2.1446 2700 0.1743
2.2240 2800 0.1232
2.3034 2900 0.1032
2.3828 3000 0.1058
2.4623 3100 0.1324
2.5417 3200 0.1126
2.6211 3300 0.101
2.7006 3400 0.1237
2.7800 3500 0.1177
2.8594 3600 0.1154
2.9388 3700 0.1456
3.0183 3800 0.1141
3.0977 3900 0.1472
3.1771 4000 0.1482
3.2566 4100 0.1184
3.3360 4200 0.0841
3.4154 4300 0.1225
3.4948 4400 0.1063
3.5743 4500 0.1104
3.6537 4600 0.1182
3.7331 4700 0.1217
3.8125 4800 0.1215
3.8920 4900 0.1061
3.9714 5000 0.1187
4.0508 5100 0.1043
4.1303 5200 0.1648
4.2097 5300 0.1165
4.2891 5400 0.105
4.3685 5500 0.0915
4.4480 5600 0.1289
4.5274 5700 0.106
4.6068 5800 0.0927
4.6863 5900 0.0852
4.7657 6000 0.13
4.8451 6100 0.0998
4.9245 6200 0.1287
5.0040 6300 0.1195
5.0834 6400 0.1454
5.1628 6500 0.1592
5.2423 6600 0.124
5.3217 6700 0.0866
5.4011 6800 0.1073
5.4805 6900 0.1147
5.5600 7000 0.1102
5.6394 7100 0.103
5.7188 7200 0.1033
5.7983 7300 0.129
5.8777 7400 0.1178
5.9571 7500 0.1057
6.0365 7600 0.121
6.1160 7700 0.1694
6.1954 7800 0.1143
6.2748 7900 0.1811
6.3542 8000 0.0901
6.4337 8100 0.1362
6.5131 8200 0.0944
6.5925 8300 0.1026
6.6720 8400 0.0868
6.7514 8500 0.1058
6.8308 8600 0.1129
6.9102 8700 0.0925
6.9897 8800 0.1111
7.0691 8900 0.1159
7.1485 9000 0.1507
7.2280 9100 0.1124
7.3074 9200 0.0822
7.3868 9300 0.0935
7.4662 9400 0.1133
7.5457 9500 0.1031
7.6251 9600 0.0948
7.7045 9700 0.0948
7.7840 9800 0.1219
7.8634 9900 0.0885
7.9428 10000 0.1034
8.0222 10100 0.1049
8.1017 10200 0.1413
8.1811 10300 0.1255
8.2605 10400 0.0991
8.3400 10500 0.0847
8.4194 10600 0.1224
8.4988 10700 0.0932
8.5782 10800 0.0892
8.6577 10900 0.0843
8.7371 11000 0.1192
8.8165 11100 0.098
8.8959 11200 0.0957
8.9754 11300 0.0946
9.0548 11400 0.1066
9.1342 11500 0.1467
9.2137 11600 0.1035
9.2931 11700 0.091
9.3725 11800 0.0818
9.4519 11900 0.1048
9.5314 12000 0.0935
9.6108 12100 0.0672
9.6902 12200 0.0709
9.7697 12300 0.0916
9.8491 12400 0.0856
9.9285 12500 0.0941
10.0079 12600 0.0707
10.0874 12700 0.1203
10.1668 12800 0.1215
10.2462 12900 0.089
10.3257 13000 0.0717
10.4051 13100 0.0799
10.4845 13200 0.0755
10.5639 13300 0.0984
10.6434 13400 0.0729
10.7228 13500 0.0733
10.8022 13600 0.1
10.8817 13700 0.049
10.9611 13800 0.0732
11.0405 13900 0.0794
11.1199 14000 0.1286
11.1994 14100 0.0922
11.2788 14200 0.056
11.3582 14300 0.0794
11.4376 14400 0.0924
11.5171 14500 0.0544
11.5965 14600 0.0868
11.6759 14700 0.059
11.7554 14800 0.0837
11.8348 14900 0.069
11.9142 15000 0.0525
11.9936 15100 0.0566
12.0731 15200 0.0908
12.1525 15300 0.1087
12.2319 15400 0.0894
12.3114 15500 0.0638
12.3908 15600 0.058
12.4702 15700 0.0678
12.5496 15800 0.0833
12.6291 15900 0.0667
12.7085 16000 0.0651
12.7879 16100 0.1124
12.8674 16200 0.0689
12.9468 16300 0.1077
13.0262 16400 0.0615
13.1056 16500 0.11
13.1851 16600 0.0695
13.2645 16700 0.0629
13.3439 16800 0.0711
13.4234 16900 0.0693
13.5028 17000 0.056
13.5822 17100 0.0778
13.6616 17200 0.051
13.7411 17300 0.0611
13.8205 17400 0.0772
13.8999 17500 0.0814
13.9793 17600 0.0764
14.0588 17700 0.0847
14.1382 17800 0.1169
14.2176 17900 0.0626
14.2971 18000 0.0673
14.3765 18100 0.0583
14.4559 18200 0.0623
14.5353 18300 0.072
14.6148 18400 0.0472
14.6942 18500 0.0513
14.7736 18600 0.0759
14.8531 18700 0.067
14.9325 18800 0.0955

Framework Versions

  • Python: 3.10.14
  • Sentence Transformers: 3.1.0
  • Transformers: 4.44.0
  • PyTorch: 2.4.0
  • Accelerate: 0.33.0
  • Datasets: 2.21.0
  • Tokenizers: 0.19.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}
Downloads last month
20
Safetensors
Model size
568M params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for tanbinh2210/bge-m3-zalo-trained-0_8-zalo-ST

Base model

BAAI/bge-m3
Finetuned
(123)
this model