MokaHR commited on
Commit
840a70d
1 Parent(s): 495b062

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +2 -2
README.md CHANGED
@@ -30,14 +30,14 @@ M3E 是 Moka Massive Mixed Embedding 的缩写
30
  | --------- | -------- | -------- | -------- | -------- | -------- | -------- | -------- | ---- | ---------- | ------------ | -------- |
31
  | m3e-small | 24M | 512 | 是 | 否 | 是 | 否 | 否 | 是 | 优 | 0.5834 | 0.7262 |
32
  | m3e-base | 110M | 768 | 是 | 是 | 是 | 是 | 否 | 是 | 优 | **0.6157** | **0.8004** |
33
- | text2vec | 110M | 768 | 是 | 否 | 是 | 否 | 否 | 是 | | 0.5755 | 0.6346 |
34
  | openai-ada-002 | 未知 | 1536 | 是 | 是 | 是 | 是 | 是 | 否 | 优 | 0.5956 | 0.7786 |
35
 
36
  说明:
37
  - s2s, 即 sentence to sentence ,代表了同质文本之间的嵌入能力,适用任务:文本相似度,重复问题检测,文本分类等
38
  - s2p, 即 sentence to passage ,代表了异质文本之间的嵌入能力,适用任务:文本检索,GPT 记忆模块等
39
  - s2c, 即 sentence to code ,代表了自然语言和程序语言之间的嵌入能力,适用任务:代码检索
40
- - 兼容性,代表了模型在开源社区中各种项目被支持的程度,由于 m3e 是基于 sentence-transformers 的,所以和 openai 在社区的支持度上相当
41
  - ACC & ndcg@10,详情见下方的评测
42
 
43
  Tips:
 
30
  | --------- | -------- | -------- | -------- | -------- | -------- | -------- | -------- | ---- | ---------- | ------------ | -------- |
31
  | m3e-small | 24M | 512 | 是 | 否 | 是 | 否 | 否 | 是 | 优 | 0.5834 | 0.7262 |
32
  | m3e-base | 110M | 768 | 是 | 是 | 是 | 是 | 否 | 是 | 优 | **0.6157** | **0.8004** |
33
+ | text2vec | 110M | 768 | 是 | 否 | 是 | 否 | 否 | 是 | | 0.5755 | 0.6346 |
34
  | openai-ada-002 | 未知 | 1536 | 是 | 是 | 是 | 是 | 是 | 否 | 优 | 0.5956 | 0.7786 |
35
 
36
  说明:
37
  - s2s, 即 sentence to sentence ,代表了同质文本之间的嵌入能力,适用任务:文本相似度,重复问题检测,文本分类等
38
  - s2p, 即 sentence to passage ,代表了异质文本之间的嵌入能力,适用任务:文本检索,GPT 记忆模块等
39
  - s2c, 即 sentence to code ,代表了自然语言和程序语言之间的嵌入能力,适用任务:代码检索
40
+ - 兼容性,代表了模型在开源社区中各种项目被支持的程度,由于 m3e text2vec 都可以直接通过 sentence-transformers 直接使用,所以和 openai 在社区的支持度上相当
41
  - ACC & ndcg@10,详情见下方的评测
42
 
43
  Tips: