Muennighoff commited on Sep 18, 2022

Commit

5d4e702

•

1 Parent(s): 7853d0d

Add MTEB evaluation

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

{eval → evaluation/beir}/beir.json +0 -0
evaluation/mteb/AmazonCounterfactualClassification.json +16 -0
evaluation/mteb/AmazonPolarityClassification.json +14 -0
evaluation/mteb/AmazonReviewsClassification.json +14 -0
evaluation/mteb/ArguAna.json +37 -0
evaluation/mteb/ArxivClusteringP2P.json +9 -0
evaluation/mteb/ArxivClusteringS2S.json +9 -0
evaluation/mteb/AskUbuntuDupQuestions.json +9 -0
evaluation/mteb/BIOSSES.json +19 -0
evaluation/mteb/Banking77Classification.json +12 -0
evaluation/mteb/BiorxivClusteringP2P.json +9 -0
evaluation/mteb/BiorxivClusteringS2S.json +9 -0
evaluation/mteb/CQADupstackAndroidRetrieval.json +37 -0
evaluation/mteb/CQADupstackEnglishRetrieval.json +37 -0
evaluation/mteb/CQADupstackGamingRetrieval.json +37 -0
evaluation/mteb/CQADupstackGisRetrieval.json +37 -0
evaluation/mteb/CQADupstackMathematicaRetrieval.json +37 -0
evaluation/mteb/CQADupstackPhysicsRetrieval.json +37 -0
evaluation/mteb/CQADupstackProgrammersRetrieval.json +37 -0
evaluation/mteb/CQADupstackRetrieval.json +1 -0
evaluation/mteb/CQADupstackStatsRetrieval.json +37 -0
evaluation/mteb/CQADupstackTexRetrieval.json +37 -0
evaluation/mteb/CQADupstackUnixRetrieval.json +37 -0
evaluation/mteb/CQADupstackWebmastersRetrieval.json +37 -0
evaluation/mteb/CQADupstackWordpressRetrieval.json +37 -0
evaluation/mteb/ClimateFEVER.json +37 -0
evaluation/mteb/DBPedia.json +37 -0
evaluation/mteb/EmotionClassification.json +12 -0
evaluation/mteb/FEVER.json +37 -0
evaluation/mteb/FiQA2018.json +37 -0
evaluation/mteb/HotpotQA.json +37 -0
evaluation/mteb/ImdbClassification.json +14 -0
evaluation/mteb/MSMARCO.json +37 -0
evaluation/mteb/MTOPDomainClassification.json +14 -0
evaluation/mteb/MTOPIntentClassification.json +14 -0
evaluation/mteb/MassiveIntentClassification.json +14 -0
evaluation/mteb/MassiveScenarioClassification.json +14 -0
evaluation/mteb/MedrxivClusteringP2P.json +9 -0
evaluation/mteb/MedrxivClusteringS2S.json +9 -0
evaluation/mteb/MindSmallReranking.json +9 -0
evaluation/mteb/NFCorpus.json +37 -0
evaluation/mteb/NQ.json +37 -0
evaluation/mteb/QuoraRetrieval.json +37 -0
evaluation/mteb/RedditClustering.json +9 -0
evaluation/mteb/RedditClusteringP2P.json +9 -0
evaluation/mteb/SCIDOCS.json +37 -0
evaluation/mteb/SGPT-1.3B-weightedmean-msmarco-specb-bitfit_results.csv +355 -0
evaluation/mteb/SICK-R.json +19 -0
evaluation/mteb/STS12.json +19 -0
evaluation/mteb/STS13.json +19 -0

{eval → evaluation/beir}/beir.json RENAMED Viewed

File without changes

evaluation/mteb/AmazonCounterfactualClassification.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "en": {
+      "accuracy": 0.652089552238806,
+      "accuracy_stderr": 0.04707742824740793,
+      "ap": 0.2959212705444778,
+      "ap_stderr": 0.022393345886320606,
+      "f1": 0.5997099864321921,
+      "f1_stderr": 0.036697739411917986,
+      "main_score": 0.652089552238806
+    },
+    "evaluation_time": 23.71
+  }
+}

evaluation/mteb/AmazonPolarityClassification.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "accuracy": 0.7320565,
+    "accuracy_stderr": 0.04094219950430119,
+    "ap": 0.6736680643550963,
+    "ap_stderr": 0.03652809962256317,
+    "evaluation_time": 7801.59,
+    "f1": 0.7290420520325125,
+    "f1_stderr": 0.04396494850187113,
+    "main_score": 0.7320565
+  }
+}

evaluation/mteb/AmazonReviewsClassification.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "en": {
+      "accuracy": 0.34956,
+      "accuracy_stderr": 0.018705464442242543,
+      "f1": 0.3471932443769695,
+      "f1_stderr": 0.017698150667922033,
+      "main_score": 0.34956
+    },
+    "evaluation_time": 73.75
+  }
+}

evaluation/mteb/ArguAna.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 159.23,
+    "map_at_1": 0.26102,
+    "map_at_10": 0.40958,
+    "map_at_100": 0.42033,
+    "map_at_1000": 0.42042,
+    "map_at_3": 0.36332,
+    "map_at_5": 0.38608,
+    "mrr_at_1": 0.26387,
+    "mrr_at_10": 0.41051,
+    "mrr_at_100": 0.42118,
+    "mrr_at_1000": 0.42127,
+    "mrr_at_3": 0.36415,
+    "mrr_at_5": 0.3872,
+    "ndcg_at_1": 0.26102,
+    "ndcg_at_10": 0.4968,
+    "ndcg_at_100": 0.54258,
+    "ndcg_at_1000": 0.54486,
+    "ndcg_at_3": 0.39864,
+    "ndcg_at_5": 0.4398,
+    "precision_at_1": 0.26102,
+    "precision_at_10": 0.07781,
+    "precision_at_100": 0.00979,
+    "precision_at_1000": 0.001,
+    "precision_at_3": 0.16714,
+    "precision_at_5": 0.12034,
+    "recall_at_1": 0.26102,
+    "recall_at_10": 0.77809,
+    "recall_at_100": 0.97866,
+    "recall_at_1000": 0.99644,
+    "recall_at_3": 0.50142,
+    "recall_at_5": 0.60171
+  }
+}

evaluation/mteb/ArxivClusteringP2P.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 28476.56,
+    "v_measure": 0.4338419491695377,
+    "v_measure_std": 0.13772932292188322
+  }
+}

evaluation/mteb/ArxivClusteringS2S.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 3597.82,
+    "v_measure": 0.3370962633433912,
+    "v_measure_std": 0.14057785790111033
+  }
+}

evaluation/mteb/AskUbuntuDupQuestions.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 29.27,
+    "map": 0.5813305899687008,
+    "mrr": 0.7210922041946972
+  }
+}

evaluation/mteb/BIOSSES.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "cos_sim": {
+      "pearson": 0.8662153841660047,
+      "spearman": 0.8301514456843275
+    },
+    "euclidean": {
+      "pearson": 0.8600431518427242,
+      "spearman": 0.8385552516285784
+    },
+    "evaluation_time": 4.47,
+    "manhattan": {
+      "pearson": 0.8583025803351181,
+      "spearman": 0.8386636878343106
+    }
+  }
+}

evaluation/mteb/Banking77Classification.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "accuracy": 0.8205844155844156,
+    "accuracy_stderr": 0.00898031054024437,
+    "evaluation_time": 70.71,
+    "f1": 0.8201858378847641,
+    "f1_stderr": 0.009423967637409204,
+    "main_score": 0.8205844155844156
+  }
+}

evaluation/mteb/BiorxivClusteringP2P.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 3352.83,
+    "v_measure": 0.3505918333141837,
+    "v_measure_std": 0.00847894603883707
+  }
+}

evaluation/mteb/BiorxivClusteringS2S.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 435.49,
+    "v_measure": 0.3071055028830579,
+    "v_measure_std": 0.008981834294010968
+  }
+}

evaluation/mteb/CQADupstackAndroidRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 575.19,
+    "map_at_1": 0.26519,
+    "map_at_10": 0.35634,
+    "map_at_100": 0.36961,
+    "map_at_1000": 0.37088,
+    "map_at_3": 0.32254,
+    "map_at_5": 0.3422,
+    "mrr_at_1": 0.32332,
+    "mrr_at_10": 0.41168,
+    "mrr_at_100": 0.41977,
+    "mrr_at_1000": 0.42029,
+    "mrr_at_3": 0.38197,
+    "mrr_at_5": 0.40036,
+    "ndcg_at_1": 0.32332,
+    "ndcg_at_10": 0.41471,
+    "ndcg_at_100": 0.46956,
+    "ndcg_at_1000": 0.49262,
+    "ndcg_at_3": 0.35938,
+    "ndcg_at_5": 0.38703,
+    "precision_at_1": 0.32332,
+    "precision_at_10": 0.07783,
+    "precision_at_100": 0.0129,
+    "precision_at_1000": 0.00178,
+    "precision_at_3": 0.16834,
+    "precision_at_5": 0.12418,
+    "recall_at_1": 0.26519,
+    "recall_at_10": 0.5319,
+    "recall_at_100": 0.76565,
+    "recall_at_1000": 0.91478,
+    "recall_at_3": 0.38034,
+    "recall_at_5": 0.45246
+  }
+}

evaluation/mteb/CQADupstackEnglishRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 874.22,
+    "map_at_1": 0.25356,
+    "map_at_10": 0.34596,
+    "map_at_100": 0.35714,
+    "map_at_1000": 0.3584,
+    "map_at_3": 0.32073,
+    "map_at_5": 0.33475,
+    "mrr_at_1": 0.31274,
+    "mrr_at_10": 0.39592,
+    "mrr_at_100": 0.40284,
+    "mrr_at_1000": 0.4034,
+    "mrr_at_3": 0.37378,
+    "mrr_at_5": 0.38658,
+    "ndcg_at_1": 0.31274,
+    "ndcg_at_10": 0.39766,
+    "ndcg_at_100": 0.44028,
+    "ndcg_at_1000": 0.46445,
+    "ndcg_at_3": 0.35934,
+    "ndcg_at_5": 0.37751,
+    "precision_at_1": 0.31274,
+    "precision_at_10": 0.07452,
+    "precision_at_100": 0.01217,
+    "precision_at_1000": 0.0017,
+    "precision_at_3": 0.17431,
+    "precision_at_5": 0.12306,
+    "recall_at_1": 0.25356,
+    "recall_at_10": 0.49344,
+    "recall_at_100": 0.67497,
+    "recall_at_1000": 0.83372,
+    "recall_at_3": 0.38227,
+    "recall_at_5": 0.43188
+  }
+}

evaluation/mteb/CQADupstackGamingRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 931.63,
+    "map_at_1": 0.32759,
+    "map_at_10": 0.43937,
+    "map_at_100": 0.45004,
+    "map_at_1000": 0.4507,
+    "map_at_3": 0.40805,
+    "map_at_5": 0.42497,
+    "mrr_at_1": 0.37367,
+    "mrr_at_10": 0.47237,
+    "mrr_at_100": 0.47973,
+    "mrr_at_1000": 0.48011,
+    "mrr_at_3": 0.4465,
+    "mrr_at_5": 0.46051,
+    "ndcg_at_1": 0.37367,
+    "ndcg_at_10": 0.49659,
+    "ndcg_at_100": 0.54069,
+    "ndcg_at_1000": 0.55552,
+    "ndcg_at_3": 0.44169,
+    "ndcg_at_5": 0.46726,
+    "precision_at_1": 0.37367,
+    "precision_at_10": 0.08163,
+    "precision_at_100": 0.01133,
+    "precision_at_1000": 0.00131,
+    "precision_at_3": 0.19707,
+    "precision_at_5": 0.13718,
+    "recall_at_1": 0.32759,
+    "recall_at_10": 0.63341,
+    "recall_at_100": 0.82502,
+    "recall_at_1000": 0.93259,
+    "recall_at_3": 0.48796,
+    "recall_at_5": 0.54921
+  }
+}

evaluation/mteb/CQADupstackGisRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 1290.88,
+    "map_at_1": 0.18962,
+    "map_at_10": 0.25863,
+    "map_at_100": 0.26818,
+    "map_at_1000": 0.26918,
+    "map_at_3": 0.23043,
+    "map_at_5": 0.24599,
+    "mrr_at_1": 0.20452,
+    "mrr_at_10": 0.27301,
+    "mrr_at_100": 0.28233,
+    "mrr_at_1000": 0.2831,
+    "mrr_at_3": 0.24539,
+    "mrr_at_5": 0.26109,
+    "ndcg_at_1": 0.20452,
+    "ndcg_at_10": 0.30355,
+    "ndcg_at_100": 0.35336,
+    "ndcg_at_1000": 0.37927,
+    "ndcg_at_3": 0.24705,
+    "ndcg_at_5": 0.2742,
+    "precision_at_1": 0.20452,
+    "precision_at_10": 0.04949,
+    "precision_at_100": 0.0078,
+    "precision_at_1000": 0.00104,
+    "precision_at_3": 0.10358,
+    "precision_at_5": 0.07774,
+    "recall_at_1": 0.18962,
+    "recall_at_10": 0.43056,
+    "recall_at_100": 0.66273,
+    "recall_at_1000": 0.8596,
+    "recall_at_3": 0.27776,
+    "recall_at_5": 0.34287
+  }
+}

evaluation/mteb/CQADupstackMathematicaRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 686.89,
+    "map_at_1": 0.1124,
+    "map_at_10": 0.18503,
+    "map_at_100": 0.19553,
+    "map_at_1000": 0.1969,
+    "map_at_3": 0.1615,
+    "map_at_5": 0.17254,
+    "mrr_at_1": 0.13806,
+    "mrr_at_10": 0.21939,
+    "mrr_at_100": 0.22827,
+    "mrr_at_1000": 0.22911,
+    "mrr_at_3": 0.1932,
+    "mrr_at_5": 0.20558,
+    "ndcg_at_1": 0.13806,
+    "ndcg_at_10": 0.23383,
+    "ndcg_at_100": 0.28834,
+    "ndcg_at_1000": 0.32175,
+    "ndcg_at_3": 0.18652,
+    "ndcg_at_5": 0.20505,
+    "precision_at_1": 0.13806,
+    "precision_at_10": 0.04714,
+    "precision_at_100": 0.00864,
+    "precision_at_1000": 0.0013,
+    "precision_at_3": 0.09328,
+    "precision_at_5": 0.06841,
+    "recall_at_1": 0.1124,
+    "recall_at_10": 0.34854,
+    "recall_at_100": 0.59503,
+    "recall_at_1000": 0.8325,
+    "recall_at_3": 0.2202,
+    "recall_at_5": 0.26715
+  }
+}

evaluation/mteb/CQADupstackPhysicsRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 1269.26,
+    "map_at_1": 0.23012,
+    "map_at_10": 0.33048,
+    "map_at_100": 0.34371,
+    "map_at_1000": 0.34489,
+    "map_at_3": 0.29943,
+    "map_at_5": 0.31602,
+    "mrr_at_1": 0.28104,
+    "mrr_at_10": 0.3799,
+    "mrr_at_100": 0.38836,
+    "mrr_at_1000": 0.38891,
+    "mrr_at_3": 0.35226,
+    "mrr_at_5": 0.36694,
+    "ndcg_at_1": 0.28104,
+    "ndcg_at_10": 0.39037,
+    "ndcg_at_100": 0.44643,
+    "ndcg_at_1000": 0.46939,
+    "ndcg_at_3": 0.33784,
+    "ndcg_at_5": 0.36126,
+    "precision_at_1": 0.28104,
+    "precision_at_10": 0.07267,
+    "precision_at_100": 0.01193,
+    "precision_at_1000": 0.00159,
+    "precision_at_3": 0.16298,
+    "precision_at_5": 0.11684,
+    "recall_at_1": 0.23012,
+    "recall_at_10": 0.52054,
+    "recall_at_100": 0.75622,
+    "recall_at_1000": 0.90675,
+    "recall_at_3": 0.37282,
+    "recall_at_5": 0.43307
+  }
+}

evaluation/mteb/CQADupstackProgrammersRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 1185.95,
+    "map_at_1": 0.21624,
+    "map_at_10": 0.3021,
+    "map_at_100": 0.3152,
+    "map_at_1000": 0.31626,
+    "map_at_3": 0.26951,
+    "map_at_5": 0.28939,
+    "mrr_at_1": 0.26941,
+    "mrr_at_10": 0.3513,
+    "mrr_at_100": 0.3615,
+    "mrr_at_1000": 0.36204,
+    "mrr_at_3": 0.3242,
+    "mrr_at_5": 0.34155,
+    "ndcg_at_1": 0.26941,
+    "ndcg_at_10": 0.35726,
+    "ndcg_at_100": 0.41725,
+    "ndcg_at_1000": 0.44105,
+    "ndcg_at_3": 0.30184,
+    "ndcg_at_5": 0.33176,
+    "precision_at_1": 0.26941,
+    "precision_at_10": 0.06655,
+    "precision_at_100": 0.01152,
+    "precision_at_1000": 0.00152,
+    "precision_at_3": 0.14346,
+    "precision_at_5": 0.10868,
+    "recall_at_1": 0.21624,
+    "recall_at_10": 0.47359,
+    "recall_at_100": 0.73436,
+    "recall_at_1000": 0.89988,
+    "recall_at_3": 0.3234,
+    "recall_at_5": 0.39856
+  }
+}

evaluation/mteb/CQADupstackRetrieval.json ADDED Viewed

	@@ -0,0 +1 @@

+ {"dataset_version": null, "mteb_version": "0.0.2", "test": {"evaluation_time": 1798.61, "map_at_1": 0.2067566666666667, "map_at_10": 0.28479333333333334, "map_at_100": 0.29612249999999996, "map_at_1000": 0.29731166666666664, "map_at_3": 0.25884, "map_at_5": 0.27298916666666667, "mrr_at_1": 0.24402583333333333, "mrr_at_10": 0.3207041666666667, "mrr_at_100": 0.32958416666666673, "mrr_at_1000": 0.3302541666666666, "mrr_at_3": 0.29677749999999997, "mrr_at_5": 0.3102391666666667, "ndcg_at_1": 0.24402583333333333, "ndcg_at_10": 0.3332616666666667, "ndcg_at_100": 0.38515666666666665, "ndcg_at_1000": 0.4113791666666667, "ndcg_at_3": 0.28687749999999995, "ndcg_at_5": 0.3084766666666667, "precision_at_1": 0.24402583333333333, "precision_at_10": 0.05943749999999999, "precision_at_100": 0.010098333333333334, "precision_at_1000": 0.0014183333333333333, "precision_at_3": 0.132115, "precision_at_5": 0.09548416666666668, "recall_at_1": 0.2067566666666667, "recall_at_10": 0.4424558333333334, "recall_at_100": 0.6731116666666667, "recall_at_1000": 0.8587841666666666, "recall_at_3": 0.3149258333333333, "recall_at_5": 0.3693241666666667}}

evaluation/mteb/CQADupstackStatsRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 1614.26,
+    "map_at_1": 0.1834,
+    "map_at_10": 0.23988,
+    "map_at_100": 0.24895,
+    "map_at_1000": 0.24992,
+    "map_at_3": 0.21831,
+    "map_at_5": 0.23,
+    "mrr_at_1": 0.20399,
+    "mrr_at_10": 0.26186,
+    "mrr_at_100": 0.27018,
+    "mrr_at_1000": 0.27091,
+    "mrr_at_3": 0.2408,
+    "mrr_at_5": 0.2523,
+    "ndcg_at_1": 0.20399,
+    "ndcg_at_10": 0.27799,
+    "ndcg_at_100": 0.32579,
+    "ndcg_at_1000": 0.35209,
+    "ndcg_at_3": 0.23684,
+    "ndcg_at_5": 0.25521,
+    "precision_at_1": 0.20399,
+    "precision_at_10": 0.04586,
+    "precision_at_100": 0.00755,
+    "precision_at_1000": 0.00105,
+    "precision_at_3": 0.10276,
+    "precision_at_5": 0.07362,
+    "recall_at_1": 0.1834,
+    "recall_at_10": 0.37456,
+    "recall_at_100": 0.5986,
+    "recall_at_1000": 0.79703,
+    "recall_at_3": 0.26164,
+    "recall_at_5": 0.30652
+  }
+}

evaluation/mteb/CQADupstackTexRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 2711.63,
+    "map_at_1": 0.12327,
+    "map_at_10": 0.17572,
+    "map_at_100": 0.18534,
+    "map_at_1000": 0.18653,
+    "map_at_3": 0.15703,
+    "map_at_5": 0.16752,
+    "mrr_at_1": 0.15038,
+    "mrr_at_10": 0.20726,
+    "mrr_at_100": 0.2161,
+    "mrr_at_1000": 0.21695,
+    "mrr_at_3": 0.18829,
+    "mrr_at_5": 0.19885,
+    "ndcg_at_1": 0.15038,
+    "ndcg_at_10": 0.21241,
+    "ndcg_at_100": 0.26179,
+    "ndcg_at_1000": 0.29316,
+    "ndcg_at_3": 0.17762,
+    "ndcg_at_5": 0.19413,
+    "precision_at_1": 0.15038,
+    "precision_at_10": 0.03892,
+    "precision_at_100": 0.0075,
+    "precision_at_1000": 0.00118,
+    "precision_at_3": 0.08351,
+    "precision_at_5": 0.06187,
+    "recall_at_1": 0.12327,
+    "recall_at_10": 0.29342,
+    "recall_at_100": 0.51854,
+    "recall_at_1000": 0.74648,
+    "recall_at_3": 0.19596,
+    "recall_at_5": 0.23899
+  }
+}

evaluation/mteb/CQADupstackUnixRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 1688.62,
+    "map_at_1": 0.20594,
+    "map_at_10": 0.27879,
+    "map_at_100": 0.28926,
+    "map_at_1000": 0.29041,
+    "map_at_3": 0.25669,
+    "map_at_5": 0.26774,
+    "mrr_at_1": 0.23694,
+    "mrr_at_10": 0.31335,
+    "mrr_at_100": 0.32218,
+    "mrr_at_1000": 0.32298,
+    "mrr_at_3": 0.2926,
+    "mrr_at_5": 0.30328,
+    "ndcg_at_1": 0.23694,
+    "ndcg_at_10": 0.32456,
+    "ndcg_at_100": 0.37667,
+    "ndcg_at_1000": 0.40571,
+    "ndcg_at_3": 0.28283,
+    "ndcg_at_5": 0.29986,
+    "precision_at_1": 0.23694,
+    "precision_at_10": 0.05448,
+    "precision_at_100": 0.00912,
+    "precision_at_1000": 0.00127,
+    "precision_at_3": 0.12718,
+    "precision_at_5": 0.08843,
+    "recall_at_1": 0.20594,
+    "recall_at_10": 0.43005,
+    "recall_at_100": 0.66228,
+    "recall_at_1000": 0.87171,
+    "recall_at_3": 0.31554,
+    "recall_at_5": 0.35838
+  }
+}

evaluation/mteb/CQADupstackWebmastersRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 540.56,
+    "map_at_1": 0.20856,
+    "map_at_10": 0.28372,
+    "map_at_100": 0.2987,
+    "map_at_1000": 0.30075,
+    "map_at_3": 0.26054,
+    "map_at_5": 0.27129,
+    "mrr_at_1": 0.25494,
+    "mrr_at_10": 0.32735,
+    "mrr_at_100": 0.33794,
+    "mrr_at_1000": 0.3385,
+    "mrr_at_3": 0.30731,
+    "mrr_at_5": 0.31897,
+    "ndcg_at_1": 0.25494,
+    "ndcg_at_10": 0.33385,
+    "ndcg_at_100": 0.39436,
+    "ndcg_at_1000": 0.42313,
+    "ndcg_at_3": 0.29612,
+    "ndcg_at_5": 0.31187,
+    "precision_at_1": 0.25494,
+    "precision_at_10": 0.06423,
+    "precision_at_100": 0.01383,
+    "precision_at_1000": 0.00224,
+    "precision_at_3": 0.13834,
+    "precision_at_5": 0.1,
+    "recall_at_1": 0.20856,
+    "recall_at_10": 0.42678,
+    "recall_at_100": 0.70224,
+    "recall_at_1000": 0.89369,
+    "recall_at_3": 0.31957,
+    "recall_at_5": 0.36026
+  }
+}

evaluation/mteb/CQADupstackWordpressRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 1798.61,
+    "map_at_1": 0.16519,
+    "map_at_10": 0.2215,
+    "map_at_100": 0.23181,
+    "map_at_1000": 0.23292,
+    "map_at_3": 0.20132,
+    "map_at_5": 0.21346,
+    "mrr_at_1": 0.1793,
+    "mrr_at_10": 0.23506,
+    "mrr_at_100": 0.24581,
+    "mrr_at_1000": 0.24675,
+    "mrr_at_3": 0.21503,
+    "mrr_at_5": 0.22686,
+    "ndcg_at_1": 0.1793,
+    "ndcg_at_10": 0.25636,
+    "ndcg_at_100": 0.30736,
+    "ndcg_at_1000": 0.33841,
+    "ndcg_at_3": 0.21546,
+    "ndcg_at_5": 0.23658,
+    "precision_at_1": 0.1793,
+    "precision_at_10": 0.03993,
+    "precision_at_100": 0.00689,
+    "precision_at_1000": 0.00104,
+    "precision_at_3": 0.09057,
+    "precision_at_5": 0.0658,
+    "recall_at_1": 0.16519,
+    "recall_at_10": 0.35268,
+    "recall_at_100": 0.5817,
+    "recall_at_1000": 0.81668,
+    "recall_at_3": 0.24165,
+    "recall_at_5": 0.29254
+  }
+}

evaluation/mteb/ClimateFEVER.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 16391.42,
+    "map_at_1": 0.10363,
+    "map_at_10": 0.18301,
+    "map_at_100": 0.20019,
+    "map_at_1000": 0.20207,
+    "map_at_3": 0.14877,
+    "map_at_5": 0.16544,
+    "mrr_at_1": 0.22866,
+    "mrr_at_10": 0.34935,
+    "mrr_at_100": 0.35802,
+    "mrr_at_1000": 0.3584,
+    "mrr_at_3": 0.30966,
+    "mrr_at_5": 0.33204,
+    "ndcg_at_1": 0.22866,
+    "ndcg_at_10": 0.26595,
+    "ndcg_at_100": 0.33514,
+    "ndcg_at_1000": 0.36872,
+    "ndcg_at_3": 0.20667,
+    "ndcg_at_5": 0.22728,
+    "precision_at_1": 0.22866,
+    "precision_at_10": 0.08632,
+    "precision_at_100": 0.01612,
+    "precision_at_1000": 0.00224,
+    "precision_at_3": 0.15505,
+    "precision_at_5": 0.12404,
+    "recall_at_1": 0.10363,
+    "recall_at_10": 0.33494,
+    "recall_at_100": 0.57593,
+    "recall_at_1000": 0.76342,
+    "recall_at_3": 0.19157,
+    "recall_at_5": 0.24638
+  }
+}

evaluation/mteb/DBPedia.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 11184.99,
+    "map_at_1": 0.07436,
+    "map_at_10": 0.1476,
+    "map_at_100": 0.19206,
+    "map_at_1000": 0.20267,
+    "map_at_3": 0.10894,
+    "map_at_5": 0.12829,
+    "mrr_at_1": 0.5425,
+    "mrr_at_10": 0.63769,
+    "mrr_at_100": 0.64193,
+    "mrr_at_1000": 0.64211,
+    "mrr_at_3": 0.61458,
+    "mrr_at_5": 0.63096,
+    "ndcg_at_1": 0.42875,
+    "ndcg_at_10": 0.31507,
+    "ndcg_at_100": 0.34559,
+    "ndcg_at_1000": 0.41246,
+    "ndcg_at_3": 0.35058,
+    "ndcg_at_5": 0.33396,
+    "precision_at_1": 0.5425,
+    "precision_at_10": 0.2445,
+    "precision_at_100": 0.07383,
+    "precision_at_1000": 0.01582,
+    "precision_at_3": 0.38083,
+    "precision_at_5": 0.326,
+    "recall_at_1": 0.07436,
+    "recall_at_10": 0.19862,
+    "recall_at_100": 0.38981,
+    "recall_at_1000": 0.61038,
+    "recall_at_3": 0.11949,
+    "recall_at_5": 0.15562
+  }
+}

evaluation/mteb/EmotionClassification.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "accuracy": 0.46390000000000003,
+    "accuracy_stderr": 0.018785366645343925,
+    "evaluation_time": 31.09,
+    "f1": 0.42264248858567033,
+    "f1_stderr": 0.011565342464001555,
+    "main_score": 0.46390000000000003
+  }
+}

evaluation/mteb/FEVER.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 17506.78,
+    "map_at_1": 0.50916,
+    "map_at_10": 0.62258,
+    "map_at_100": 0.62741,
+    "map_at_1000": 0.62763,
+    "map_at_3": 0.60018,
+    "map_at_5": 0.6142,
+    "mrr_at_1": 0.54965,
+    "mrr_at_10": 0.66554,
+    "mrr_at_100": 0.66966,
+    "mrr_at_1000": 0.66978,
+    "mrr_at_3": 0.64414,
+    "mrr_at_5": 0.6577,
+    "ndcg_at_1": 0.54965,
+    "ndcg_at_10": 0.6812,
+    "ndcg_at_100": 0.70282,
+    "ndcg_at_1000": 0.70788,
+    "ndcg_at_3": 0.63862,
+    "ndcg_at_5": 0.66216,
+    "precision_at_1": 0.54965,
+    "precision_at_10": 0.08998,
+    "precision_at_100": 0.01016,
+    "precision_at_1000": 0.00107,
+    "precision_at_3": 0.25618,
+    "precision_at_5": 0.16676,
+    "recall_at_1": 0.50916,
+    "recall_at_10": 0.8204,
+    "recall_at_100": 0.91689,
+    "recall_at_1000": 0.95349,
+    "recall_at_3": 0.70512,
+    "recall_at_5": 0.76299
+  }
+}

evaluation/mteb/FiQA2018.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 310.86,
+    "map_at_1": 0.13568,
+    "map_at_10": 0.23264,
+    "map_at_100": 0.24824,
+    "map_at_1000": 0.25014,
+    "map_at_3": 0.19724,
+    "map_at_5": 0.21772,
+    "mrr_at_1": 0.27315,
+    "mrr_at_10": 0.35935,
+    "mrr_at_100": 0.36929,
+    "mrr_at_1000": 0.36985,
+    "mrr_at_3": 0.33591,
+    "mrr_at_5": 0.34848,
+    "ndcg_at_1": 0.27315,
+    "ndcg_at_10": 0.29988,
+    "ndcg_at_100": 0.3641,
+    "ndcg_at_1000": 0.40185,
+    "ndcg_at_3": 0.26342,
+    "ndcg_at_5": 0.2768,
+    "precision_at_1": 0.27315,
+    "precision_at_10": 0.08565,
+    "precision_at_100": 0.01508,
+    "precision_at_1000": 0.00219,
+    "precision_at_3": 0.1785,
+    "precision_at_5": 0.13673,
+    "recall_at_1": 0.13568,
+    "recall_at_10": 0.37133,
+    "recall_at_100": 0.61475,
+    "recall_at_1000": 0.84372,
+    "recall_at_3": 0.24112,
+    "recall_at_5": 0.29507
+  }
+}

evaluation/mteb/HotpotQA.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 13678.13,
+    "map_at_1": 0.30878,
+    "map_at_10": 0.40868,
+    "map_at_100": 0.41694,
+    "map_at_1000": 0.41775,
+    "map_at_3": 0.3856,
+    "map_at_5": 0.39947,
+    "mrr_at_1": 0.61756,
+    "mrr_at_10": 0.68265,
+    "mrr_at_100": 0.68671,
+    "mrr_at_1000": 0.68694,
+    "mrr_at_3": 0.66784,
+    "mrr_at_5": 0.67704,
+    "ndcg_at_1": 0.61756,
+    "ndcg_at_10": 0.49931,
+    "ndcg_at_100": 0.53179,
+    "ndcg_at_1000": 0.54948,
+    "ndcg_at_3": 0.46103,
+    "ndcg_at_5": 0.48147,
+    "precision_at_1": 0.61756,
+    "precision_at_10": 0.10163,
+    "precision_at_100": 0.01271,
+    "precision_at_1000": 0.00151,
+    "precision_at_3": 0.28179,
+    "precision_at_5": 0.18528,
+    "recall_at_1": 0.30878,
+    "recall_at_10": 0.50817,
+    "recall_at_100": 0.63545,
+    "recall_at_1000": 0.75361,
+    "recall_at_3": 0.42269,
+    "recall_at_5": 0.4632
+  }
+}

evaluation/mteb/ImdbClassification.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "accuracy": 0.6404799999999999,
+    "accuracy_stderr": 0.03197141223030349,
+    "ap": 0.5918525145533928,
+    "ap_stderr": 0.024531019346391677,
+    "evaluation_time": 915.58,
+    "f1": 0.6394712318134925,
+    "f1_stderr": 0.0317267000377415,
+    "main_score": 0.6404799999999999
+  }
+}

evaluation/mteb/MSMARCO.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "validation": {
+    "evaluation_time": 22861.03,
+    "map_at_1": 0.189,
+    "map_at_10": 0.29748,
+    "map_at_100": 0.30976,
+    "map_at_1000": 0.31041,
+    "map_at_3": 0.26113,
+    "map_at_5": 0.28197,
+    "mrr_at_1": 0.19413,
+    "mrr_at_10": 0.30322,
+    "mrr_at_100": 0.31497,
+    "mrr_at_1000": 0.31555,
+    "mrr_at_3": 0.26729,
+    "mrr_at_5": 0.28789,
+    "ndcg_at_1": 0.19413,
+    "ndcg_at_10": 0.36048,
+    "ndcg_at_100": 0.42152,
+    "ndcg_at_1000": 0.43772,
+    "ndcg_at_3": 0.28642,
+    "ndcg_at_5": 0.32358,
+    "precision_at_1": 0.19413,
+    "precision_at_10": 0.05785,
+    "precision_at_100": 0.00887,
+    "precision_at_1000": 0.00103,
+    "precision_at_3": 0.12192,
+    "precision_at_5": 0.09189,
+    "recall_at_1": 0.189,
+    "recall_at_10": 0.55457,
+    "recall_at_100": 0.84091,
+    "recall_at_1000": 0.96482,
+    "recall_at_3": 0.35359,
+    "recall_at_5": 0.44275
+  }
+}

evaluation/mteb/MTOPDomainClassification.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "en": {
+      "accuracy": 0.9207706338349293,
+      "accuracy_stderr": 0.005541106237593856,
+      "f1": 0.9156680443236652,
+      "f1_stderr": 0.005216941657420623,
+      "main_score": 0.9207706338349293
+    },
+    "evaluation_time": 31.37
+  }
+}

evaluation/mteb/MTOPIntentClassification.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "en": {
+      "accuracy": 0.7118559051527589,
+      "accuracy_stderr": 0.012419016906278644,
+      "f1": 0.5242887061726789,
+      "f1_stderr": 0.011199354119349208,
+      "main_score": 0.7118559051527589
+    },
+    "evaluation_time": 82.02
+  }
+}

evaluation/mteb/MassiveIntentClassification.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "en": {
+      "accuracy": 0.6864828513786148,
+      "accuracy_stderr": 0.012244395475104431,
+      "f1": 0.6654281381596097,
+      "f1_stderr": 0.009337695311493243,
+      "main_score": 0.6864828513786148
+    },
+    "evaluation_time": 49.93
+  }
+}

evaluation/mteb/MassiveScenarioClassification.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "en": {
+      "accuracy": 0.7604236718224613,
+      "accuracy_stderr": 0.009702648067132833,
+      "f1": 0.7589170458655639,
+      "f1_stderr": 0.009666037600064457,
+      "main_score": 0.7604236718224613
+    },
+    "evaluation_time": 29.65
+  }
+}

evaluation/mteb/MedrxivClusteringP2P.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 1694.42,
+    "v_measure": 0.320840369055247,
+    "v_measure_std": 0.012975340075124157
+  }
+}

evaluation/mteb/MedrxivClusteringS2S.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 258.59,
+    "v_measure": 0.29448729560244535,
+    "v_measure_std": 0.014610308837145732
+  }
+}

evaluation/mteb/MindSmallReranking.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 18115.54,
+    "map": 0.31340856463122374,
+    "mrr": 0.32398547669840916
+  }
+}

evaluation/mteb/NFCorpus.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 101.25,
+    "map_at_1": 0.05526,
+    "map_at_10": 0.11745,
+    "map_at_100": 0.14831,
+    "map_at_1000": 0.16235,
+    "map_at_3": 0.08716,
+    "map_at_5": 0.10101,
+    "mrr_at_1": 0.43653,
+    "mrr_at_10": 0.51067,
+    "mrr_at_100": 0.51881,
+    "mrr_at_1000": 0.51912,
+    "mrr_at_3": 0.4902,
+    "mrr_at_5": 0.50289,
+    "ndcg_at_1": 0.4195,
+    "ndcg_at_10": 0.32083,
+    "ndcg_at_100": 0.3005,
+    "ndcg_at_1000": 0.38661,
+    "ndcg_at_3": 0.3794,
+    "ndcg_at_5": 0.35456,
+    "precision_at_1": 0.43344,
+    "precision_at_10": 0.23437,
+    "precision_at_100": 0.0783,
+    "precision_at_1000": 0.02053,
+    "precision_at_3": 0.35501,
+    "precision_at_5": 0.30464,
+    "recall_at_1": 0.05526,
+    "recall_at_10": 0.15446,
+    "recall_at_100": 0.31179,
+    "recall_at_1000": 0.61578,
+    "recall_at_3": 0.0971,
+    "recall_at_5": 0.12026
+  }
+}

evaluation/mteb/NQ.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 8091.11,
+    "map_at_1": 0.23467,
+    "map_at_10": 0.36041,
+    "map_at_100": 0.37268,
+    "map_at_1000": 0.37322,
+    "map_at_3": 0.3209,
+    "map_at_5": 0.34414,
+    "mrr_at_1": 0.26738,
+    "mrr_at_10": 0.38665,
+    "mrr_at_100": 0.3964,
+    "mrr_at_1000": 0.39681,
+    "mrr_at_3": 0.35207,
+    "mrr_at_5": 0.3731,
+    "ndcg_at_1": 0.26709,
+    "ndcg_at_10": 0.42942,
+    "ndcg_at_100": 0.48296,
+    "ndcg_at_1000": 0.49651,
+    "ndcg_at_3": 0.35413,
+    "ndcg_at_5": 0.39368,
+    "precision_at_1": 0.26709,
+    "precision_at_10": 0.07306,
+    "precision_at_100": 0.01029,
+    "precision_at_1000": 0.00116,
+    "precision_at_3": 0.16348,
+    "precision_at_5": 0.12068,
+    "recall_at_1": 0.23467,
+    "recall_at_10": 0.61493,
+    "recall_at_100": 0.85011,
+    "recall_at_1000": 0.95261,
+    "recall_at_3": 0.41952,
+    "recall_at_5": 0.51106
+  }
+}

evaluation/mteb/QuoraRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 742.32,
+    "map_at_1": 0.67517,
+    "map_at_10": 0.81054,
+    "map_at_100": 0.81727,
+    "map_at_1000": 0.81752,
+    "map_at_3": 0.78018,
+    "map_at_5": 0.79879,
+    "mrr_at_1": 0.7752,
+    "mrr_at_10": 0.84429,
+    "mrr_at_100": 0.84582,
+    "mrr_at_1000": 0.84584,
+    "mrr_at_3": 0.83268,
+    "mrr_at_5": 0.84013,
+    "ndcg_at_1": 0.7753,
+    "ndcg_at_10": 0.85277,
+    "ndcg_at_100": 0.86805,
+    "ndcg_at_1000": 0.8701,
+    "ndcg_at_3": 0.81975,
+    "ndcg_at_5": 0.83723,
+    "precision_at_1": 0.7753,
+    "precision_at_10": 0.12961,
+    "precision_at_100": 0.01502,
+    "precision_at_1000": 0.00156,
+    "precision_at_3": 0.35713,
+    "precision_at_5": 0.23574,
+    "recall_at_1": 0.67517,
+    "recall_at_10": 0.93486,
+    "recall_at_100": 0.989,
+    "recall_at_1000": 0.9993,
+    "recall_at_3": 0.8418,
+    "recall_at_5": 0.88975
+  }
+}

evaluation/mteb/RedditClustering.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 3324.44,
+    "v_measure": 0.48225994608749917,
+    "v_measure_std": 0.055941572162319216
+  }
+}

evaluation/mteb/RedditClusteringP2P.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 13390.64,
+    "v_measure": 0.5317635557157765,
+    "v_measure_std": 0.12570620726605897
+  }
+}

evaluation/mteb/SCIDOCS.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 214.39,
+    "map_at_1": 0.03988,
+    "map_at_10": 0.094,
+    "map_at_100": 0.10968,
+    "map_at_1000": 0.11257,
+    "map_at_3": 0.07123,
+    "map_at_5": 0.08221,
+    "mrr_at_1": 0.197,
+    "mrr_at_10": 0.29098,
+    "mrr_at_100": 0.30247,
+    "mrr_at_1000": 0.30318,
+    "mrr_at_3": 0.2655,
+    "mrr_at_5": 0.27915,
+    "ndcg_at_1": 0.197,
+    "ndcg_at_10": 0.16176,
+    "ndcg_at_100": 0.22931,
+    "ndcg_at_1000": 0.28301,
+    "ndcg_at_3": 0.16142,
+    "ndcg_at_5": 0.13634,
+    "precision_at_1": 0.197,
+    "precision_at_10": 0.0818,
+    "precision_at_100": 0.01801,
+    "precision_at_1000": 0.00309,
+    "precision_at_3": 0.151,
+    "precision_at_5": 0.1174,
+    "recall_at_1": 0.03988,
+    "recall_at_10": 0.16625,
+    "recall_at_100": 0.3661,
+    "recall_at_1000": 0.62805,
+    "recall_at_3": 0.09168,
+    "recall_at_5": 0.11902
+  }
+}

evaluation/mteb/SGPT-1.3B-weightedmean-msmarco-specb-bitfit_results.csv ADDED Viewed

	@@ -0,0 +1,355 @@

+model,task,dataset,language,metric,value
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,BitextMining,BUCC,,f1,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,BitextMining,Tatoeba,,f1,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,AmazonCounterfactualClassification,en,accuracy,0.652089552238806
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,AmazonCounterfactualClassification,de,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,AmazonCounterfactualClassification,de,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,AmazonCounterfactualClassification,en-ext,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,AmazonCounterfactualClassification,en-ext,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,AmazonCounterfactualClassification,ja,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,AmazonCounterfactualClassification,ja,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,AmazonPolarityClassification,en,accuracy,0.7320565
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,en,accuracy,0.34956
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,de,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,de,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,es,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,es,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,fr,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,fr,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,ja,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,ja,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,zh,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,zh,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,Banking77Classification,en,accuracy,0.8205844155844156
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,EmotionClassification,en,accuracy,0.46390000000000003
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,ImdbClassification,en,accuracy,0.6404799999999999
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,af,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,af,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,am,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,am,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ar,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ar,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,az,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,az,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,bn,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,bn,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,cy,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,cy,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,da,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,da,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,de,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,de,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,el,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,el,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,en,accuracy,0.6864828513786148
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,es,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,es,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,fa,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,fa,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,fi,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,fi,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,fr,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,fr,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,he,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,he,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,hi,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,hi,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,hu,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,hu,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,hy,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,hy,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,id,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,id,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,is,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,is,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,it,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,it,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ja,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ja,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,jv,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,jv,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ka,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ka,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,km,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,km,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,kn,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,kn,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ko,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ko,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,lv,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,lv,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ml,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ml,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,mn,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,mn,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ms,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ms,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,my,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,my,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,nb,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,nb,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,nl,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,nl,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,pl,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,pl,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,pt,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,pt,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ro,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ro,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ru,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ru,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,sl,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,sl,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,sq,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,sq,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,sv,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,sv,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,sw,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,sw,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ta,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ta,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,te,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,te,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,th,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,th,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,tl,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,tl,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,tr,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,tr,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ur,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ur,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,vi,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,vi,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,zh-CN,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,zh-CN,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,zh-TW,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,zh-TW,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,af,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,af,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,am,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,am,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ar,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ar,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,az,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,az,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,bn,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,bn,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,cy,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,cy,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,da,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,da,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,de,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,de,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,el,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,el,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,en,accuracy,0.7604236718224613
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,es,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,es,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,fa,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,fa,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,fi,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,fi,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,fr,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,fr,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,he,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,he,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,hi,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,hi,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,hu,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,hu,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,hy,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,hy,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,id,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,id,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,is,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,is,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,it,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,it,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ja,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ja,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,jv,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,jv,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ka,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ka,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,km,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,km,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,kn,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,kn,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ko,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ko,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,lv,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,lv,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ml,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ml,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,mn,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,mn,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ms,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ms,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,my,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,my,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,nb,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,nb,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,nl,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,nl,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,pl,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,pl,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,pt,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,pt,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ro,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ro,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ru,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ru,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,sl,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,sl,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,sq,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,sq,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,sv,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,sv,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,sw,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,sw,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ta,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ta,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,te,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,te,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,th,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,th,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,tl,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,tl,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,tr,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,tr,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ur,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ur,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,vi,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,vi,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,zh-CN,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,zh-CN,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,zh-TW,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,zh-TW,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,en,accuracy,0.9207706338349293
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,de,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,de,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,es,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,es,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,fr,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,fr,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,hi,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,hi,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,th,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,th,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,en,accuracy,0.7118559051527589
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,de,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,de,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,es,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,es,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,fr,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,fr,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,hi,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,hi,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,th,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,th,accuracy,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,ToxicConversationsClassification,en,accuracy,0.687272
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,TweetSentimentExtractionClassification,en,accuracy,0.556677985285795
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Clustering,ArxivClusteringP2P,en,v_measure,0.4338419491695377
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Clustering,ArxivClusteringS2S,en,v_measure,0.3370962633433912
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Clustering,BiorxivClusteringP2P,en,v_measure,0.3505918333141837
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Clustering,BiorxivClusteringS2S,en,v_measure,0.3071055028830579
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Clustering,MedrxivClusteringP2P,en,v_measure,0.320840369055247
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Clustering,MedrxivClusteringS2S,en,v_measure,0.29448729560244535
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Clustering,RedditClustering,en,v_measure,0.48225994608749917
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Clustering,RedditClusteringP2P,en,v_measure,0.5317635557157765
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Clustering,StackExchangeClustering,en,v_measure,0.6085593925770172
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Clustering,StackExchangeClusteringP2P,en,v_measure,0.323567729982375
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Clustering,TwentyNewsgroupsClustering,en,v_measure,0.4005809562275603
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,PairClassification,SprintDuplicateQuestions,en,ap,0.9257836032673468
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,PairClassification,TwitterSemEval2015,en,ap,0.6237052608803734
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,PairClassification,TwitterURLCorpus,en,ap,0.8378748636891035
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Reranking,AskUbuntuDupQuestions,en,map,0.5813305899687008
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Reranking,MindSmallReranking,en,map,0.31340856463122374
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Reranking,SciDocsRR,en,map,0.7721233007730808
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Reranking,StackOverflowDupQuestions,en,map,0.49320607035290737
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Retrieval,ArguAna,en,ndcg_at_10,0.4968
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Retrieval,ClimateFEVER,en,ndcg_at_10,0.26595
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Retrieval,CQADupstackRetrieval,en,ndcg_at_10,0.3332616666666667
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Retrieval,DBPedia,en,ndcg_at_10,0.31507
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Retrieval,FEVER,en,ndcg_at_10,0.6812
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Retrieval,FiQA2018,en,ndcg_at_10,0.29988
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Retrieval,HotpotQA,en,ndcg_at_10,0.49931
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Retrieval,MSMARCO,en,ndcg_at_10,0.36048
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Retrieval,NFCorpus,en,ndcg_at_10,0.32083
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Retrieval,NQ,en,ndcg_at_10,0.42942
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Retrieval,QuoraRetrieval,en,ndcg_at_10,0.85277
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Retrieval,SCIDOCS,en,ndcg_at_10,0.16176
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Retrieval,SciFact,en,ndcg_at_10,0.68287
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Retrieval,Touche2020,en,ndcg_at_10,0.2445
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Retrieval,TRECCOVID,en,ndcg_at_10,0.7298
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,BIOSSES,en,cosine_spearman,0.8301514456843275
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,SICK-R,en,cosine_spearman,0.6722953551111448
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS12,en,cosine_spearman,0.6659241013465915
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS13,en,cosine_spearman,0.7733151317062642
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS14,en,cosine_spearman,0.7182815265534886
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS15,en,cosine_spearman,0.8065931167868883
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS16,en,cosine_spearman,0.7891151365939403
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,ko-ko,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,ko-ko,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,ar-ar,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,ar-ar,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,en-ar,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,en-ar,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,en-de,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,en-de,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,en-en,cosine_spearman,0.8698674844768606
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,en-tr,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,en-tr,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,es-en,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,es-en,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,es-es,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,es-es,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,fr-en,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,fr-en,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,it-en,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,it-en,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,nl-en,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS17,nl-en,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,en,cosine_spearman,0.6730387805090023
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,de,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,de,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,es,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,es,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,pl,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,pl,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,tr,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,tr,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,ar,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,ar,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,ru,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,ru,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,zh,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,zh,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,fr,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,fr,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,de-en,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,de-en,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,es-en,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,es-en,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,it,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,it,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,pl-en,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,pl-en,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,zh-en,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,zh-en,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,es-it,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,es-it,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,de-fr,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,de-fr,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,de-pl,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,de-pl,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,fr-pl,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STS22,fr-pl,cosine_spearman,
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,STSBenchmark,en,cosine_spearman,0.775887175717799
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Summarization,SummEval,en,cosine_spearman,0.25440272876996695
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Classification,average,en,accuracy,0.6651794596081484
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Clustering,average,en,v_measure,0.3991540721780082
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,PairClassification,average,en,ap,0.7957879092789413
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Reranking,average,en,map,0.5400171314314782
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,Retrieval,average,en,ndcg_at_10,0.4449267777777778
+SGPT-1.3B-weightedmean-msmarco-specb-bitfit,STS,average,en,cosine_spearman,0.7574469254486307

evaluation/mteb/SICK-R.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "cos_sim": {
+      "pearson": 0.7729330379162072,
+      "spearman": 0.6722953551111448
+    },
+    "euclidean": {
+      "pearson": 0.7144682700059415,
+      "spearman": 0.6633178012153248
+    },
+    "evaluation_time": 52.38,
+    "manhattan": {
+      "pearson": 0.7146941734657887,
+      "spearman": 0.6643234359835815
+    }
+  }
+}

evaluation/mteb/STS12.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "cos_sim": {
+      "pearson": 0.7540943196466576,
+      "spearman": 0.6659241013465915
+    },
+    "euclidean": {
+      "pearson": 0.7132500540796616,
+      "spearman": 0.6786667467202591
+    },
+    "evaluation_time": 26.18,
+    "manhattan": {
+      "pearson": 0.7148209832089134,
+      "spearman": 0.6794511626964879
+    }
+  }
+}

evaluation/mteb/STS13.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "cos_sim": {
+      "pearson": 0.7708302398877518,
+      "spearman": 0.7733151317062642
+    },
+    "euclidean": {
+      "pearson": 0.7677020279715008,
+      "spearman": 0.7713893776083225
+    },
+    "evaluation_time": 12.09,
+    "manhattan": {
+      "pearson": 0.7676732290707478,
+      "spearman": 0.7714500877396631
+    }
+  }
+}