Adding Evaluation Results
#15
by
leaderboard-pr-bot
- opened
README.md
CHANGED
@@ -145,4 +145,17 @@ def lcs(s1, s2):
|
|
145 |
该函数使用动态规划来计算LCS。它从第一个字符串中的第一个字符开始,并将其添加到存储子序列的`dp`列表中。然后,它循环遍历两个字符串中的字符,如果它们相匹配,则将相应字符添加到`dp`列表中,并将`max_length`存储为当前字符串的最大长度。
|
146 |
|
147 |
最后,该函数返回`max_length`和两个输入字符串的长度之间的最大值,这表示LCS的长度。请注意,该函数假设输入字符串是字符串,而不是字符数组。如果要将其修改为处理数组,则需要相应地修改该函数。
|
148 |
-
```
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
145 |
该函数使用动态规划来计算LCS。它从第一个字符串中的第一个字符开始,并将其添加到存储子序列的`dp`列表中。然后,它循环遍历两个字符串中的字符,如果它们相匹配,则将相应字符添加到`dp`列表中,并将`max_length`存储为当前字符串的最大长度。
|
146 |
|
147 |
最后,该函数返回`max_length`和两个输入字符串的长度之间的最大值,这表示LCS的长度。请注意,该函数假设输入字符串是字符串,而不是字符数组。如果要将其修改为处理数组,则需要相应地修改该函数。
|
148 |
+
```
|
149 |
+
# [Open LLM Leaderboard Evaluation Results](https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard)
|
150 |
+
Detailed results can be found [here](https://huggingface.co/datasets/open-llm-leaderboard/details_fireballoon__baichuan-vicuna-chinese-7b)
|
151 |
+
|
152 |
+
| Metric | Value |
|
153 |
+
|-----------------------|---------------------------|
|
154 |
+
| Avg. | 43.39 |
|
155 |
+
| ARC (25-shot) | 43.52 |
|
156 |
+
| HellaSwag (10-shot) | 71.12 |
|
157 |
+
| MMLU (5-shot) | 46.87 |
|
158 |
+
| TruthfulQA (0-shot) | 42.45 |
|
159 |
+
| Winogrande (5-shot) | 66.85 |
|
160 |
+
| GSM8K (5-shot) | 5.53 |
|
161 |
+
| DROP (3-shot) | 27.4 |
|