JosephusCheung commited on
Commit
4fc249a
·
1 Parent(s): 6e22353

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +12 -12
README.md CHANGED
@@ -101,29 +101,29 @@ Hard ACC:54.71
101
  **系统提示不能为空!**
102
 
103
  ## MMLU:
104
- STEM准确率:56.83
105
 
106
- 人文学科准确率:58.79
107
 
108
- 其他准确率:70.04
109
 
110
- 社会学准确率:72.41
111
 
112
- 平均准确率:63.82 (优于/平于最好的 Mistral-7B 聊天格式的微调。)
113
 
114
  ## CEval(验证集):
115
- STEM准确率:61.67
116
 
117
- 社会科学准确率:81.94
118
 
119
- 人文学科准确率:77.19
120
 
121
- 其他准确率:68.35
122
 
123
- 困难准确率:48.03
124
 
125
- **平均准确率:70.27** (优于当前所有7B模型。)
126
 
127
  ## GSM8K
128
 
129
- **零样本准确率0.5921152388172858** (优于WizardMath-7B和Qwen-7B
 
101
  **系统提示不能为空!**
102
 
103
  ## MMLU:
104
+ STEM准确率:64.19
105
 
106
+ 人文及艺术学科准确率:61.40
107
 
108
+ 其他学科准确率:71.64
109
 
110
+ 社会学科准确率:75.37
111
 
112
+ **平均准确率:67.36**(超过所有70B以下的模型,非常接近最佳70B微调模型)
113
 
114
  ## CEval(验证集):
115
+ STEM准确率:66.71
116
 
117
+ 社会科学准确率:85.10
118
 
119
+ 人文学科准确率:76.68
120
 
121
+ 其他学科准确率:70.23
122
 
123
+ 困难准确率:54.71
124
 
125
+ **平均准确率:73.10**(超过Qwen-14B和GPT-4)
126
 
127
  ## GSM8K
128
 
129
+ **零样本准确率0.7012888551933283**(超过MetaMath-13B和Qwen-14B