CausalLM
/

14B

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions

JosephusCheung commited on Oct 23, 2023

Commit

dd009b6

·

1 Parent(s): 0605834

Update README.md

Files changed (1) hide show

README.md +15 -1

README.md CHANGED Viewed

@@ -88,6 +88,13 @@ Hard ACC:54.71
 **Zero-shot ACC 0.7012888551933283** (Outperforms MetaMath-13B, Qwen-14B)
 **GPT2Tokenizer 上的 llama.cpp 存在一些问题，会尽快修复...**
@@ -137,4 +144,11 @@ STEM准确率：66.71
 ## GSM8K
-**零样本准确率0.7012888551933283**（超过MetaMath-13B和Qwen-14B）

 **Zero-shot ACC 0.7012888551933283** (Outperforms MetaMath-13B, Qwen-14B)
+## AlpacaEval Leaderboard
+|              | win_rate | standard_error | n_wins | n_wins_base | n_draws | n_total | mode      | avg_length |
+| ------------ | -------- | -------------- | ------ | ----------- | ------- | ------- | --------- | ---------- |
+| causallm-14b | **88.26087** | 1.116333       | 705    | 89          | 11      | 805     | community | 1391       |
+Win rate **88.26%**	on [AlpacaEval Leaderboard](https://tatsu-lab.github.io/alpaca_eval/) [view raw](https://github.com/tatsu-lab/alpaca_eval/blob/3a47dcd81c56f6a8e6a5711f2754013919fbe90a/results/causallm-14b/model_outputs.json)
 **GPT2Tokenizer 上的 llama.cpp 存在一些问题，会尽快修复...**
 ## GSM8K
+**零样本准确率0.7012888551933283**（超过MetaMath-13B和Qwen-14B）
+## AlpacaEval Leaderboard
+|              | win_rate | standard_error | n_wins | n_wins_base | n_draws | n_total | mode      | avg_length |
+| ------------ | -------- | -------------- | ------ | ----------- | ------- | ------- | --------- | ---------- |
+| causallm-14b | **88.26087** | 1.116333       | 705    | 89          | 11      | 805     | community | 1391       |
+在 [AlpacaEval Leaderboard](https://tatsu-lab.github.io/alpaca_eval/) 胜率 **88.26%** [view raw](https://github.com/tatsu-lab/alpaca_eval/blob/3a47dcd81c56f6a8e6a5711f2754013919fbe90a/results/causallm-14b/model_outputs.json)