hkust-nlp
/

deita-llama1-13b-v1.0-sft

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

AndrewZeng commited on Dec 29, 2023

Commit

8e15d33

•

1 Parent(s): 6f95e4f

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -10,6 +10,9 @@ language:
 # Model Card for Deita Llama1 13B V1.0 SFT
 Deita is an open-sourced project designed to facilitate **Automatic Data Selection** for instruction tuning in Large Language Models (LLMs).
 Deita Llama1 13B V1.0 SFT is a fine-tuned version of Llama 1 that was trained on 10k automatically selected lightweight, high-quality alignment SFT data: [Deita 10K V0](https://huggingface.co/datasets/hkust-nlp/deita-10k-v0).
@@ -27,8 +30,6 @@ Deita Llama1 13B V1.0 SFT is a fine-tuned version of Llama 1 that was trained on
 ## Performance
-<details>
-  <summary>See full evaluations</summary>
 | Model                                          | Align     | Data Size  | MT-Bench | AlpacaEval(%) | OpenLLM (Avg.) |
 |------------------------------------------------|-----------|------------|----------|---------------|----------------|
@@ -63,7 +64,6 @@ Deita Llama1 13B V1.0 SFT is a fine-tuned version of Llama 1 that was trained on
 | DEITA-7B-v1.0             | SFT + DPO | 6K SFT + 10K DPO   | 7.55     | 90.06         | 69.86          |
-</details>
 ## Input Format

 # Model Card for Deita Llama1 13B V1.0 SFT
+[GitHub](https://github.com/hkust-nlp/deita) | [Paper](https://arxiv.org/abs/2312.15685)
 Deita is an open-sourced project designed to facilitate **Automatic Data Selection** for instruction tuning in Large Language Models (LLMs).
 Deita Llama1 13B V1.0 SFT is a fine-tuned version of Llama 1 that was trained on 10k automatically selected lightweight, high-quality alignment SFT data: [Deita 10K V0](https://huggingface.co/datasets/hkust-nlp/deita-10k-v0).
 ## Performance
 | Model                                          | Align     | Data Size  | MT-Bench | AlpacaEval(%) | OpenLLM (Avg.) |
 |------------------------------------------------|-----------|------------|----------|---------------|----------------|
 | DEITA-7B-v1.0             | SFT + DPO | 6K SFT + 10K DPO   | 7.55     | 90.06         | 69.86          |
 ## Input Format