|
--- |
|
license: apache-2.0 |
|
datasets: |
|
- iljoo/chatbot_dataset1 |
|
base_model: |
|
- MLP-KTLim/llama-3-Korean-Bllossom-8B |
|
--- |
|
|
|
### Base model |
|
MLP-KTLim/llama-3-Korean-Bllossom-8B |
|
|
|
### Dataset |
|
1) AIHub : ํ๊ตญ์ด ์ฑ๋ฅ์ด ๊ฐ์ ๋ ์ด๊ฑฐ๋ AI ์ธ์ด๋ชจ๋ธ ๊ฐ๋ฐ ๋ฐ ๋ฐ์ดํฐ |
|
- ๋ฐ์ดํฐ ์๊ฐ : ํ๊ตญ์ด ๋ง๋ญ์น ๋ฐ์ดํฐ 20์ต ์ด์ /310๋ง ๊ฑด๊ณผ RLHF ๋ฐ์ดํฐ 7๋ง 7์ฒ๊ฑด์ผ๋ก ๊ตฌ์ฑ ๋จ |
|
- RLHF ๋ฐ์ดํฐ > SFT ๋ฐ์ดํฐ 10,579๊ฐ ๋ฐ์ดํฐ ํ์ฉ |
|
2) ์ฌ์ ์ ๋ณด AI ๊ฒ์ ์๊ณ ๋ฆฌ์ฆ ๊ฒฝ์ง๋ํ ๋ฐ์ดํฐ |
|
- ๋ฐ์ดํฐ ์๊ฐ : ์ค์์ ๋ถ ์ฌ์ ์ ๋ณด ๊ด๋ จ ์ง์ ์๋ต ๋ฐ์ดํฐ |
|
- train dataset : 498๊ฐ ๋ฐ์ดํฐ ํ์ฉ |
|
|
|
### Data structure |
|
- Data format |
|
- {instruction:, response:} |
|
|
|
### Parameter |
|
[2024.10.24] |
|
- QLoRA : Rank 4 |
|
- max_length : 512 |
|
- Epoch : 10 |