Create README.md
Browse files
README.md
ADDED
@@ -0,0 +1,18 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
# これはなに?
|
2 |
+
`stabilityai/japanese-stablelm-base-alpha-7b` を `rosebleu` データセットで学習した Lora
|
3 |
+
|
4 |
+
## 使い方
|
5 |
+
.\text-generation-webui\loras\Rosebleu となるように配置。
|
6 |
+
`text-generation-webui` の `model` の LoRAから読み込める。
|
7 |
+
|
8 |
+
## データセット
|
9 |
+
https://gitlab.com/open_contents_datasets/Rosebleu
|
10 |
+
Hシーンも含まれているみたいですが、特に区別せずに突っ込んでいます。
|
11 |
+
|
12 |
+
## 前処理とデータロード
|
13 |
+
中にあるすべてのtsvを全部繋て、csvにしただけ。
|
14 |
+
学習プロンプトはこの用にしているので、このフォーマットだと良くなったりすることがあるかもしれないし、ないかもしれない。
|
15 |
+
コンテキスト長は2048にしているので、1行が2048トークン以上は切り捨てられているはず。
|
16 |
+
```
|
17 |
+
result = f'### name:\n{data_point["name"]}\n\n### text:\n{data_point["text"]}'
|
18 |
+
```
|