sonoisa commited on
Commit
d94ee31
·
1 Parent(s): 3cf8b5f

Add description of training steps

Browse files
Files changed (1) hide show
  1. README.md +17 -1
README.md CHANGED
@@ -9,4 +9,20 @@ license: cc-by-sa-4.0
9
 
10
  # 回答と回答が出てくるパラグラフを与えると質問文を生成するモデル
11
 
12
- SEE: https://github.com/sonoisa/deep-question-generation
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
9
 
10
  # 回答と回答が出てくるパラグラフを与えると質問文を生成するモデル
11
 
12
+ SEE: https://github.com/sonoisa/deep-question-generation
13
+
14
+
15
+ ## 本モデルの作成ステップ概要
16
+
17
+ 1. [SQuAD 1.1](https://rajpurkar.github.io/SQuAD-explorer/)を日本語に機械翻訳し、不正なデータをクレンジング(有効なデータは約半分)。
18
+ 回答が含まれるコンテキスト、質問文、解答の3つ組ができる。
19
+ 2. [日本語T5モデル](https://huggingface.co/sonoisa/t5-base-japanese)を次の設定でファインチューニングを実行
20
+ * 入力: "answer: {解答} content: {回答が含まれるコンテキスト}"
21
+ * 出力: "{質問文}"
22
+ * 各種ハイパーパラメータ
23
+ * 最大入力トークン数: 512
24
+ * 最大出力トークン数: 64
25
+ * 最適化アルゴリズム: AdaFactor
26
+ * 学習率: 0.001(固定)
27
+ * バッチサイズ: 128
28
+ * ステップ数: 2500(500ステップごとにチェックポイントを出力、定量・定性評価を行い2500ステップ目を採用)