aya-se commited on
Commit
65e1c88
·
1 Parent(s): ab87835

Fix citations

Browse files
Files changed (2) hide show
  1. README.md +1 -2
  2. README_ja.md +1 -2
README.md CHANGED
@@ -65,7 +65,7 @@ In our research, we have demonstrated that both classifiers were effective. Howe
65
 
66
  ## Training
67
 
68
- Both classifiers were trained using fastText with 20 epochs on the training data. Character n-grams (*n*=2,3) were used as features. Word n-grams were not applied as they did not contribute to improving accuracy.
69
 
70
  ### Wiki-based Classifier
71
 
@@ -92,7 +92,6 @@ The preprint can be downloaded [here](https://huggingface.co/tokyotech-llm/edu-c
92
  author = {服部 翔 and 岡崎 直観 and 水木 栄 and 藤井 一喜 and 中村 泰士 and 大井 聖也 and 塩谷 泰平 and 齋藤 幸史郎 and Youmi Ma and 前田 航希 and 岡本 拓己 and 石田 茂樹 and 横田 理央 and 高村 大也},
93
  title = {Swallowコーパスv2: 教育的な日本語ウェブコーパスの構築},
94
  booktitle = {言語処理学会第31回年次大会 (NLP2025)},
95
- comment = mar,
96
  year = {2025},
97
  }
98
  ```
 
65
 
66
  ## Training
67
 
68
+ Both classifiers were trained using fastText with 20 epochs on the training data. Character n-grams (_n_=2,3) were used as features. Word n-grams were not applied as they did not contribute to improving accuracy.
69
 
70
  ### Wiki-based Classifier
71
 
 
92
  author = {服部 翔 and 岡崎 直観 and 水木 栄 and 藤井 一喜 and 中村 泰士 and 大井 聖也 and 塩谷 泰平 and 齋藤 幸史郎 and Youmi Ma and 前田 航希 and 岡本 拓己 and 石田 茂樹 and 横田 理央 and 高村 大也},
93
  title = {Swallowコーパスv2: 教育的な日本語ウェブコーパスの構築},
94
  booktitle = {言語処理学会第31回年次大会 (NLP2025)},
 
95
  year = {2025},
96
  }
97
  ```
README_ja.md CHANGED
@@ -49,7 +49,7 @@ edu_score = sum([int(label[-1]) * prob for label, prob in zip(res[0], res[1])])
49
 
50
  ## 訓練
51
 
52
- いずれの分類器も、fastText で訓練データを 20 エポック学習しました。文字 n-gram $(n=2,3)$を特徴量に用いました。単語 n-gram は精度向上に繋がらなかったため、採用しませんでした。
53
 
54
  ### Wiki-based classifier
55
 
@@ -76,7 +76,6 @@ Wikipedia 記事を教育的な文書の正例と見なし、分類器を構築
76
  author = {服部 翔 and 岡崎 直観 and 水木 栄 and 藤井 一喜 and 中村 泰士 and 大井 聖也 and 塩谷 泰平 and 齋藤 幸史郎 and Youmi Ma and 前田 航希 and 岡本 拓己 and 石田 茂樹 and 横田 理央 and 高村 大也},
77
  title = {Swallowコーパスv2: 教育的な日本語ウェブコーパスの構築},
78
  booktitle = {言語処理学会第31回年次大会 (NLP2025)},
79
- comment = mar,
80
  year = {2025},
81
  }
82
  ```
 
49
 
50
  ## 訓練
51
 
52
+ いずれの分類器も、fastText で訓練データを 20 エポック学習しました。文字 n-gram (_n_=2,3) を特徴量に用いました。単語 n-gram は精度向上に繋がらなかったため、採用しませんでした。
53
 
54
  ### Wiki-based classifier
55
 
 
76
  author = {服部 翔 and 岡崎 直観 and 水木 栄 and 藤井 一喜 and 中村 泰士 and 大井 聖也 and 塩谷 泰平 and 齋藤 幸史郎 and Youmi Ma and 前田 航希 and 岡本 拓己 and 石田 茂樹 and 横田 理央 and 高村 大也},
77
  title = {Swallowコーパスv2: 教育的な日本語ウェブコーパスの構築},
78
  booktitle = {言語処理学会第31回年次大会 (NLP2025)},
 
79
  year = {2025},
80
  }
81
  ```