Add corpus size
Browse files
README.md
CHANGED
@@ -14,7 +14,7 @@ datasets:
|
|
14 |
|
15 |
This is a T5 (Text-to-Text Transfer Transformer) model pretrained on Japanese corpus.
|
16 |
|
17 |
-
|
18 |
|
19 |
* [Wikipedia](https://ja.wikipedia.org)の日本語ダンプデータ (2020年7月6日時点のもの)
|
20 |
* [mC4](https://github.com/allenai/allennlp/discussions/5056)の日本語コーパス(正確にはc4/multilingualのjaスプリット)
|
|
|
14 |
|
15 |
This is a T5 (Text-to-Text Transfer Transformer) model pretrained on Japanese corpus.
|
16 |
|
17 |
+
次の日本語コーパス(約890GB)を用いて事前学習を行ったT5 (Text-to-Text Transfer Transformer) モデルです。
|
18 |
|
19 |
* [Wikipedia](https://ja.wikipedia.org)の日本語ダンプデータ (2020年7月6日時点のもの)
|
20 |
* [mC4](https://github.com/allenai/allennlp/discussions/5056)の日本語コーパス(正確にはc4/multilingualのjaスプリット)
|