abeja
/

gpt-neox-japanese-2.7b

sakasegawa commited on Apr 10, 2023

Commit

c4958c0

•

1 Parent(s): 06c5e43

Fix typo (#2)

Files changed (1) hide show

README.md CHANGED Viewed

@@ -82,7 +82,7 @@ for gen_text in tokenizer.batch_decode(gen_tokens, skip_special_tokens=True):
 The model was trained on [Japanese CC-100](http://data.statmt.org/cc-100/ja.txt.xz), [Japanese Wikipedia](https://dumps.wikimedia.org/other/cirrussearch), and [Japanese OSCAR](https://huggingface.co/datasets/oscar).
 # Tokenization
-The model uses a [special sub-word tokenizer](https://github.com/tanreinama/Japanese-BPEEncoder_V2). Please refer the original repository or [GPT-NoeX-Japanese](https://huggingface.co/docs/transformers/model_doc/gpt_neox_japanese) in detail.
 # Licenese
 [The MIT license](https://opensource.org/licenses/MIT)

 The model was trained on [Japanese CC-100](http://data.statmt.org/cc-100/ja.txt.xz), [Japanese Wikipedia](https://dumps.wikimedia.org/other/cirrussearch), and [Japanese OSCAR](https://huggingface.co/datasets/oscar).
 # Tokenization
+The model uses a [special sub-word tokenizer](https://github.com/tanreinama/Japanese-BPEEncoder_V2). Please refer the original repository or [GPT-NeoX-Japanese](https://huggingface.co/docs/transformers/model_doc/gpt_neox_japanese) in detail.
 # Licenese
 [The MIT license](https://opensource.org/licenses/MIT)