sbintuitions
/

sarashina1-7b

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

kajyuuen commited on Jun 27

Commit

725aab8

•

1 Parent(s): 67facba

Use FastTokenizer

Files changed (2) hide show

README.md +1 -3
tokenizer_config.json +2 -1

README.md CHANGED Viewed

@@ -11,14 +11,12 @@ This repository provides Japanese language models trained by [SB Intuitions](htt
 ## How to use
-Please set **use_fast=False** to use our tokenizer properly.
 ```python
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline, set_seed
 model = AutoModelForCausalLM.from_pretrained("sbintuitions/sarashina1-7b", torch_dtype=torch.float16, device_map="auto")
-tokenizer = AutoTokenizer.from_pretrained("sbintuitions/sarashina1-7b", use_fast=False)
 generator = pipeline("text-generation", model=model, tokenizer=tokenizer)
 set_seed(123)

 ## How to use
 ```python
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline, set_seed
 model = AutoModelForCausalLM.from_pretrained("sbintuitions/sarashina1-7b", torch_dtype=torch.float16, device_map="auto")
+tokenizer = AutoTokenizer.from_pretrained("sbintuitions/sarashina1-7b")
 generator = pipeline("text-generation", model=model, tokenizer=tokenizer)
 set_seed(123)

tokenizer_config.json CHANGED Viewed

@@ -9,7 +9,8 @@
     "mask_token": "<mask>",
     "cls_token": "<cls>",
     "sep_token": "<sep>",
     "sp_model_kwargs": {},
     "special_tokens_map_file": null,
-    "tokenizer_class": "T5Tokenizer"
 }

     "mask_token": "<mask>",
     "cls_token": "<cls>",
     "sep_token": "<sep>",
+    "padding_side": "left",
     "sp_model_kwargs": {},
     "special_tokens_map_file": null,
+    "tokenizer_class": "PreTrainedTokenizerFast"
 }