dbmdz
/

electra-base-turkish-mc4-uncased-generator

tokenizer: add config (no accent stripping) and vocab

6cd52d3 about 3 years ago

82 Bytes

	{"do_lower_case": true, "max_len": 512, "init_inputs": [], "strip_accents":false}