hext5 / special_tokens_map.json
ejschwartz's picture
Upload tokenizer
e0f3ae1 verified
raw
history blame
5.62 kB
{
"additional_special_tokens": [
"<en>",
"<idap>",
"<var_0>",
"<var_1>",
"<var_2>",
"<var_3>",
"<var_4>",
"<var_5>",
"<var_6>",
"<var_7>",
"<var_8>",
"<var_9>",
"<var_10>",
"<var_11>",
"<var_12>",
"<var_13>",
"<var_14>",
"<var_15>",
"<var_16>",
"<var_17>",
"<var_18>",
"<var_19>",
"<var_20>",
"<var_21>",
"<var_22>",
"<var_23>",
"<var_24>",
"<var_25>",
"<var_26>",
"<var_27>",
"<var_28>",
"<var_29>",
"<var_30>",
"<var_31>",
"<var_32>",
"<var_33>",
"<var_34>",
"<var_35>",
"<var_36>",
"<var_37>",
"<var_38>",
"<var_39>",
"<var_40>",
"<var_41>",
"<var_42>",
"<var_43>",
"<var_44>",
"<var_45>",
"<var_46>",
"<var_47>",
"<var_48>",
"<var_49>",
"<var_50>",
"<var_51>",
"<var_52>",
"<var_53>",
"<var_54>",
"<var_55>",
"<var_56>",
"<var_57>",
"<var_58>",
"<var_59>",
"<var_60>",
"<var_61>",
"<var_62>",
"<var_63>",
"<var_64>",
"<var_65>",
"<var_66>",
"<var_67>",
"<var_68>",
"<var_69>",
"<var_70>",
"<var_71>",
"<var_72>",
"<var_73>",
"<var_74>",
"<var_75>",
"<var_76>",
"<var_77>",
"<var_78>",
"<var_79>",
"<var_80>",
"<var_81>",
"<var_82>",
"<var_83>",
"<var_84>",
"<var_85>",
"<var_86>",
"<var_87>",
"<var_88>",
"<var_89>",
"<var_90>",
"<var_91>",
"<var_92>",
"<var_93>",
"<var_94>",
"<var_95>",
"<var_96>",
"<var_97>",
"<var_98>",
"<var_99>",
"<func_1>",
"<func_2>",
"<func_3>",
"<func_4>",
"<func_5>",
"<func_6>",
"<func_7>",
"<func_8>",
"<func_9>",
"<func_10>",
"<func_11>",
"<func_12>",
"<func_13>",
"<func_14>",
"<func_15>",
"<func_16>",
"<func_17>",
"<func_18>",
"<func_19>",
"<func_20>",
"<func_21>",
"<func_22>",
"<func_23>",
"<func_24>",
"<func_25>",
"<func_26>",
"<func_27>",
"<func_28>",
"<func_29>",
"<func_30>",
"<func_31>",
"<func_32>",
"<func_33>",
"<func_34>",
"<func_35>",
"<func_36>",
"<func_37>",
"<func_38>",
"<func_39>",
"<func_40>",
"<func_41>",
"<func_42>",
"<func_43>",
"<func_44>",
"<func_45>",
"<func_46>",
"<func_47>",
"<func_48>",
"<func_49>",
"<func>",
"<ukn>",
"<pad>",
"<s>",
"</s>",
"<unk>",
"<mask>",
"<extra_id_99>",
"<extra_id_98>",
"<extra_id_97>",
"<extra_id_96>",
"<extra_id_95>",
"<extra_id_94>",
"<extra_id_93>",
"<extra_id_92>",
"<extra_id_91>",
"<extra_id_90>",
"<extra_id_89>",
"<extra_id_88>",
"<extra_id_87>",
"<extra_id_86>",
"<extra_id_85>",
"<extra_id_84>",
"<extra_id_83>",
"<extra_id_82>",
"<extra_id_81>",
"<extra_id_80>",
"<extra_id_79>",
"<extra_id_78>",
"<extra_id_77>",
"<extra_id_76>",
"<extra_id_75>",
"<extra_id_74>",
"<extra_id_73>",
"<extra_id_72>",
"<extra_id_71>",
"<extra_id_70>",
"<extra_id_69>",
"<extra_id_68>",
"<extra_id_67>",
"<extra_id_66>",
"<extra_id_65>",
"<extra_id_64>",
"<extra_id_63>",
"<extra_id_62>",
"<extra_id_61>",
"<extra_id_60>",
"<extra_id_59>",
"<extra_id_58>",
"<extra_id_57>",
"<extra_id_56>",
"<extra_id_55>",
"<extra_id_54>",
"<extra_id_53>",
"<extra_id_52>",
"<extra_id_51>",
"<extra_id_50>",
"<extra_id_49>",
"<extra_id_48>",
"<extra_id_47>",
"<extra_id_46>",
"<extra_id_45>",
"<extra_id_44>",
"<extra_id_43>",
"<extra_id_42>",
"<extra_id_41>",
"<extra_id_40>",
"<extra_id_39>",
"<extra_id_38>",
"<extra_id_37>",
"<extra_id_36>",
"<extra_id_35>",
"<extra_id_34>",
"<extra_id_33>",
"<extra_id_32>",
"<extra_id_31>",
"<extra_id_30>",
"<extra_id_29>",
"<extra_id_28>",
"<extra_id_27>",
"<extra_id_26>",
"<extra_id_25>",
"<extra_id_24>",
"<extra_id_23>",
"<extra_id_22>",
"<extra_id_21>",
"<extra_id_20>",
"<extra_id_19>",
"<extra_id_18>",
"<extra_id_17>",
"<extra_id_16>",
"<extra_id_15>",
"<extra_id_14>",
"<extra_id_13>",
"<extra_id_12>",
"<extra_id_11>",
"<extra_id_10>",
"<extra_id_9>",
"<extra_id_8>",
"<extra_id_7>",
"<extra_id_6>",
"<extra_id_5>",
"<extra_id_4>",
"<extra_id_3>",
"<extra_id_2>",
"<extra_id_1>",
"<extra_id_0>"
],
"bos_token": {
"content": "<s>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false
},
"cls_token": {
"content": "<s>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false
},
"eos_token": {
"content": "</s>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false
},
"mask_token": {
"content": "<mask>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false
},
"pad_token": {
"content": "<pad>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false
},
"sep_token": {
"content": "</s>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false
},
"unk_token": {
"content": "<unk>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false
}
}