thomas880104 commited on
Commit
9a1e052
·
1 Parent(s): f3c836b

update training model

Browse files
README.md CHANGED
@@ -1,6 +1,6 @@
1
  ---
2
  language:
3
- - zh
4
  license: apache-2.0
5
  tags:
6
  - whisper-event
@@ -10,7 +10,7 @@ datasets:
10
  metrics:
11
  - wer
12
  model-index:
13
- - name: Whisper large-v2 nan-tw
14
  results:
15
  - task:
16
  name: Automatic Speech Recognition
@@ -19,24 +19,24 @@ model-index:
19
  name: mozilla-foundation/common_voice_11_0 nan-tw
20
  type: mozilla-foundation/common_voice_11_0
21
  config: nan-tw
22
- split: train
23
  args: nan-tw
24
  metrics:
25
  - name: Wer
26
  type: wer
27
- value: 118.50381679389312
28
  ---
29
 
30
  <!-- This model card has been generated automatically according to the information the Trainer had access to. You
31
  should probably proofread and complete it, then remove this comment. -->
32
 
33
- # Whisper large-v2 nan-tw
34
 
35
  This model is a fine-tuned version of [openai/whisper-large-v2](https://huggingface.co/openai/whisper-large-v2) on the mozilla-foundation/common_voice_11_0 nan-tw dataset.
36
  It achieves the following results on the evaluation set:
37
- - Loss: 3.2129
38
- - Wer: 118.5038
39
- - Cer: 123.4531
40
 
41
  ## Model description
42
 
@@ -61,24 +61,20 @@ The following hyperparameters were used during training:
61
  - seed: 42
62
  - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
63
  - lr_scheduler_type: linear
64
- - lr_scheduler_warmup_steps: 500
65
- - training_steps: 5000
66
  - mixed_precision_training: Native AMP
67
 
68
  ### Training results
69
 
70
- | Training Loss | Epoch | Step | Validation Loss | Wer | Cer |
71
- |:-------------:|:-----:|:----:|:---------------:|:--------:|:--------:|
72
- | 3.5696 | 1.04 | 1000 | 3.4190 | 96.8550 | 96.8910 |
73
- | 3.1453 | 2.08 | 2000 | 3.2383 | 98.9313 | 98.9436 |
74
- | 3.0722 | 3.13 | 3000 | 3.2043 | 129.0687 | 158.5270 |
75
- | 2.8327 | 5.01 | 4000 | 3.2258 | 327.9084 | 333.0516 |
76
- | 2.6468 | 6.05 | 5000 | 3.2129 | 118.5038 | 123.4531 |
77
 
78
 
79
  ### Framework versions
80
 
81
- - Transformers 4.25.1
82
  - Pytorch 1.13.1+cu117
83
  - Datasets 2.8.0
84
  - Tokenizers 0.13.2
 
1
  ---
2
  language:
3
+ - nan-tw
4
  license: apache-2.0
5
  tags:
6
  - whisper-event
 
10
  metrics:
11
  - wer
12
  model-index:
13
+ - name: Whisper large-v2 nan-tw only char
14
  results:
15
  - task:
16
  name: Automatic Speech Recognition
 
19
  name: mozilla-foundation/common_voice_11_0 nan-tw
20
  type: mozilla-foundation/common_voice_11_0
21
  config: nan-tw
22
+ split: test
23
  args: nan-tw
24
  metrics:
25
  - name: Wer
26
  type: wer
27
+ value: 48.06106870229008
28
  ---
29
 
30
  <!-- This model card has been generated automatically according to the information the Trainer had access to. You
31
  should probably proofread and complete it, then remove this comment. -->
32
 
33
+ # vscode
34
 
35
  This model is a fine-tuned version of [openai/whisper-large-v2](https://huggingface.co/openai/whisper-large-v2) on the mozilla-foundation/common_voice_11_0 nan-tw dataset.
36
  It achieves the following results on the evaluation set:
37
+ - Loss: 0.9147
38
+ - Wer: 48.0611
39
+ - Cer: 48.1739
40
 
41
  ## Model description
42
 
 
61
  - seed: 42
62
  - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
63
  - lr_scheduler_type: linear
64
+ - lr_scheduler_warmup_steps: 100
65
+ - training_steps: 1000
66
  - mixed_precision_training: Native AMP
67
 
68
  ### Training results
69
 
70
+ | Training Loss | Epoch | Step | Validation Loss | Wer | Cer |
71
+ |:-------------:|:-----:|:----:|:---------------:|:-------:|:-------:|
72
+ | 0.9198 | 1.38 | 1000 | 0.9147 | 48.0611 | 48.1739 |
 
 
 
 
73
 
74
 
75
  ### Framework versions
76
 
77
+ - Transformers 4.27.0.dev0
78
  - Pytorch 1.13.1+cu117
79
  - Datasets 2.8.0
80
  - Tokenizers 0.13.2
all_results.json CHANGED
@@ -1,13 +1,13 @@
1
  {
2
- "epoch": 6.05,
3
- "eval_cer": 123.45306368849984,
4
- "eval_loss": 3.212874174118042,
5
- "eval_runtime": 303.2793,
6
- "eval_samples_per_second": 3.251,
7
- "eval_steps_per_second": 1.626,
8
- "eval_wer": 118.50381679389312,
9
- "train_loss": 3.0522214595794677,
10
- "train_runtime": 5458.8622,
11
- "train_samples_per_second": 1.832,
12
- "train_steps_per_second": 0.916
13
  }
 
1
  {
2
+ "epoch": 1.38,
3
+ "eval_cer": 48.17386054935105,
4
+ "eval_loss": 0.9147109389305115,
5
+ "eval_runtime": 340.4629,
6
+ "eval_samples_per_second": 2.896,
7
+ "eval_steps_per_second": 1.448,
8
+ "eval_wer": 48.06106870229008,
9
+ "train_loss": 0.91982373046875,
10
+ "train_runtime": 1347.6358,
11
+ "train_samples_per_second": 1.484,
12
+ "train_steps_per_second": 0.742
13
  }
config.json CHANGED
@@ -2,6 +2,7 @@
2
  "_name_or_path": "openai/whisper-large-v2",
3
  "activation_dropout": 0.0,
4
  "activation_function": "gelu",
 
5
  "architectures": [
6
  "WhisperForConditionalGeneration"
7
  ],
@@ -26,6 +27,12 @@
26
  "forced_decoder_ids": null,
27
  "init_std": 0.02,
28
  "is_encoder_decoder": true,
 
 
 
 
 
 
29
  "max_length": 448,
30
  "max_source_positions": 1500,
31
  "max_target_positions": 448,
@@ -35,7 +42,7 @@
35
  "pad_token_id": 50257,
36
  "scale_embedding": false,
37
  "torch_dtype": "float32",
38
- "transformers_version": "4.25.1",
39
  "use_cache": true,
40
  "vocab_size": 51865
41
  }
 
2
  "_name_or_path": "openai/whisper-large-v2",
3
  "activation_dropout": 0.0,
4
  "activation_function": "gelu",
5
+ "apply_spec_augment": false,
6
  "architectures": [
7
  "WhisperForConditionalGeneration"
8
  ],
 
27
  "forced_decoder_ids": null,
28
  "init_std": 0.02,
29
  "is_encoder_decoder": true,
30
+ "mask_feature_length": 10,
31
+ "mask_feature_min_masks": 0,
32
+ "mask_feature_prob": 0.0,
33
+ "mask_time_length": 10,
34
+ "mask_time_min_masks": 2,
35
+ "mask_time_prob": 0.05,
36
  "max_length": 448,
37
  "max_source_positions": 1500,
38
  "max_target_positions": 448,
 
42
  "pad_token_id": 50257,
43
  "scale_embedding": false,
44
  "torch_dtype": "float32",
45
+ "transformers_version": "4.27.0.dev0",
46
  "use_cache": true,
47
  "vocab_size": 51865
48
  }
eval_results.json CHANGED
@@ -1,9 +1,9 @@
1
  {
2
- "epoch": 6.05,
3
- "eval_cer": 123.45306368849984,
4
- "eval_loss": 3.212874174118042,
5
- "eval_runtime": 303.2793,
6
- "eval_samples_per_second": 3.251,
7
- "eval_steps_per_second": 1.626,
8
- "eval_wer": 118.50381679389312
9
  }
 
1
  {
2
+ "epoch": 1.38,
3
+ "eval_cer": 48.17386054935105,
4
+ "eval_loss": 0.9147109389305115,
5
+ "eval_runtime": 340.4629,
6
+ "eval_samples_per_second": 2.896,
7
+ "eval_steps_per_second": 1.448,
8
+ "eval_wer": 48.06106870229008
9
  }
generation_config.json ADDED
@@ -0,0 +1,225 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "begin_suppress_tokens": [
3
+ 220,
4
+ 50257
5
+ ],
6
+ "bos_token_id": 50257,
7
+ "decoder_start_token_id": 50258,
8
+ "eos_token_id": 50257,
9
+ "forced_decoder_ids": [
10
+ [
11
+ 1,
12
+ null
13
+ ],
14
+ [
15
+ 2,
16
+ 50359
17
+ ],
18
+ [
19
+ 3,
20
+ 50363
21
+ ]
22
+ ],
23
+ "is_multilingual": true,
24
+ "lang_to_id": {
25
+ "<|af|>": 50327,
26
+ "<|am|>": 50334,
27
+ "<|ar|>": 50272,
28
+ "<|as|>": 50350,
29
+ "<|az|>": 50304,
30
+ "<|ba|>": 50355,
31
+ "<|be|>": 50330,
32
+ "<|bg|>": 50292,
33
+ "<|bn|>": 50302,
34
+ "<|bo|>": 50347,
35
+ "<|br|>": 50309,
36
+ "<|bs|>": 50315,
37
+ "<|ca|>": 50270,
38
+ "<|cs|>": 50283,
39
+ "<|cy|>": 50297,
40
+ "<|da|>": 50285,
41
+ "<|de|>": 50261,
42
+ "<|el|>": 50281,
43
+ "<|en|>": 50259,
44
+ "<|es|>": 50262,
45
+ "<|et|>": 50307,
46
+ "<|eu|>": 50310,
47
+ "<|fa|>": 50300,
48
+ "<|fi|>": 50277,
49
+ "<|fo|>": 50338,
50
+ "<|fr|>": 50265,
51
+ "<|gl|>": 50319,
52
+ "<|gu|>": 50333,
53
+ "<|haw|>": 50352,
54
+ "<|ha|>": 50354,
55
+ "<|he|>": 50279,
56
+ "<|hi|>": 50276,
57
+ "<|hr|>": 50291,
58
+ "<|ht|>": 50339,
59
+ "<|hu|>": 50286,
60
+ "<|hy|>": 50312,
61
+ "<|id|>": 50275,
62
+ "<|is|>": 50311,
63
+ "<|it|>": 50274,
64
+ "<|ja|>": 50266,
65
+ "<|jw|>": 50356,
66
+ "<|ka|>": 50329,
67
+ "<|kk|>": 50316,
68
+ "<|km|>": 50323,
69
+ "<|kn|>": 50306,
70
+ "<|ko|>": 50264,
71
+ "<|la|>": 50294,
72
+ "<|lb|>": 50345,
73
+ "<|ln|>": 50353,
74
+ "<|lo|>": 50336,
75
+ "<|lt|>": 50293,
76
+ "<|lv|>": 50301,
77
+ "<|mg|>": 50349,
78
+ "<|mi|>": 50295,
79
+ "<|mk|>": 50308,
80
+ "<|ml|>": 50296,
81
+ "<|mn|>": 50314,
82
+ "<|mr|>": 50320,
83
+ "<|ms|>": 50282,
84
+ "<|mt|>": 50343,
85
+ "<|my|>": 50346,
86
+ "<|ne|>": 50313,
87
+ "<|nl|>": 50271,
88
+ "<|nn|>": 50342,
89
+ "<|no|>": 50288,
90
+ "<|oc|>": 50328,
91
+ "<|pa|>": 50321,
92
+ "<|pl|>": 50269,
93
+ "<|ps|>": 50340,
94
+ "<|pt|>": 50267,
95
+ "<|ro|>": 50284,
96
+ "<|ru|>": 50263,
97
+ "<|sa|>": 50344,
98
+ "<|sd|>": 50332,
99
+ "<|si|>": 50322,
100
+ "<|sk|>": 50298,
101
+ "<|sl|>": 50305,
102
+ "<|sn|>": 50324,
103
+ "<|so|>": 50326,
104
+ "<|sq|>": 50317,
105
+ "<|sr|>": 50303,
106
+ "<|su|>": 50357,
107
+ "<|sv|>": 50273,
108
+ "<|sw|>": 50318,
109
+ "<|ta|>": 50287,
110
+ "<|te|>": 50299,
111
+ "<|tg|>": 50331,
112
+ "<|th|>": 50289,
113
+ "<|tk|>": 50341,
114
+ "<|tl|>": 50348,
115
+ "<|tr|>": 50268,
116
+ "<|tt|>": 50351,
117
+ "<|uk|>": 50280,
118
+ "<|ur|>": 50290,
119
+ "<|uz|>": 50337,
120
+ "<|vi|>": 50278,
121
+ "<|yi|>": 50335,
122
+ "<|yo|>": 50325,
123
+ "<|zh|>": 50260
124
+ },
125
+ "max_initial_timestamp_index": 1,
126
+ "max_length": 448,
127
+ "no_timestamps_token_id": 50363,
128
+ "pad_token_id": 50257,
129
+ "return_timestamps": false,
130
+ "suppress_tokens": [
131
+ 1,
132
+ 2,
133
+ 7,
134
+ 8,
135
+ 9,
136
+ 10,
137
+ 14,
138
+ 25,
139
+ 26,
140
+ 27,
141
+ 28,
142
+ 29,
143
+ 31,
144
+ 58,
145
+ 59,
146
+ 60,
147
+ 61,
148
+ 62,
149
+ 63,
150
+ 90,
151
+ 91,
152
+ 92,
153
+ 93,
154
+ 359,
155
+ 503,
156
+ 522,
157
+ 542,
158
+ 873,
159
+ 893,
160
+ 902,
161
+ 918,
162
+ 922,
163
+ 931,
164
+ 1350,
165
+ 1853,
166
+ 1982,
167
+ 2460,
168
+ 2627,
169
+ 3246,
170
+ 3253,
171
+ 3268,
172
+ 3536,
173
+ 3846,
174
+ 3961,
175
+ 4183,
176
+ 4667,
177
+ 6585,
178
+ 6647,
179
+ 7273,
180
+ 9061,
181
+ 9383,
182
+ 10428,
183
+ 10929,
184
+ 11938,
185
+ 12033,
186
+ 12331,
187
+ 12562,
188
+ 13793,
189
+ 14157,
190
+ 14635,
191
+ 15265,
192
+ 15618,
193
+ 16553,
194
+ 16604,
195
+ 18362,
196
+ 18956,
197
+ 20075,
198
+ 21675,
199
+ 22520,
200
+ 26130,
201
+ 26161,
202
+ 26435,
203
+ 28279,
204
+ 29464,
205
+ 31650,
206
+ 32302,
207
+ 32470,
208
+ 36865,
209
+ 42863,
210
+ 47425,
211
+ 49870,
212
+ 50254,
213
+ 50258,
214
+ 50358,
215
+ 50359,
216
+ 50360,
217
+ 50361,
218
+ 50362
219
+ ],
220
+ "task_to_id": {
221
+ "transcribe": 50359,
222
+ "translate": 50358
223
+ },
224
+ "transformers_version": "4.27.0.dev0"
225
+ }
merges.txt CHANGED
@@ -1,4 +1,4 @@
1
- #version: 0.2
2
  Ġ a
3
  Ġt h
4
  i n
 
1
+ #version: 0.2 - Trained by `huggingface/tokenizers`
2
  Ġ a
3
  Ġt h
4
  i n
pred.txt CHANGED
@@ -1 +1 @@
1
- pred_str=['三 頭 無 小 ', '三 頭 無 無 ', '三 頭 無 ', '三 頭 人 無 人 ', '大 人 無 ', '三 頭 一 人 ', '跤 頭 ', '三 頭 無 小 ', '大 坑 ', '大 湯 ', '三 頭 無 ', '跤 頭 ', '三 頭 仔 ', '烏 頭 ', '大 人 無 ', '跤 頭 ', '大 頭 仔 ', '三 頭 仔 ', '大 湲 ', '三 人 無 無 ', '大 人 人 人 人 人 ', '跤 仔 ', '大 人 無 無 ', '大 坑 ', '三 頭 仔 ', '跤 仔 ', '跤 頭 ', '三 頭 人 人 人 人 生 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '大 頭 ', '大 人 無 無 ', '大 湲 ', '大 頭 仔 ', '徘 ', '大 坑 ', '大 角 ', '三 頭 無 ', '大 人 人 人 人 人 ', '大 湯 ', '大 湲 ', '三 頭 頭 ', '大 人 無 ', '大 大 路 ', '大 大 路 ', '大 坑 ', '三 頭 仔 ', '跤 仔 ', '三 頭 無 小 ', '大 角 仔 ', '跤 頭 ', '大 坵 ', '雞 仔 仔 ', '鵾 仔 ', '大 大 路 ', '大 人 人 人 人 ', '三 頭 頭 ', '三 頭 仔 ', '三 頭 無 ', '大 人 無 ', '大 磾 ', '跤 仔 ', '跤 頭 ', '三 人 無 無 人 ', '三 頭 仔 ', '跤 仔 ', '大 人 無 無 ', '大 人 人 人 人 ', '大 火 ', '大 磾 ', '大 頭 仔 ', '大 磾 ', '大 坑 ', '大 湲 ', '大 坵 ', '大 人 無 ', '大 大 路 ', '大 湲 ', '大 人 無 ', '大 人 人 人 ', '三 頭 仔 ', '大 人 無 ', '跤 ', '三 頭 無 無 ', '大 頭 仔 ', '跤 仔 ', '跤 頭 ', '三 頭 無 人 ', '鵭 仔 ', '大 頭 仔 ', '烏 頭 ', '三 頭 頭 ', '跤 仔 ', '大 磾 ', '三 頭 無 無 ', '三 頭 無 無 ', '三 頭 人 人 人 ', '三 人 人 人 一 人 生 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '大 頭 仔 ', '跤 頭 ', '大 大 路 ', '大 頭 ', '跤 仔 ', '跤 頭 ', '跤 仔 ', '鵭 仔 ', '跤 頭 ', '雞 頭 ', '跤 仔 ', '三 頭 頭 ', '跤 仔 ', '大 湯 ', '跤 仔 ', '三 頭 人 人 一 生 一 生 ', '三 頭 無 小 ', '大 爯 ', '大 湲 ', '大 人 人 人 人 ', '三 頭 頭 ', '大 人 無 ', '三 頭 無 無 ', '三 頭 頭 ', '大 人 無 ', '三 人 無 人 ', '大 大 路 ', '三 頭 無 無 ', '大 頭 仔 ', '大 人 無 ', '大 坵 ', '大 人 無 人 ', '大 人 無 ', '大 人 人 人 人 ', '大 頭 仔 ', '大 湯 ', '跤 頭 ', '大 湯 ', '大 坵 ', '跤 仔 ', '大 坑 ', '三 頭 人 人 生 生 一 生 ', '三 人 人 人 人 人 生 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '大 人 人 人 ', '大 大 路 ', '三 頭 無 無 ', '大 坑 ', '大 頭 仔 ', '大 人 無 ', '大 大 路 ', '三 頭 無 小 ', '三 頭 人 一 人 一 生 一 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '大 人 無 ', '大 人 無 ', '大 人 人 人 人 ', '大 人 無 無 ', '大 人 人 人 人 人 ', '大 坵 ', '大 坑 ', '大 人 無 ', '大 大 路 ', '大 坵 ', '大 人 無 無 ', '大 人 無 無 ', '大 人 人 人 ', '大 人 人 人 ', '大 坵 ', '大 大 路 ', '大 湯 ', '三 頭 無 小 ', '大 人 無 無 ', '跤 仔 ', '大 坵 仔 ', '三 頭 無 人 ', '大 人 無 ', '三 頭 人 一 人 生 生 ', '大 坵 ', '大 人 無 ', '三 頭 無 無 ', '三 頭 頭 ', '跤 仔 ', '三 頭 人 人 生 生 生 ', '三 頭 無 小 ', '這 人 人 人 人 人 人 人 人 伊 人 伊 人 伊 人 伊 人 伊 人 伊 人 ', '大 湯 ', '大 人 無 ', '大 人 無 ', '大 火 ', '跤 仔 ', '大 湲 ', '跤 仔 ', '大 湲 ', '鵭 仔 ', '徘 ', '大 坑 ', '大 坑 ', '大 磾 ', '大 湯 ', '大 人 無 ', '大 人 人 人 人 ', '大 火 ', '三 人 無 無 ', '三 人 人 人 人 人 人 人 人 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '三 頭 人 人 一 人 ', '三 頭 人 人 一 人 ', '三 頭 人 人 一 人 ', '三 頭 人 人 一 生 生 ', '三 人 無 無 ', '三 頭 人 人 生 生 一 生 ', '大 人 無 無 ', '大 人 無 無 ', '大 人 人 人 ', '大 人 人 人 人 ', '三 頭 無 人 ', '大 頭 無 ', '三 頭 人 人 人 人 ', '大 人 無 無 ', '三 頭 無 ', '三 頭 無 無 ', '跤 仔 ', '三 頭 無 小 ', '跤 頭 ', '三 頭 無 小 ', '跤 仔 ', '三 頭 無 小 ', '跤 頭 ', '三 頭 無 小 ', '三 頭 無 小 ', '跤 仔 ', '跤 仔 ', '三 頭 無 小 ', '跤 仔 ', '三 頭 無 小 ', '三 頭 頭 生 ', '三 頭 人 一 人 生 生 生 ', '跤 頭 ', '跤 頭 ', '跤 頭 ', '鵬 ', '雞 頭 ', '大 坵 ', '鵭 ', '跤 仔 ', '跤 頭 ', '大 湲 ', '鵾 仔 ', '跤 仔 ', '大 坑 ', '跤 頭 ', '大 坑 ', '大 磾 ', '三 頭 無 ', '跤 仔 ', '三 頭 無 ', '跤 頭 ', '鵭 ', '大 角 仔 ', '大 頭 仔 ', '大 角 ', '大 火 ', '三 頭 無 ', '三 頭 頭 ', '跤 仔 ', '三 頭 無 小 ', '雞 頭 ', '大 人 無 ', '大 火 仔 ', '大 人 無 ', '三 頭 仔 ', '大 頭 仔 ', '大 頭 仔 ', '大 人 無 ', '大 人 無 無 ', '大 坵 ', '三 頭 無 無 ', '三 頭 無 ', '跤 仔 ', '三 頭 人 一 人 生 生 一 生 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '三 頭 頭 ', '大 人 無 ', '三 頭 頭 ', '三 頭 人 人 一 生 一 生 ', '三 頭 人 人 ', '大 人 無 無 ', '三 頭 人 一 人 生 生 生 ', '大 人 無 無 ', '大 頭 無 無 ', '三 頭 頭 ', '三 頭 一 人 生 生 生 ', '鵭 仔 ', '三 頭 無 無 ', '大 湲 ', '大 頭 無 無 ', '跤 頭 ', '大 頭 ', '大 人 無 無 ', '三 頭 頭 ', '跤 頭 ', '三 頭 仔 ', '跤 仔 ', '三 頭 頭 ', '三 頭 頭 ', '大 湲 ', '跤 頭 ', '三 頭 頭 ', '三 頭 頭 ', '大 大 路 ', '跤 頭 ', '跤 仔 ', '三 頭 頭 ', '跤 仔 ', '跤 仔 ', '大 角 ', '三 頭 仔 ', '跤 頭 ', '跤 頭 ', '跤 頭 ', '跤 仔 ', '鵬 ', '大 湯 ', '大 人 無 ', '三 頭 人 人 生 生 生 ', '三 頭 無 無 ', '三 頭 無 小 ', '大 人 無 ', '大 人 無 ', '大 角 仔 ', '三 頭 無 無 ', '三 頭 仔 ', '大 頭 ', '三 頭 無 無 ', '大 湯 ', '這 人 人 人 人 人 人 人 人 人 人 ', '大 湯 ', '大 人 無 無 ', '大 大 路 ', '大 大 路 ', '大 湲 ', '這 人 人 人 人 人 人 人 人 人 伊 人 ', '跤 仔 ', '大 人 無 ', '大 人 人 人 人 ', '三 頭 人 人 一 人 生 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '大 人 無 ', '這 人 人 人 人 人 人 人 人 人 人 ', '大 人 無 ', '大 人 無 無 ', '大 湲 ', '大 人 無 ', '大 頭 仔 ', '大 人 無 ', '大 坵 ', '大 人 無 ', '大 人 無 ', '大 角 ', '大 大 路 ', '大 大 路 ', '大 大 路 ', '大 湲 ', '大 人 人 人 人 ', '跤 頭 ', '大 人 無 ', '大 人 無 ', '大 人 無 ', '大 人 人 人 ', '大 大 路 ', '大 大 路 ', '大 大 路 ', '大 人 無 ', '大 角 仔 ', '三 頭 人 人 人 人 生 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '大 人 人 人 人 ', '大 人 無 ', '大 人 無 ', '大 人 無 ', '大 湯 ', '大 人 無 無 ', '跤 仔 ', '三 頭 無 人 ', '三 頭 無 小 ', '三 頭 無 無 ', '大 頭 無 無 ', '三 頭 無 ', '大 人 無 ', '大 坑 ', '烏 頭 仔 ', '跤 仔 ', '三 頭 人 一 人 生 生 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '三 頭 仔 ', '跤 頭 ', '大 人 無 無 ', '雞 頭 ', '跤 頭 ', '三 頭 無 小 ', '大 人 人 人 人 人 ', '大 人 無 ', '大 頭 仔 ', '三 頭 人 一 人 生 生 生 一 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '大 人 無 ', '跤 仔 ', '三 頭 人 一 人 生 生 生 ', '跤 頭 ', '大 角 ', '鵭 仔 ', '大 人 無 ', '大 人 無 ', '跤 仔 ', '大 人 無 ', '鵬 ', '大 磾 ', '大 大 路 ', '大 磾 ', '大 坑 ', '大 磾 ', '大 人 無 ', '大 湯 ', '大 坵 ', '大 大 路 ', '大 大 路 ', '大 湯 ', '大 湲 ', '大 坵 ', '大 火 ', '大 大 路 ', '大 坑 ', '這 人 人 人 人 人 人 人 人 人 人 ', '大 磾 ', '鵭 仔 ', '大 坑 ', '鵬 ', '大 坑 ', '大 人 無 ', '大 火 ', '大 坑 ', '大 坵 ', '大 磾 ', '大 磾 ', '大 人 無 ', '鵭 ', '大 頭 仔 ', '鵾 仔 ', '跤 仔 ', '大 角 ', '三 頭 仔 ', '大 湯 ', '三 頭 仔 ', '大 人 無 ', '大 角 ', '大 角 ', '三 人 人 人 人 人 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '大 角 仔 ', '大 大 路 ', '大 大 路 ', '三 頭 仔 ', '大 人 無 無 ', '大 角 ', '大 角 ', '大 角 ', '大 坑 ', '大 坵 仔 ', '大 人 無 ', '大 頭 仔 ', '大 湯 ', '大 角 ', '大 湲 ', '大 人 無 ', '大 人 無 ', '大 人 無 ', '大 人 無 ', '大 大 路 ', '大 坵 ', '大 湲 ', '大 頭 仔 ', '大 頭 仔 ', '大 坵 ', '大 頭 ', '大 頭 仔 ', '三 人 人 人 一 人 生 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '大 大 路 ', '大 人 人 人 人 ', '大 人 無 ', '鵬 ', '大 坑 ', '大 人 無 ', '大 大 路 ', '大 大 路 ', '大 人 人 人 人 ', '這 人 人 人 人 人 人 人 人 人 人 伊 人 ', '大 火 ', '大 坑 ', '大 磾 ', '大 坑 ', '大 湯 ', '大 湲 ', '大 坵 ', '大 湯 ', '大 湲 ', '大 磾 ', '大 磾 ', '大 磾 ', '大 大 路 ', '大 坑 ', '大 人 無 無 ', '大 人 無 ', '大 坑 ', '大 湲 ', '大 湯 ', '大 磾 ', '大 坑 ', '大 坑 ', '大 大 路 ', '大 湯 ', '大 磾 ', '大 頭 ', '大 湯 ', '大 磾 ', '大 磾 ', '大 頭 仔 ', '大 人 無 ', '大 人 人 人 人 ', '三 頭 無 無 ', '大 頭 仔 ', '大 頭 仔 ', '三 頭 無 小 ', '大 頭 ', '大 人 無 無 ', '三 頭 一 人 ', '這 人 人 人 人 人 人 人 人 人 ', '大 頭 仔 ', '三 頭 無 無 ', '三 頭 無 小 ', '大 火 ', '三 頭 人 人 生 生 生 ', '三 頭 無 人 ', '大 人 人 人 人 ', '三 人 人 人 人 生 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '三 頭 無 無 ', '三 頭 一 人 生 一 生 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '大 坵 ', '大 人 無 ', '大 人 無 ', '大 人 人 人 人 ', '這 人 人 人 人 人 人 人 人 人 人 人 人 伊 人 伊 人 伊 人 ', '大 人 無 ', '三 人 無 無 ', '三 頭 無 小 ', '大 人 無 無 ', '大 火 ', '三 頭 仔 ', '三 頭 人 人 一 人 ', '三 頭 一 人 生 生 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '三 頭 無 人 ', '跤 頭 ', '三 頭 仔 ', '大 人 無 無 ', '這 人 人 人 人 人 人 人 人 人 人 伊 人 ', '三 頭 無 ', '大 人 無 ', '跤 頭 ', '三 頭 仔 ', '大 坵 ', '大 坑 ', '大 人 無 無 ', '大 坵 ', '徘 ', '大 坵 ', '大 湲 ', '大 湯 ', '大 人 無 ', '跤 仔 ', '大 大 路 ', '大 坵 仔 ', '三 頭 人 無 人 ', '大 坵 ', '大 大 路 ', '大 人 無 ', '大 坵 仔 ', '徘 ', '大 大 路 ', '大 坑 ', '大 坑 ', '大 人 無 ', '大 湯 ', '大 大 路 ', '三 頭 無 無 ', '大 大 路 ', '大 湲 ', '大 坑 ', '大 人 無 ', '大 坑 ', '大 大 路 ', '大 湲 ', '大 坑 ', '大 坵 ', '大 坑 ', '大 坵 ', '大 大 路 ', '大 坵 ', '大 火 ', '大 人 無 ', '大 人 人 人 人 ', '大 湯 ', '大 人 無 ', '大 大 路 ', '大 坵 仔 ', '三 頭 無 小 ', '跤 仔 ', '大 人 無 ', '三 頭 無 小 ', '三 頭 人 人 人 生 生 一 生 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '大 坑 ', '鵬 ', '大 坑 ', '三 頭 無 小 ', '大 人 無 無 ', '三 頭 無 ', '跤 仔 ', '跤 頭 ', '大 湲 ', '三 頭 仔 ', '跤 仔 ', '跤 仔 ', '跤 頭 ', '三 頭 無 無 ', '跤 仔 ', '大 人 無 ', '大 爯 ', '大 湲 ', '大 坑 ', '大 人 人 人 人 ', '三 頭 無 小 ', '三 頭 無 ', '大 坑 ', '跤 頭 ', '三 頭 無 ', '大 角 ', '大 湯 ', '大 人 無 ', '大 人 無 無 ', '大 人 無 ', '大 坑 ', '大 坵 ', '大 人 無 ', '三 頭 無 ', '三 頭 無 ', '大 坑 ', '跤 仔 ', '跤 頭 ', '跤 仔 ', '大 頭 仔 ', '三 頭 頭 ', '大 頭 ', '跤 仔 ', '三 頭 頭 ', '大 火 ', '三 頭 無 小 ', '跤 頭 ', '三 人 無 無 無 ', '大 人 無 人 ', '大 人 無 ', '鵬 ', '跤 仔 ', '大 火 ', '鵭 仔 ', '大 頭 仔 ', '跤 頭 ', '三 頭 人 人 一 生 一 生 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '大 人 無 無 ', '大 頭 仔 ', '鵭 仔 ', '大 人 無 ', '大 人 無 無 ', '雞 頭 ', '鵾 仔 ', '大 角 ', '大 磾 ', '三 頭 仔 ', '跤 頭 ', '三 頭 仔 ', '大 角 仔 ', '三 頭 仔 ', '大 人 無 ', '大 人 無 ', '鵭 仔 ', '跤 仔 ', '三 頭 無 ', '烏 頭 ', '三 頭 仔 ', '三 頭 人 人 一 人 ', '三 頭 仔 ', '跤 頭 ', '跤 仔 ', '三 頭 無 無 ', '三 頭 人 無 人 ', '大 人 無 ', '跤 仔 ', '三 頭 無 小 ', '大 頭 仔 ', '三 頭 無 ', '大 頭 仔 ', '三 頭 人 一 人 生 生 生 生 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '大 頭 仔 ', '三 頭 無 無 ', '跤 仔 ', '大 火 ', '大 磾 ', '大 磾 ', '大 人 無 ', '鵬 ', '跤 仔 ', '跤 頭 ', '鵭 仔 ', '跤 仔 ', '大 人 無 ', '大 人 無 ', '大 頭 路 ', '大 人 無 ', '雞 頭 ', '大 坑 ', '大 坑 ', '大 人 無 無 ', '大 人 無 ', '三 頭 無 小 ', '徘 ', '大 坑 ', '大 磾 ', '鵭 仔 ', '大 人 無 無 ', '大 湲 ', '大 火 ', '大 人 無 ', '大 人 人 人 ', '大 大 路 ', '大 坑 ', '大 角 仔 ', '大 人 人 人 ', '大 磾 ', '大 爯 ', '大 磾 ', '大 人 人 人 人 ', '大 磾 ', '大 人 無 ', '大 人 無 無 ', '大 湯 ', '大 磾 ', '大 火 ', '大 湲 ', '大 湲 ', '大 湲 ', '大 爯 ', '大 坑 ', '徘 ', '徘 ', '大 坑 ', '大 坑 ', '大 磾 ', '徘 ', '大 人 無 ', '大 人 無 ', '大 坑 ', '大 坵 ', '徘 ', '大 坑 ', '大 坵 ', '大 大 路 ', '鵬 ', '跤 仔 ', '徘 ', '大 大 路 ', '大 大 路 ', '大 人 無 ', '大 坑 ', '大 坑 ', '大 人 無 ', '大 人 無 ', '大 湲 ', '大 大 路 ', '三 頭 無 無 ', '三 頭 無 小 ', '跤 仔 ', '大 坑 ', '大 人 無 ', '三 頭 人 一 人 生 生 生 ', '大 人 無 無 ', '三 頭 無 ', '大 頭 仔 ', '大 湲 ', '大 人 無 無 ', '大 人 無 ', '大 人 無 ', '三 頭 無 ', '大 人 人 人 人 ', '三 頭 一 人 ', '三 頭 人 一 人 生 生 ', '跤 仔 ', '大 人 無 ', '三 頭 一 人 ', '三 人 無 人 ', '跤 仔 ', '大 人 無 無 ', '三 頭 人 人 一 生 生 生 ', '大 頭 仔 ', '三 頭 頭 ', '大 頭 ', '大 人 人 人 人 ', '大 湲 ', '大 人 無 ', '大 角 ', '大 人 人 人 ', '三 頭 無 小 ', '三 頭 頭 生 ', '大 人 無 ', '大 人 無 ', '大 人 人 人 人 ', '大 人 人 人 ', '三 頭 仔 ', '大 人 人 人 ', '三 頭 人 人 一 人 ', '三 頭 仔 ', '三 頭 無 小 ', '大 頭 ', '大 人 無 無 ', '大 坵 ', '三 頭 無 人 ', '大 磾 ', '大 火 仔 ', '大 湲 ', '跤 頭 ', '跤 頭 ', '三 頭 頭 ', '三 頭 無 無 ', '三 頭 無 無 ', '三 頭 無 生 ', '三 頭 仔 ', '三 頭 人 一 人 生 生 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '三 頭 仔 ', '大 人 無 ', '大 大 路 ', '大 人 無 ', '烏 頭 仔 ', '大 人 無 無 ', '大 人 無 ', '大 人 無 ', '大 人 無 ', '大 湯 ', '跤 頭 ', '大 頭 無 ', '三 人 人 人 人 人 人 人 人 人 人 一 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '三 人 無 人 ', '大 頭 ', '大 火 ', '跤 頭 ', '大 人 無 ', '鵾 仔 ', '跤 仔 ', '三 頭 無 無 ', '大 人 無 無 ', '大 大 路 ', '三 頭 仔 ', '大 湲 ', '大 湯 ', '大 湲 ', '大 磾 ', '跤 仔 ', '大 人 無 ', '大 火 仔 ', '大 頭 仔 ', '三 頭 頭 ', '鵬 ', '大 人 無 ', '大 人 無 ', '大 人 無 ', '大 人 無 ', '大 湲 ', '跤 頭 ', '跤 頭 ', '三 頭 無 無 ', '大 大 路 ', '大 坵 ', '鵭 仔 ', '大 人 無 無 ', '大 人 無 ', '三 頭 無 小 ', '大 火 ', '大 大 路 ', '大 頭 ', '鵭 ', '大 大 路 ', '大 磾 ', '跤 仔 ', '大 大 路 ', '大 人 無 ', '大 人 無 ', '大 火 ', '大 人 無 ', '大 頭 仔 ', '大 湯 ', '大 磾 ', '大 磾 ', '大 磾 ', '大 湲 ', '大 湯 ', '大 湲 ', '大 人 無 ', '大 湯 ', '大 人 無 ', '大 湯 ', '大 人 人 人 人 人 ', '大 磾 ', '大 湲 ', '大 人 無 ', '大 磾 ', '大 磾 ', '大 人 無 ', '大 湲 ', '大 湲 ', '大 人 無 ', '大 人 無 ', '大 大 路 ', '大 人 人 人 ', '大 人 無 ', '大 人 無 無 ', '大 人 無 無 ', '大 湲 ', '大 人 人 人 人 人 ', '大 人 無 ', '大 大 路 ', '大 人 無 ', '大 人 人 人 人 ', '大 人 無 ', '大 人 無 ', '大 人 無 ', '大 人 無 ', '大 人 人 人 人 ', '大 人 無 無 ', '大 湯 ', '大 湯 ', '大 人 無 ', '大 人 無 ', '大 大 路 ', '大 人 無 ', '三 頭 無 ', '大 湲 ', '大 火 ', '大 頭 仔 ', '大 人 無 ', '大 人 無 ', '三 頭 人 人 一 人 生 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 頂 ', '大 湲 ', '大 湲 ', '大 湲 ', '大 湯 ', '大 坑 ', '跤 仔 ', '大 人 無 ', '大 人 無 ', '大 磾 ', '大 大 路 ', '鵭 仔 ', '大 磾 ', '跤 仔 ', '大 湲 ', '三 頭 無 無 ', '大 大 路 ', '大 人 人 人 人 ', '大 人 無 ', '大 人 無 ', '大 火 ', '三 頭 人 人 ', '大 湲 ', '大 大 路 ', '大 人 無 ', '大 頭 仔 ', '大 坵 ', '大 坑 ', '大 人 無 無 ', '大 湲 ', '大 人 無 ', '大 人 無 ', '大 湯 ', '大 人 無 ', '大 火 ', '大 湲 ', '大 人 無 ', '大 磾 ', '大 人 無 ', '大 人 無 ', '大 人 無 ', '大 湲 ', '大 湯 ']
 
1
+ pred_str=['心 理 性 別 ', '火 燒 跤 村 ', '草 屬 ', '十 三 項 ', '水 里 鄉 ', '這 代 有 一 個 大 商 場 ', '聯 合 國 ', '菜 頭 人 仔 ', '若 洲 ', '肉 羹 ', '新 興 區 ', '太 古 幣 ', '麵 冬 ', '喙 仔 ', '洗 蚵 飯 ', '新 粹 ', '燒 包 仔 ', '空 頭 ', '黃 坤 ', '落 水 溪 出 代 誌 ', '粗 細 ', '愛 害 ', '九 年 一 貫 ', '精 靈 ', '三 寶 ', '速 速 ', '蔗 菜 咧 擲 ', '眼 目 袂 消 看 關 係 ', '鎮 烏 ', '兩 个 人 已 经 講 和 矣 ', '濁 水 ', '細 空 喙 ', '掠 著 筋 頭 ', '復 興 館 ', '戒 律 ', '草 人 坑 ', '祝 你 生 理 快 樂 ', '坑 潭 ', '出 水 ', '皮 皮 串 ', '囝 仔 羹 ', '菝 露 ', '臺 灣 人 ', '落 南 ', '原 理 坑 ', '坑 仔 內 ', '起 冊 到 地 ', '戶 錢 ', '紅 糖 ', '青 大 湖 ', '柴 柴 橋 ', '柴 球 ', '大 胃 王 子 ', '大 橂 埕 ', '頭 類 ', '桑 餅 ', '喙 暗 籠 ', '龍 門 ', '時 局 ', '熟 士 ', '線 尾 ', '無 話 講 家 老 ', '下 暗 磅 ', '一 人 ', '一 定 看 袂 著 ', '看 一 下 影 生 一 下 囝 ', '倒 勢 ', '直 行 ', '鬼 進 壽 仙 ', '肚 肚 ', '變 天 ', '一 工 到 鴨 ', '粉 盤 ', '有 幾 項 菜 ', '岩 埔 ', '鑼 角 區 ', '過 路 山 ', '戇 買 戇 人 行 ', '粗 食 ', '這 咧 外 濟 錢 ', '斜 仔 ', '看 甲 清 清 粗 粗 ', '妄 生 ', '發 聲 ', '白 囡 仔 ', '心 火 動 火 ', '番 鼎 仔 ', '流 窟 窟 ', '大 溪 火 ', '名 聲 真 頭 ', '閃 烘 肉 ', '骨 ', '龜 大 ', '水 溪 皮 仔 ', '夯 月 糕 ', '翹 無 三 文 門 著 想 欲 做 塗 公 ', '尪 姨 仔 ', '臺 北 橋 ', '雲 林 縣 ', '臺 中 港 ', '水 里 ', '臺 南 市 ', '七 度 ', '做 公 竹 ', '臺 川 鄉 ', '燒 肉 肉 ', '筊 ', '漢 草 真 好 ', '殘 影 ', '按 呢 生 ', '海 外 ', '無 味 可 拄 著 潤 骨 ', '奇 鄉 小 細 ', '復 ', '頭 尾 ', '牛 頓 市 場 ', '政 商 ', '吐 著 咧 ', '動 物 性 格 質 ', '實 問 精 ', '悠 悠 殼 ', '鑼 鑼 霧 小 睏 ', '乞 頭 鄉 ', '聖 義 臺 安 路 口 ', '三 三 八 八 ', '你 話 毋 通 予 白 講 ', '白 寮 鄉 ', '你 莫 著 中 午 肚 臍 ', '新 安 路 ', '金 錢 毋 是 萬 能 的 ', '飛 苓 雅 菜 ', '富 寮 里 ', '你 是 誰 ', '番 烏 ', '神 經 ', '合 同 ', '挺 挺 ', '販 賣 殼 ', '天 氣 冷 啦 你 就 愛 街 踏 一 件 衫 ', '我 到 底 看 著 啥 物 ', '手 環 ', '古 不 日 三 彰 ', '廳 價 ', '透 睛 仔 ', '傲 求 術 ', '隔 音 壁 ', '拍 桶 頭 ', '揮 火 滿 天 篷 結 智 者 行 人 ', '東 北 貴 方 ', '武 情 機 ', '做 ��� 無 小 力 ', '景 空 白 虹 ', '這 妖 仔 摸 落 去 真 緊 張 的 體 育 仔 ', '毛 髏 仔 ', '割 喙 血 ', '陽 明 山 ', '加 鼻 灌 ', '囡 仔 食 ', '佇 對 路 症 一 點 情 ', '伊 歸 心 美 虎 大 學 ', '東 湖 國 中 ', '中 原 公 園 ', '半 路 店 ', '冰 冷 坑 ', '東 石 鄉 ', '餅 酥 的 ', '無 中 生 化 ', '馬 藏 角 ', '演 藝 伎 ', '厝 邊 頭 背 ', '波 灣 粿 ', '仁 愛 烘 酒 路 口 ', '千 頁 ', '七 夕 肚 ', '大 極 大 理 ', '烘 仔 頭 鏡 ', '飼 ', '咱 做 代 誌 的 時 尊 ', '包 水 餃 ', '海 鳥 毋 知 飛 海 柴 破 袂 開 ', '溫 宗 中 ', '健 康 中 生 ', '印 度 尼 西 亞 ', '生 理 族 ', '獅 仔 頭 ', '大 肚 路 ', '市 仔 ', '落 野 區 ', '學 姐 ', '放 人 山 ', '虎 尾 直 ', '下 腹 肚 ', '興 村 鎮 ', '燒 火 球 ', '化 極 ', '我 三 攏 穿 上 大 領 ', '溜 下 來 ', '半 條 命 ', '生 活 習 慣 ', '電 影 機 ', '菜 脯 蛋 ', '塗 塗 塗 ', '鐵 甲 牛 ', '風 火 頭 ', '現 流 仔 ', '培 了 工 ', '空 港 ', '較 大 ', '公 政 橋 ', '巴 結 ', '古 汁 ', '有 拜 無 積 穏 ', '這 時 ', '直 白 ', '下 災 ', '較 早 睏 ', '寮 寮 臺 巡 ', '公 司 ', '懸 枯 緊 緊 ', '坑 仔 ', '林 線 香 菇 ', '山 羊 ', '大 頭 九 寶 ', '塗 辦 人 道 ', '對 ', '內 沿 ', '阮 會 香 櫞 ', '地 目 ', '真 有 喙 水 ', '模 特 師 ', '相 相 認 你 就 是 林 朋 友 ', '青 山 溫 ', '鶴 曲 蘭 ', '金 冬 ', '變 啦 ', '單 欲 節 ', '狗 尾 金 ', '牛 坑 ', '過 冬 跤 ', '頭 辦 坑 坑 ', '無 聽 著 ', '礦 機 仔 ', '厝 影 ', '江 州 ', '青 天 街 ', '東 方 ', '問 題 ', '桃 源 聖 別 ', '故 厝 ', '妖 嬌 ', '復 國 小 ', '點 磕 ', '光 臺 ', '目 虛 股 仔 ', '立 斗 ', '永 環 ', '你 是 我 我 ', '達 著 歹 隊 步 ', '僥 候 ', '骨 髏 公 的 無 船 上 ', '加 辣 片 ', '如 來 如 嚴 重 ', '一 個 一 個 ', '陳 公 大 橋 ', '上 大 大 師 所 ', '蒜 仔 虯 公 ', '骨 銅 跤 ', '復 興 戶 ', '講 啥 芋 仔 漢 字 ', '毋 行 ', '親 密 閨 讀 著 童 ', '你 使 毋 知 哉 臭 ', '斗 南 ', '狗 睏 鼠 無 趖 ', '水 粿 仔 ', '門 狀 ', '五 手 空 ', '心 無 目 無 厄 ', '敢 食 氣 溜 ', '阿 婆 婆 ', '機 動 戰 士 ', '電 動 ', '起 直 行 ', '跤 先 股 ', '所 羅 門 群 島 ', '彰 界 ', '我 愛 大 股 ', '高 頂 ', '甜 鹹 ', '上 界 ', '是 小 ', '落 億 不 折 ', '跤 倉 門 ', '猴 仔 疊 豬 仔 ', '風 神 尪 仔 ', '山 ', '生 甲 袂 蠻 ', '九 月 趖 ', '橫 刀 仔 ', '中 央 大 學 ', '石 門 水 庫 ', '亂 史 上 ', '百 貨 店 ', '酸 素 肝 ', '甲 界 ', '洗 衫 飯 ', '天 臺 ', '數 位 拍 ', '後 褲 ', '鈍 刺 火 ', '頭 走 位 ', '夭 壽 貴 ', '好 所 在 ', '兩 市 ', '鐵 理 ', '現 辦 ', '九 點 位 ', '伊 生 做 這 麼 臭 老 ', '摩 星 仔 石 鉎 ', '一 甘 甘 仔 ', '龍 公 ', '隔 十 五 件 ', '提 著 ', '心 心 酒 店 ', '過 時 抵 時 ', '較 平 咧 ', '桃 生 大 罐 ', '戮 區 杯 仔 ', '行 佇 這 袂 著 愛 工 薪 ', '隔 花 仔 ', '抹 衫 面 仔 ', '雨 傘 鵰 ', '石 板 ', '虎 魚 ', '落 雨 了 塗 跤 鼻 公 擔 落 落 ', '較 倉 ', '家 人 市 ', '你 欲 行 對 度 位 去 ', '敦 化 和 平 路 口 ', '公 仔 喙 ', '阮 囝 今 年 二 十 出 頭 矣 ', '新 港 域 ', '愛 袂 叫 母 ', '一 分 ', '問 問 仔 戶 ', '元 安 ', '牛 丼 ', '袂 看 得 ', '立 公 立 直 ', '牛 山 肚 ', '過 度 ', '十 做 水 ', '麥 仔 跤 ', '包 大 ', '原 地 ', '三 重 三 重 ', '林 口 ', '必 定 ', '初 度 ', '揣 轉 來 ', '機 中 站 ', '樹 仔 代 ', '心 股 ', '小 大 ', '頂 底 寮 ', '佇 人 ', '你 甲 包 仔 提 起 哈 少 一 下 ', '病 風 景 病 風 君 ', '頂 公 館 ', '線 仙 ', '演 技 界 ', '花 粉 ', '毋 情 毋 怨 ', '較 緊 ', '有 也 好 無 也 好 ', '草 生 ', '講 喙 仔 龍 ', '怪 奇 果 ', '國 土 家 房 ', '新 羅 ', '貴 妻 ', '豆 豆 仔 ', '拍 寶 ', '物 件 若 予 伊 提 過 手 ', '電 腦 霓 ', '意 界 ', '刺 尾 風 ', '烏 內 ', '提 灶 ', '無 搭 無 散 ', '我 欲 遵 佇 落 山 ', '倒 擁 ', '聽 無 ', '彼 个 頭 家 娘 對 人 客 食 好 咧 ', '大 細 練 ', '無 葉 ', '無 二 五 你 的 出 國 讀 冊 ', '石 烘 ', '嘉 義 ', '後 寮 ', '我 攏 有 看 著 ', '鏡 仁 路 ', '歹 天 ', '三 跤 步 一 坎 點 ', '臘 肉 ', '句 裡 作 ', '下 午 中 生 ', '林 棍 ', '無 直 結 ', '公 文 ', '十 喙 九 跤 倉 ', '頭 仔 片 ', '掠 錢 ', '無 空 鳥 ', '蚵 仔 湯 仔 ', '隔 屎 面 ', '白 對 銅 ', '膨 一 枝 ', '無 一 步 ', '老 口 講 出 來 ', '斗 頂 ', '膨 底 做 甲 流 懸 膨 跤 成 甲 流 懸 ', '烏 豆 汁 ', '拍 屎 辦 ', '桶 邊 ', '焦 巴 ', '簡 訊 ', '一 下 才 一 下 ', '筋 的 酸 ', '洋 仔 話 ', '拍 數 ', '直 落 挖 ', '總 舖 ', '三 里 無 見 久 留 留 ', '學 官 ', '手 心 動 ', '電 子 ', '暗 空 ', '散 食 ', '速 加 車 ', '妖 意 ', '燒 雞 龜 ', '��� 鉤 ', '寮 溝 ', '暗 頭 仔 ', '濟 囝 濟 白 白 濟 媳 婦 濟 體 育 ', '溝 球 ', '無 睹 好 ', '戳 頭 鵰 ', '金 環 實 力 ', '觀 音 大 師 ', '臺 準 ', '欲 按 嘛 ', '後 路 ', '結 尾 ', '一 萬 兩 仔 ', '提 款 片 ', '無 你 的 代 ', '天 公 祖 ', '篡 港 ', '麗 茶 ', '馬 鈴 薯 條 ', '做 塗 水 的 ', '林 青 味 ', '流 明 潭 ', '官 包 遊 ', '糖 醋 ', '二 戰 ', '拍 鐵 屎 ', '慢 一 跤 步 ', '提 皮 的 ', '下 禮 拜 ', '死 亡 之 鴨 ', '你 毋 通 囥 佇 身 外 內 ', '臭 菇 仔 ', '歎 一 空 食 三 冬 ', '我 欲 學 臺 語 ', '臺 ', '目 角 肚 ', '雨 水 暗 ', '貴 州 省 ', '敦 華 北 路 ', '你 看 起 來 是 才 拿 仔 水 ', '情 的 食 妄 妄 的 食 天 公 ', '轉 去 ', '那 不 是 ', '幾 個 ', '防 長 ', '港 墘 ', '二 寵 仔 ', '無 鐵 仔 ', '原 型 力 ', '麥 坑 ', '六 點 ', '市 中 ', '樹 母 苓 ', '魚 仔 羹 ', '廣 寮 區 ', '柑 花 噴 天 ', '大 好 逆 人 ', '行 政 院 ', '食 市 ', '九 底 厝 ', '寧 星 ', '月 光 ', '種 水 氣 ', '奇 幼 ', '天 公 市 ', '懸 ', '愛 大 理 ', '我 薑 尾 袂 負 矣 ', '天 方 ', '有 連 線 ', '衝 ', '中 國 話 ', '拔 香 對 拜 ', '四 跤 草 ', '挺 風 ', '觀 覽 ', '結 上 路 ', '彈 跳 ', '焦 工 算 ', '時 過 外 大 平 ', '有 這 款 的 代 誌 我 攏 毋 知 ', '磨 豆 仔 機 ', '國 聖 夜 ', '林 口 區 ', '菝 ', '苦 蒜 明 薯 ', '代 誌 圖 案 ', '半 生 半 疑 ', '點 甜 點 甜 土 坑 兄 味 事 ', '你 有 工 工 ', '仁 堂 無 洗 手 的 朋 友 ', '烏 日 ', '微 風 ', '水 旋 ', '懸 欠 ', '連 半 个 人 影 也 無 ', '調 褲 ', '塗 水 公 ', '無 沙 沙 ', '微 星 船 ', '欲 玩 矣 ', '韌 種 ', '頂 頭 目 睭 咧 念 字 ', '伊 有 誠 濟 內 筍 ', '工 仔 喙 國 小 ', '濁 國 速 公 ', '落 尾 ', '平 方 電 腦 ', '問 蠓 仔 烏 鑼 鼓 塗 麥 擔 ', '仁 君 水 ', '漁 人 副 按 一 下 位 ', '鹹 酥 雞 ', '天 然 蚵 仔 ', '熟 悾 ', '茨 杜 ', '聖 誕 老 阿 公 ', '天 頂 白 茫 茫 ', '飯 煎 ', '南 巡 ', '吾 人 事 ', '有 溫 ', '包 山 包 海 ', '點 空 區 ', '洗 衫 精 ', '哈 勁 鎮 商 ', '開 喙 罨 粒 粒 草 ', '焦 水 器 ', '老 舊 家 ', '速 加 路 亞 ', '數 位 仔 聯 名 ', '臭 水 ', '屬 暗 君 仔 ', '飛 行 機 ', '冰 粿 ', '圍 空 天 下 不 亂 ', '錢 票 ', '龜 仔 樹 ', '溶 角 三 角 ', '半 夜 ', '思 維 ', '衝 勇 ', '敢 有 問 題 ', '遮 涼 ', '月 磯 忝 竹 ', '做 塗 水 ', '怪 奇 ', '班 景 ', '狡 官 ', '歹 牙 ', '中 山 路 ', '橫 仔 溝 ', '粉 圓 仔 ', '菊 菊 摸 摸 ', '毋 知 佇 看 個 時 ', '妖 冬 ', '激 光 雨 ', '海 塗 仔 ', '溝 頭 果 ', '熟 士 娘 上 ', '面 珠 ', '底 葉 卵 ', '無 時 焦 電 ', '斜 人 一 口 勁 人 一 道 ', '鐵 磯 ', '銅 杯 仔 ', '二 刀 ', '復 生 豆 子 隻 ', '人 講 對 人 講 ', '金 剛 鑽 石 ', '做 肉 餅 ', '小 寶 喙 ', '櫳 哥 魚 ', '比 頭 村 仔 ', '一 筆 錢 ', '菝 菜 ', '溝 仔 密 情 ', '一 枝 草 一 點 路 ', '早 市 ', '大 頭 母 人 ', '包 的 ', '上 禮 拜 ', '牛 厝 仔 ', '人 行 貴 貴 行 人 ', '無 記 地 情 ', '日 落 山 ', '憨 鄉 ', '七 塗 跤 ', '袂 死 心 ', '解 濟 ', '做 遊 戀 ', '有 聽 著 無 ', '大 姨 田 ', '斗 人 仔 本 ', '固 固 ', '影 人 ', '勥 查 戶 ', '暗 端 食 生 ', '草 薑 流 角 ', '挺 快 ', '首 寶 ', '薄 餅 ', '手 著 ', '亂 無 ', '無 情 菜 ', '內 街 ', '烏 樹 ', '小 酸 臭 ', '菊 潤 ', '蠓 公 廁 貴 ', '山 炭 ', '人 聲 欠 貨 ', '天 公 無 帶 著 ', '望 遠 鄉 ', '食 風 ', '粉 刺 ', '皮 車 ', '大 姊 ', '公 館 路 ', '碧 潭 路 ', '臺 北 歐 洲 校 校 小 學 部 ', '倉 裡 不 分 ', '四 分 仔 ', '頭 殼 的 ', '南 京 城 ', '應 隨 機 ', '破 珠 溪 ', '池 上 ', '跤 車 ', '懸 胎 ', '苦 袂 當 ', '單 從 工 ', '喙 驚 和 ', '斜 浮 ', '加 攏 城 ', '頂 底 蚵 ', '張 張 假 口 ', '社 群 ', '用 頂 厝 ', '風 駝 公 園 ', '金 烏 鎮 ', '中 校 復 興 ', '民 族 區 溫 度 口 ', '松 信 路 ', '飼 香 粉 ', '溫 州 ', '臺 北 聯 絡 線 ', '有 夠 咧 加 速 ', '伊 加 我 一 半 ', '酸 仔 ', '記 者 鄉 ', '驚 柑 仔 囝 ', '四 跤 水 仙 ', '暖 暖 區 ', '用 齒 面 仔 洗 喙 時 愛 上 律 氣 膏 ', '新 社 ', '母 親 力 顧 予 伊 好 ', '十 包 ', '部 位 ', '埔 路 ', '冰 糖 ', '復 興 橋 ', '阿 拉 ', '蒜 蠻 ', '員 林 市 ', '批 錢 ', '妄 大 志 ', '麵 腸 仁 ', '景 興 路 ', '海 蛤 仔 頭 ', '一 月 半 月 ', '失 聯 制 ', '後 區 ', '隨 風 ', '蘭 斯 貓 頭 鳥 ', '茅 露 開 ', '子 宮 喙 暗 ', '高 姊 太 ', '假 說 ', '不 知 ', '院 頭 區 ', '上 海 茂 霞 ', '意 識 面 ', '光 風 ', '月 耳 池 中 ', '彼 人 災 我 無 ', '紅 豆 仔 蜂 ', '頂 河 ', '商 機 ', '三 兩 人 講 四 斤 話 ', '金 貨 ', '一 組 ', '軟 褲 ', '珍 珠 看 著 鳥 市 屎 ', '天 津 ', '角 運 動 量 ', '��� 問 著 恐 怖 ', '貧 極 競 ', '羅 連 ', '真 聽 話 ', '溶 炭 煎 ', '火 星 岩 ', '可 睏 員 ', '烏 上 ', '椅 頭 風 ', '蔭 喙 ', '查 緯 ', '較 通 ', '番 薯 片 ', '頂 去 ', '卵 珠 ', '歡 喜 感 源 ', '大 海 無 驚 大 水 ', '懷 矣 ', '跤 手 電 ', '欲 ', '煎 巴 醬 ', '徛 肚 胿 ', '查 某 人 ', '韓 子 球 ', '膨 了 臭 ', '大 火 ', '火 炬 母 ', '英 國 話 ', '明 天 顧 問 ', '老 機 ', '看 有 ', '影 差 天 火 度 ', '下 文 外 童 ', '大 路 二 ', '內 ', '金 風 山 ', '死 袂 見 笑 ', '蟮 子 ', '焦 化 ', '馬 鈴 薯 片 ', '你 頭 拍 甲 倉 仔 顧 無 客 ', '囊 物 褲 粉 ', '擋 水 機 ', '肚 肚 胿 仔 ', '陂 南 ', '袂 當 敢 若 我 看 著 ', '有 困 山 ', '大 市 好 勢 仔 蠢 ', '水 氣 ', '景 文 街 ', '樹 天 樹 地 ', '今 年 是 一 個 好 年 冬 ', '事 搭 ', '雨 傘 頭 ', '三 講 四 無 著 ', '五 所 分 離 ', '反 插 ', '大 日 本 帝 國 ', '烘 蓋 芒 霜 ', '臘 蚵 ', '吞 兩 ', '莫 計 ', '經 濟 做 代 誌 較 要 緊 ', '你 講 啥 ', '景 水 ', '位 極 ', '身 體 健 康 ', '跤 手 十 足 ', '延 珠 學 ', '下 年 ', '大 路 大 股 ', '伊 是 一 下 大 美 人 ', '解 溶 ', '放 棄 ', '你 陪 我 去 彼 邊 好 無 ', '網 路 用 較 刁 咧 ', '樹 屎 ', '孤 單 一 生 ', '加 滴 ', '市 長 袂 中 ', '有 手 仔 ', '孤 烘 毒 市 ', '裡 面 ', '自 目 ', '役 仔 ', '燒 狗 ', '冷 喙 ', '創 辦 人 ', '水 灝 蠟 ', '飼 養 動 物 ', '目 睭 白 金 ', '撲 囡 仔 ', '我 予 滾 水 蟲 一 下 膨 拍 著 聽 的 ', '聖 杯 ', '為 人 ', '過 濟 ', '三 二 九 ', '飯 焦 ', '天 車 ', '圍 篤 ', '目 睭 久 ', '白 紅 ', '電 蜜 ', '鹽 酸 臭 ', '粉 仔 韓 市 ', '你 一 次 來 伊 攏 居 好 寮 的 ', '來 喲 今 來 看 喲 ', '犯 改 ', '總 事 記 ', '破 柴 ', '掠 開 ', '鳳 山 ', '老 厝 ', '開 船 母 昌 ', '金 美 國 小 ', '直 白 市 ', '橋 頭 區 ', '南 州 ', '好 味 鎮 ', '長 力 ', '西 區 ', '國 泰 ', '水 腸 流 ', '中 庸 路 ', '南 福 著 ', '金 華 大 學 ', '西 角 ', '樹 林 區 ', '紙 片 變 膠 ', '中 山 橋 ', '彰 化 銀 行 ', '吳 國 昌 ', '喙 風 橋 ', '花 仔 菜 ', '中 情 國 小 ', '這 樣 就 好 ', '老 去 矣 ', '車 頂 ', '南 洋 街 ', '匈 羅 ', '松 壽 路 口 ', '中 坑 ', '不 屬 自 客 ', '瑞 源 ', '後 役 ', '大 腸 鼎 ', '筊 仔 弓 ', '再 拜 ', '新 營 區 ', '政 二 幼 局 ', '寧 夏 路 ', '動 慢 ', '大 好 年 ', '仁 愛 鄉 ', '快 龍 ', '辦 ', '洗 面 ', '食 肌 ', '調 官 機 ', '仙 獅 娘 ', '拍 鐵 寮 ', '路 營 區 ', '韌 尾 ', '外 鄉 客 ', '聖 字 區 ', '你 阿 母 間 災 仔 你 在 遮 發 貨 物 ', '敢 安 呢 ', '到 草 原 ', '望 星 橋 ', '市 府 ', '實 字 架 ', '文 昌 橋 ', '有 影 緊 無 ', '林 內 鄉 ', '紅 目 樹 屎 ', '囡 仔 人 目 看 有 ', '菁 大 ', '文 古 揣 ', '歹 喙 道 ', '查 某 人 ', '滷 菜 頭 ', '跳 過 ', '鴨 母 帶 唱 旋 ', '不 貪 不 自 ', '客 行 ', '下 腹 腓 ', '天 安 門 公 場 ', '豆 磨 ', '溫 寮 戶 ', '初 花 ', '雞 籠 蜂 ', '暗 明 網 線 娘 ', '袂 曉 公 話 ', '腰 床 ', '順 勢 ', '三 攏 無 ', '鐵 欲 膠 ', '推 渡 ', '卒 久 無 看 的 ', '起 家 補 貨 ', '臺 東 ', '不 見 天 ', '麥 花 蜜 ', '著 蝦 仔 腸 ', '苦 寮 仔 ', '五 肌 筋 頭 好 隔 腿 的 突 肌 嘛 痛 ', '溶 毛 位 ', '厝 尾 頂 ', '橫 樹 人 ', '大 坵 ', '殼 羹 ', '客 戶 ', '按 摩 師 ', '芋 仔 糊 ', '海 口 ', '阿 里 不 搭 ', '冰 島 ', '摺 ', '屎 啦 ', '臭 屎 青 ', '網 紗 尿 尻 倉 ', '策 伐 ', '庸 桑 歸 桑 ', '一 切 攏 是 假 的 ', '小 山 崙 仔 ', '煎 仔 糊 ', '青 眉 仔 目 鏡 ', '親 愛 的 ', '臺 大 大 學 ', '欲 去 到 位 ', '坑 頭 鴨 ', '面 流 ', '揣 著 ', '嬌 童 小 道 ', '門 東 仔 ', '寧 角 龍 ', '狡 頭 不 勇 ', '桃 園 ', '我 欲 去 便 所 ', '彼 當 時 ', '片 雷 公 ', '代 誌 問 號 ', '症 頭 ', '我 思 緘 ', '材 料 庫 學 ', '甕 底 水 溪 ', '貨 錢 ', '睏 袂 去 ']
preprocessor_config.json CHANGED
The diff for this file is too large to render. See raw diff
 
pytorch_model.bin CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:9c1e1cf1e0f592d5e4a409fb4bad5c85a3999010e244b51f776a67a2fc6c0616
3
  size 6173655480
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:4ef4e1637cc218a82689705eefba3dfb4c61dd4754c6462e1492eb4c9dee2738
3
  size 6173655480
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json CHANGED
@@ -19,7 +19,6 @@
19
  },
20
  "errors": "replace",
21
  "model_max_length": 1024,
22
- "name_or_path": "openai/whisper-large-v2",
23
  "pad_token": null,
24
  "processor_class": "WhisperProcessor",
25
  "return_attention_mask": false,
 
19
  },
20
  "errors": "replace",
21
  "model_max_length": 1024,
 
22
  "pad_token": null,
23
  "processor_class": "WhisperProcessor",
24
  "return_attention_mask": false,
train_results.json CHANGED
@@ -1,7 +1,7 @@
1
  {
2
- "epoch": 6.05,
3
- "train_loss": 3.0522214595794677,
4
- "train_runtime": 5458.8622,
5
- "train_samples_per_second": 1.832,
6
- "train_steps_per_second": 0.916
7
  }
 
1
  {
2
+ "epoch": 1.38,
3
+ "train_loss": 0.91982373046875,
4
+ "train_runtime": 1347.6358,
5
+ "train_samples_per_second": 1.484,
6
+ "train_steps_per_second": 0.742
7
  }
trainer_state.json CHANGED
@@ -1,1275 +1,41 @@
1
  {
2
  "best_metric": null,
3
  "best_model_checkpoint": null,
4
- "epoch": 6.0532,
5
- "global_step": 5000,
6
  "is_hyper_param_search": false,
7
  "is_local_process_zero": true,
8
  "is_world_process_zero": true,
9
  "log_history": [
10
  {
11
- "epoch": 0.01,
12
- "learning_rate": 4.2000000000000006e-07,
13
- "loss": 2.3259,
14
- "step": 25
15
- },
16
- {
17
- "epoch": 0.01,
18
- "learning_rate": 9.000000000000001e-07,
19
- "loss": 1.7615,
20
- "step": 50
21
- },
22
- {
23
- "epoch": 0.01,
24
- "learning_rate": 1.3800000000000001e-06,
25
- "loss": 1.2375,
26
- "step": 75
27
- },
28
- {
29
- "epoch": 0.02,
30
- "learning_rate": 1.8800000000000002e-06,
31
- "loss": 1.3112,
32
- "step": 100
33
- },
34
- {
35
- "epoch": 0.03,
36
- "learning_rate": 2.38e-06,
37
- "loss": 1.3986,
38
- "step": 125
39
- },
40
- {
41
- "epoch": 0.03,
42
- "learning_rate": 2.88e-06,
43
- "loss": 1.6643,
44
- "step": 150
45
- },
46
- {
47
- "epoch": 0.04,
48
- "learning_rate": 3.3800000000000007e-06,
49
- "loss": 1.7064,
50
- "step": 175
51
- },
52
- {
53
- "epoch": 0.04,
54
- "learning_rate": 3.88e-06,
55
- "loss": 1.7026,
56
- "step": 200
57
- },
58
- {
59
- "epoch": 0.04,
60
- "learning_rate": 4.38e-06,
61
- "loss": 2.0459,
62
- "step": 225
63
- },
64
- {
65
- "epoch": 0.05,
66
- "learning_rate": 4.880000000000001e-06,
67
- "loss": 2.3189,
68
- "step": 250
69
- },
70
- {
71
- "epoch": 0.06,
72
- "learning_rate": 5.380000000000001e-06,
73
- "loss": 2.647,
74
- "step": 275
75
- },
76
- {
77
- "epoch": 0.06,
78
- "learning_rate": 5.8800000000000005e-06,
79
- "loss": 2.4019,
80
- "step": 300
81
- },
82
- {
83
- "epoch": 0.07,
84
- "learning_rate": 6.380000000000001e-06,
85
- "loss": 2.9076,
86
- "step": 325
87
- },
88
- {
89
- "epoch": 0.07,
90
- "learning_rate": 6.860000000000001e-06,
91
- "loss": 4.1248,
92
- "step": 350
93
- },
94
- {
95
- "epoch": 0.07,
96
- "learning_rate": 7.360000000000001e-06,
97
- "loss": 2.9751,
98
- "step": 375
99
- },
100
- {
101
- "epoch": 0.08,
102
- "learning_rate": 7.860000000000001e-06,
103
- "loss": 3.1863,
104
- "step": 400
105
- },
106
- {
107
- "epoch": 0.09,
108
- "learning_rate": 8.36e-06,
109
- "loss": 3.1017,
110
- "step": 425
111
- },
112
- {
113
- "epoch": 0.09,
114
- "learning_rate": 8.860000000000002e-06,
115
- "loss": 3.3757,
116
- "step": 450
117
- },
118
- {
119
- "epoch": 0.1,
120
- "learning_rate": 9.360000000000002e-06,
121
- "loss": 4.871,
122
- "step": 475
123
- },
124
- {
125
- "epoch": 0.1,
126
- "learning_rate": 9.86e-06,
127
- "loss": 7.6053,
128
- "step": 500
129
- },
130
- {
131
- "epoch": 0.1,
132
- "learning_rate": 9.960000000000001e-06,
133
- "loss": 4.4155,
134
- "step": 525
135
- },
136
- {
137
- "epoch": 0.11,
138
- "learning_rate": 9.904444444444445e-06,
139
- "loss": 4.5183,
140
- "step": 550
141
- },
142
- {
143
- "epoch": 0.12,
144
- "learning_rate": 9.84888888888889e-06,
145
- "loss": 4.1442,
146
- "step": 575
147
- },
148
- {
149
- "epoch": 0.12,
150
- "learning_rate": 9.793333333333333e-06,
151
- "loss": 4.1241,
152
- "step": 600
153
- },
154
- {
155
- "epoch": 0.12,
156
- "learning_rate": 9.737777777777779e-06,
157
- "loss": 3.9046,
158
- "step": 625
159
- },
160
- {
161
- "epoch": 0.13,
162
- "learning_rate": 9.682222222222223e-06,
163
- "loss": 3.8142,
164
- "step": 650
165
- },
166
- {
167
- "epoch": 0.14,
168
- "learning_rate": 9.626666666666667e-06,
169
- "loss": 3.6618,
170
- "step": 675
171
- },
172
- {
173
- "epoch": 0.14,
174
- "learning_rate": 9.571111111111113e-06,
175
- "loss": 3.6848,
176
- "step": 700
177
- },
178
- {
179
- "epoch": 0.14,
180
- "learning_rate": 9.515555555555557e-06,
181
- "loss": 3.6017,
182
- "step": 725
183
- },
184
- {
185
- "epoch": 0.15,
186
- "learning_rate": 9.460000000000001e-06,
187
- "loss": 3.5401,
188
- "step": 750
189
- },
190
- {
191
- "epoch": 0.15,
192
- "learning_rate": 9.404444444444445e-06,
193
- "loss": 3.7507,
194
- "step": 775
195
- },
196
- {
197
- "epoch": 1.0,
198
- "learning_rate": 9.348888888888889e-06,
199
- "loss": 3.3527,
200
- "step": 800
201
- },
202
- {
203
- "epoch": 1.01,
204
- "learning_rate": 9.293333333333335e-06,
205
- "loss": 3.4445,
206
- "step": 825
207
- },
208
- {
209
- "epoch": 1.01,
210
- "learning_rate": 9.237777777777779e-06,
211
- "loss": 3.3492,
212
- "step": 850
213
- },
214
- {
215
- "epoch": 1.02,
216
- "learning_rate": 9.182222222222223e-06,
217
- "loss": 3.4195,
218
- "step": 875
219
- },
220
- {
221
- "epoch": 1.02,
222
- "learning_rate": 9.126666666666667e-06,
223
- "loss": 3.6324,
224
- "step": 900
225
- },
226
- {
227
- "epoch": 1.03,
228
- "learning_rate": 9.07111111111111e-06,
229
- "loss": 3.5551,
230
- "step": 925
231
- },
232
- {
233
- "epoch": 1.03,
234
- "learning_rate": 9.015555555555557e-06,
235
- "loss": 3.6139,
236
- "step": 950
237
- },
238
- {
239
- "epoch": 1.04,
240
- "learning_rate": 8.96e-06,
241
- "loss": 3.3878,
242
- "step": 975
243
- },
244
- {
245
- "epoch": 1.04,
246
- "learning_rate": 8.904444444444446e-06,
247
- "loss": 3.5696,
248
  "step": 1000
249
  },
250
  {
251
- "epoch": 1.04,
252
- "eval_cer": 96.89103531542409,
253
- "eval_loss": 3.418963670730591,
254
- "eval_runtime": 273.6647,
255
- "eval_samples_per_second": 3.603,
256
- "eval_steps_per_second": 1.801,
257
- "eval_wer": 96.85496183206106,
258
  "step": 1000
259
  },
260
  {
261
- "epoch": 1.05,
262
- "learning_rate": 8.848888888888889e-06,
263
- "loss": 3.6154,
264
- "step": 1025
265
- },
266
- {
267
- "epoch": 1.05,
268
- "learning_rate": 8.793333333333334e-06,
269
- "loss": 3.4399,
270
- "step": 1050
271
- },
272
- {
273
- "epoch": 1.06,
274
- "learning_rate": 8.737777777777778e-06,
275
- "loss": 3.3262,
276
- "step": 1075
277
- },
278
- {
279
- "epoch": 1.06,
280
- "learning_rate": 8.682222222222222e-06,
281
- "loss": 3.4615,
282
- "step": 1100
283
- },
284
- {
285
- "epoch": 1.07,
286
- "learning_rate": 8.626666666666668e-06,
287
- "loss": 3.2971,
288
- "step": 1125
289
- },
290
- {
291
- "epoch": 1.07,
292
- "learning_rate": 8.571111111111112e-06,
293
- "loss": 3.4235,
294
- "step": 1150
295
- },
296
- {
297
- "epoch": 1.08,
298
- "learning_rate": 8.515555555555556e-06,
299
- "loss": 3.252,
300
- "step": 1175
301
- },
302
- {
303
- "epoch": 1.08,
304
- "learning_rate": 8.46e-06,
305
- "loss": 3.3725,
306
- "step": 1200
307
- },
308
- {
309
- "epoch": 1.09,
310
- "learning_rate": 8.404444444444444e-06,
311
- "loss": 3.4539,
312
- "step": 1225
313
- },
314
- {
315
- "epoch": 1.09,
316
- "learning_rate": 8.34888888888889e-06,
317
- "loss": 3.3736,
318
- "step": 1250
319
- },
320
- {
321
- "epoch": 1.1,
322
- "learning_rate": 8.293333333333334e-06,
323
- "loss": 3.3606,
324
- "step": 1275
325
- },
326
- {
327
- "epoch": 1.1,
328
- "learning_rate": 8.237777777777778e-06,
329
- "loss": 3.4193,
330
- "step": 1300
331
- },
332
- {
333
- "epoch": 1.11,
334
- "learning_rate": 8.182222222222222e-06,
335
- "loss": 3.3679,
336
- "step": 1325
337
- },
338
- {
339
- "epoch": 1.11,
340
- "learning_rate": 8.126666666666668e-06,
341
- "loss": 3.5329,
342
- "step": 1350
343
- },
344
- {
345
- "epoch": 1.12,
346
- "learning_rate": 8.071111111111112e-06,
347
- "loss": 3.3347,
348
- "step": 1375
349
- },
350
- {
351
- "epoch": 1.12,
352
- "learning_rate": 8.015555555555556e-06,
353
- "loss": 3.3093,
354
- "step": 1400
355
- },
356
- {
357
- "epoch": 1.13,
358
- "learning_rate": 7.960000000000002e-06,
359
- "loss": 3.3035,
360
- "step": 1425
361
- },
362
- {
363
- "epoch": 1.13,
364
- "learning_rate": 7.904444444444444e-06,
365
- "loss": 3.4493,
366
- "step": 1450
367
- },
368
- {
369
- "epoch": 1.14,
370
- "learning_rate": 7.84888888888889e-06,
371
- "loss": 3.2347,
372
- "step": 1475
373
- },
374
- {
375
- "epoch": 1.14,
376
- "learning_rate": 7.793333333333334e-06,
377
- "loss": 3.2076,
378
- "step": 1500
379
- },
380
- {
381
- "epoch": 1.15,
382
- "learning_rate": 7.737777777777778e-06,
383
- "loss": 3.2862,
384
- "step": 1525
385
- },
386
- {
387
- "epoch": 1.15,
388
- "learning_rate": 7.682222222222224e-06,
389
- "loss": 3.4486,
390
- "step": 1550
391
- },
392
- {
393
- "epoch": 1.16,
394
- "learning_rate": 7.626666666666668e-06,
395
- "loss": 3.3531,
396
- "step": 1575
397
- },
398
- {
399
- "epoch": 2.0,
400
- "learning_rate": 7.571111111111112e-06,
401
- "loss": 3.435,
402
- "step": 1600
403
- },
404
- {
405
- "epoch": 2.01,
406
- "learning_rate": 7.515555555555556e-06,
407
- "loss": 3.3428,
408
- "step": 1625
409
- },
410
- {
411
- "epoch": 2.01,
412
- "learning_rate": 7.4600000000000006e-06,
413
- "loss": 3.2712,
414
- "step": 1650
415
- },
416
- {
417
- "epoch": 2.02,
418
- "learning_rate": 7.4044444444444455e-06,
419
- "loss": 3.147,
420
- "step": 1675
421
- },
422
- {
423
- "epoch": 2.02,
424
- "learning_rate": 7.3488888888888895e-06,
425
- "loss": 3.2841,
426
- "step": 1700
427
- },
428
- {
429
- "epoch": 2.03,
430
- "learning_rate": 7.2933333333333335e-06,
431
- "loss": 3.1548,
432
- "step": 1725
433
- },
434
- {
435
- "epoch": 2.03,
436
- "learning_rate": 7.237777777777778e-06,
437
- "loss": 3.0778,
438
- "step": 1750
439
- },
440
- {
441
- "epoch": 2.04,
442
- "learning_rate": 7.1822222222222224e-06,
443
- "loss": 3.1293,
444
- "step": 1775
445
- },
446
- {
447
- "epoch": 2.04,
448
- "learning_rate": 7.126666666666667e-06,
449
- "loss": 3.3325,
450
- "step": 1800
451
- },
452
- {
453
- "epoch": 2.05,
454
- "learning_rate": 7.071111111111112e-06,
455
- "loss": 3.1438,
456
- "step": 1825
457
- },
458
- {
459
- "epoch": 2.05,
460
- "learning_rate": 7.015555555555556e-06,
461
- "loss": 3.3838,
462
- "step": 1850
463
- },
464
- {
465
- "epoch": 2.06,
466
- "learning_rate": 6.96e-06,
467
- "loss": 3.344,
468
- "step": 1875
469
- },
470
- {
471
- "epoch": 2.06,
472
- "learning_rate": 6.904444444444444e-06,
473
- "loss": 3.1949,
474
- "step": 1900
475
- },
476
- {
477
- "epoch": 2.07,
478
- "learning_rate": 6.848888888888889e-06,
479
- "loss": 3.2732,
480
- "step": 1925
481
- },
482
- {
483
- "epoch": 2.07,
484
- "learning_rate": 6.793333333333334e-06,
485
- "loss": 3.2508,
486
- "step": 1950
487
- },
488
- {
489
- "epoch": 2.08,
490
- "learning_rate": 6.737777777777779e-06,
491
- "loss": 3.1962,
492
- "step": 1975
493
- },
494
- {
495
- "epoch": 2.08,
496
- "learning_rate": 6.682222222222223e-06,
497
- "loss": 3.1453,
498
- "step": 2000
499
- },
500
- {
501
- "epoch": 2.08,
502
- "eval_cer": 98.94355568970722,
503
- "eval_loss": 3.238253116607666,
504
- "eval_runtime": 276.3056,
505
- "eval_samples_per_second": 3.569,
506
- "eval_steps_per_second": 1.784,
507
- "eval_wer": 98.93129770992365,
508
- "step": 2000
509
- },
510
- {
511
- "epoch": 2.09,
512
- "learning_rate": 6.626666666666667e-06,
513
- "loss": 3.2259,
514
- "step": 2025
515
- },
516
- {
517
- "epoch": 2.09,
518
- "learning_rate": 6.571111111111111e-06,
519
- "loss": 3.2412,
520
- "step": 2050
521
- },
522
- {
523
- "epoch": 2.1,
524
- "learning_rate": 6.515555555555556e-06,
525
- "loss": 3.1211,
526
- "step": 2075
527
- },
528
- {
529
- "epoch": 2.1,
530
- "learning_rate": 6.460000000000001e-06,
531
- "loss": 2.9139,
532
- "step": 2100
533
- },
534
- {
535
- "epoch": 2.11,
536
- "learning_rate": 6.404444444444446e-06,
537
- "loss": 3.1701,
538
- "step": 2125
539
- },
540
- {
541
- "epoch": 2.11,
542
- "learning_rate": 6.348888888888889e-06,
543
- "loss": 3.1944,
544
- "step": 2150
545
- },
546
- {
547
- "epoch": 2.12,
548
- "learning_rate": 6.293333333333334e-06,
549
- "loss": 3.1589,
550
- "step": 2175
551
- },
552
- {
553
- "epoch": 2.12,
554
- "learning_rate": 6.237777777777778e-06,
555
- "loss": 3.2229,
556
- "step": 2200
557
- },
558
- {
559
- "epoch": 2.13,
560
- "learning_rate": 6.182222222222223e-06,
561
- "loss": 3.2401,
562
- "step": 2225
563
- },
564
- {
565
- "epoch": 2.13,
566
- "learning_rate": 6.126666666666668e-06,
567
- "loss": 3.2551,
568
- "step": 2250
569
- },
570
- {
571
- "epoch": 2.14,
572
- "learning_rate": 6.0711111111111125e-06,
573
- "loss": 2.9634,
574
- "step": 2275
575
- },
576
- {
577
- "epoch": 2.14,
578
- "learning_rate": 6.015555555555556e-06,
579
- "loss": 3.0801,
580
- "step": 2300
581
- },
582
- {
583
- "epoch": 2.15,
584
- "learning_rate": 5.9600000000000005e-06,
585
- "loss": 3.1698,
586
- "step": 2325
587
- },
588
- {
589
- "epoch": 2.15,
590
- "learning_rate": 5.9044444444444446e-06,
591
- "loss": 3.1864,
592
- "step": 2350
593
- },
594
- {
595
- "epoch": 3.0,
596
- "learning_rate": 5.8488888888888895e-06,
597
- "loss": 3.1402,
598
- "step": 2375
599
- },
600
- {
601
- "epoch": 3.01,
602
- "learning_rate": 5.793333333333334e-06,
603
- "loss": 3.1443,
604
- "step": 2400
605
- },
606
- {
607
- "epoch": 3.01,
608
- "learning_rate": 5.737777777777778e-06,
609
- "loss": 2.9661,
610
- "step": 2425
611
- },
612
- {
613
- "epoch": 3.02,
614
- "learning_rate": 5.682222222222222e-06,
615
- "loss": 3.0652,
616
- "step": 2450
617
- },
618
- {
619
- "epoch": 3.02,
620
- "learning_rate": 5.626666666666667e-06,
621
- "loss": 3.0405,
622
- "step": 2475
623
- },
624
- {
625
- "epoch": 3.03,
626
- "learning_rate": 5.571111111111111e-06,
627
- "loss": 2.9499,
628
- "step": 2500
629
- },
630
- {
631
- "epoch": 3.03,
632
- "learning_rate": 5.515555555555556e-06,
633
- "loss": 3.1246,
634
- "step": 2525
635
- },
636
- {
637
- "epoch": 3.04,
638
- "learning_rate": 5.460000000000001e-06,
639
- "loss": 3.0122,
640
- "step": 2550
641
- },
642
- {
643
- "epoch": 3.04,
644
- "learning_rate": 5.404444444444444e-06,
645
- "loss": 3.0258,
646
- "step": 2575
647
- },
648
- {
649
- "epoch": 3.05,
650
- "learning_rate": 5.348888888888889e-06,
651
- "loss": 3.1414,
652
- "step": 2600
653
- },
654
- {
655
- "epoch": 3.05,
656
- "learning_rate": 5.293333333333334e-06,
657
- "loss": 3.1096,
658
- "step": 2625
659
- },
660
- {
661
- "epoch": 3.06,
662
- "learning_rate": 5.237777777777778e-06,
663
- "loss": 3.0937,
664
- "step": 2650
665
- },
666
- {
667
- "epoch": 3.06,
668
- "learning_rate": 5.182222222222223e-06,
669
- "loss": 3.0308,
670
- "step": 2675
671
- },
672
- {
673
- "epoch": 3.07,
674
- "learning_rate": 5.126666666666668e-06,
675
- "loss": 3.1702,
676
- "step": 2700
677
- },
678
- {
679
- "epoch": 3.07,
680
- "learning_rate": 5.071111111111111e-06,
681
- "loss": 3.1638,
682
- "step": 2725
683
- },
684
- {
685
- "epoch": 3.08,
686
- "learning_rate": 5.015555555555556e-06,
687
- "loss": 2.9025,
688
- "step": 2750
689
- },
690
- {
691
- "epoch": 3.08,
692
- "learning_rate": 4.960000000000001e-06,
693
- "loss": 3.0278,
694
- "step": 2775
695
- },
696
- {
697
- "epoch": 3.09,
698
- "learning_rate": 4.904444444444445e-06,
699
- "loss": 3.0397,
700
- "step": 2800
701
- },
702
- {
703
- "epoch": 3.09,
704
- "learning_rate": 4.848888888888889e-06,
705
- "loss": 3.0413,
706
- "step": 2825
707
- },
708
- {
709
- "epoch": 3.1,
710
- "learning_rate": 4.793333333333334e-06,
711
- "loss": 3.1721,
712
- "step": 2850
713
- },
714
- {
715
- "epoch": 3.1,
716
- "learning_rate": 4.737777777777779e-06,
717
- "loss": 2.9547,
718
- "step": 2875
719
- },
720
- {
721
- "epoch": 3.11,
722
- "learning_rate": 4.682222222222223e-06,
723
- "loss": 2.974,
724
- "step": 2900
725
- },
726
- {
727
- "epoch": 3.11,
728
- "learning_rate": 4.626666666666667e-06,
729
- "loss": 3.0297,
730
- "step": 2925
731
- },
732
- {
733
- "epoch": 3.12,
734
- "learning_rate": 4.571111111111112e-06,
735
- "loss": 2.9829,
736
- "step": 2950
737
- },
738
- {
739
- "epoch": 3.12,
740
- "learning_rate": 4.515555555555556e-06,
741
- "loss": 2.8869,
742
- "step": 2975
743
- },
744
- {
745
- "epoch": 3.13,
746
- "learning_rate": 4.4600000000000005e-06,
747
- "loss": 3.0722,
748
- "step": 3000
749
- },
750
- {
751
- "epoch": 3.13,
752
- "eval_cer": 158.52701479022033,
753
- "eval_loss": 3.20432710647583,
754
- "eval_runtime": 318.685,
755
- "eval_samples_per_second": 3.094,
756
- "eval_steps_per_second": 1.547,
757
- "eval_wer": 129.06870229007635,
758
- "step": 3000
759
- },
760
- {
761
- "epoch": 3.13,
762
- "learning_rate": 4.404444444444445e-06,
763
- "loss": 2.9035,
764
- "step": 3025
765
- },
766
- {
767
- "epoch": 3.14,
768
- "learning_rate": 4.348888888888889e-06,
769
- "loss": 2.9127,
770
- "step": 3050
771
- },
772
- {
773
- "epoch": 3.14,
774
- "learning_rate": 4.2933333333333334e-06,
775
- "loss": 3.1372,
776
- "step": 3075
777
- },
778
- {
779
- "epoch": 3.15,
780
- "learning_rate": 4.2377777777777775e-06,
781
- "loss": 2.9721,
782
- "step": 3100
783
- },
784
- {
785
- "epoch": 3.15,
786
- "learning_rate": 4.182222222222222e-06,
787
- "loss": 2.9846,
788
- "step": 3125
789
- },
790
- {
791
- "epoch": 3.16,
792
- "learning_rate": 4.126666666666667e-06,
793
- "loss": 3.0426,
794
- "step": 3150
795
- },
796
- {
797
- "epoch": 4.0,
798
- "learning_rate": 4.071111111111111e-06,
799
- "loss": 2.9058,
800
- "step": 3175
801
- },
802
- {
803
- "epoch": 4.01,
804
- "learning_rate": 4.015555555555556e-06,
805
- "loss": 2.8259,
806
- "step": 3200
807
- },
808
- {
809
- "epoch": 4.01,
810
- "learning_rate": 3.96e-06,
811
- "loss": 2.9893,
812
- "step": 3225
813
- },
814
- {
815
- "epoch": 4.02,
816
- "learning_rate": 3.904444444444444e-06,
817
- "loss": 2.9297,
818
- "step": 3250
819
- },
820
- {
821
- "epoch": 4.02,
822
- "learning_rate": 3.848888888888889e-06,
823
- "loss": 2.8989,
824
- "step": 3275
825
- },
826
- {
827
- "epoch": 4.03,
828
- "learning_rate": 3.793333333333334e-06,
829
- "loss": 2.9417,
830
- "step": 3300
831
- },
832
- {
833
- "epoch": 4.03,
834
- "learning_rate": 3.737777777777778e-06,
835
- "loss": 2.9383,
836
- "step": 3325
837
- },
838
- {
839
- "epoch": 4.04,
840
- "learning_rate": 3.6822222222222225e-06,
841
- "loss": 2.8867,
842
- "step": 3350
843
- },
844
- {
845
- "epoch": 4.04,
846
- "learning_rate": 3.6266666666666674e-06,
847
- "loss": 2.9945,
848
- "step": 3375
849
- },
850
- {
851
- "epoch": 4.05,
852
- "learning_rate": 3.5711111111111114e-06,
853
- "loss": 2.9077,
854
- "step": 3400
855
- },
856
- {
857
- "epoch": 4.05,
858
- "learning_rate": 3.515555555555556e-06,
859
- "loss": 2.8711,
860
- "step": 3425
861
- },
862
- {
863
- "epoch": 4.06,
864
- "learning_rate": 3.46e-06,
865
- "loss": 2.9767,
866
- "step": 3450
867
- },
868
- {
869
- "epoch": 4.06,
870
- "learning_rate": 3.404444444444445e-06,
871
- "loss": 2.8937,
872
- "step": 3475
873
- },
874
- {
875
- "epoch": 4.07,
876
- "learning_rate": 3.3488888888888892e-06,
877
- "loss": 2.9073,
878
- "step": 3500
879
- },
880
- {
881
- "epoch": 4.07,
882
- "learning_rate": 3.2933333333333333e-06,
883
- "loss": 2.7517,
884
- "step": 3525
885
- },
886
- {
887
- "epoch": 4.08,
888
- "learning_rate": 3.237777777777778e-06,
889
- "loss": 3.0988,
890
- "step": 3550
891
- },
892
- {
893
- "epoch": 4.08,
894
- "learning_rate": 3.1822222222222226e-06,
895
- "loss": 2.7826,
896
- "step": 3575
897
- },
898
- {
899
- "epoch": 4.09,
900
- "learning_rate": 3.1266666666666667e-06,
901
- "loss": 2.9641,
902
- "step": 3600
903
- },
904
- {
905
- "epoch": 4.09,
906
- "learning_rate": 3.0711111111111115e-06,
907
- "loss": 2.8948,
908
- "step": 3625
909
- },
910
- {
911
- "epoch": 4.1,
912
- "learning_rate": 3.015555555555556e-06,
913
- "loss": 2.8519,
914
- "step": 3650
915
- },
916
- {
917
- "epoch": 4.1,
918
- "learning_rate": 2.96e-06,
919
- "loss": 2.8796,
920
- "step": 3675
921
- },
922
- {
923
- "epoch": 4.11,
924
- "learning_rate": 2.904444444444445e-06,
925
- "loss": 2.9119,
926
- "step": 3700
927
- },
928
- {
929
- "epoch": 4.11,
930
- "learning_rate": 2.8488888888888894e-06,
931
- "loss": 2.8479,
932
- "step": 3725
933
- },
934
- {
935
- "epoch": 4.12,
936
- "learning_rate": 2.7933333333333334e-06,
937
- "loss": 2.9925,
938
- "step": 3750
939
- },
940
- {
941
- "epoch": 4.12,
942
- "learning_rate": 2.7377777777777783e-06,
943
- "loss": 2.9697,
944
- "step": 3775
945
- },
946
- {
947
- "epoch": 4.13,
948
- "learning_rate": 2.6822222222222223e-06,
949
- "loss": 2.9331,
950
- "step": 3800
951
- },
952
- {
953
- "epoch": 4.13,
954
- "learning_rate": 2.6266666666666668e-06,
955
- "loss": 2.7614,
956
- "step": 3825
957
- },
958
- {
959
- "epoch": 4.14,
960
- "learning_rate": 2.5711111111111112e-06,
961
- "loss": 2.9913,
962
- "step": 3850
963
- },
964
- {
965
- "epoch": 4.14,
966
- "learning_rate": 2.5155555555555557e-06,
967
- "loss": 2.8217,
968
- "step": 3875
969
- },
970
- {
971
- "epoch": 4.15,
972
- "learning_rate": 2.46e-06,
973
- "loss": 2.7742,
974
- "step": 3900
975
- },
976
- {
977
- "epoch": 4.15,
978
- "learning_rate": 2.4044444444444446e-06,
979
- "loss": 2.8652,
980
- "step": 3925
981
- },
982
- {
983
- "epoch": 5.0,
984
- "learning_rate": 2.348888888888889e-06,
985
- "loss": 2.9482,
986
- "step": 3950
987
- },
988
- {
989
- "epoch": 5.01,
990
- "learning_rate": 2.2933333333333335e-06,
991
- "loss": 2.7808,
992
- "step": 3975
993
- },
994
- {
995
- "epoch": 5.01,
996
- "learning_rate": 2.237777777777778e-06,
997
- "loss": 2.8327,
998
- "step": 4000
999
- },
1000
- {
1001
- "epoch": 5.01,
1002
- "eval_cer": 333.05161485058863,
1003
- "eval_loss": 3.225778102874756,
1004
- "eval_runtime": 362.3621,
1005
- "eval_samples_per_second": 2.721,
1006
- "eval_steps_per_second": 1.361,
1007
- "eval_wer": 327.9083969465649,
1008
- "step": 4000
1009
- },
1010
- {
1011
- "epoch": 5.02,
1012
- "learning_rate": 2.1822222222222225e-06,
1013
- "loss": 2.7936,
1014
- "step": 4025
1015
- },
1016
- {
1017
- "epoch": 5.02,
1018
- "learning_rate": 2.126666666666667e-06,
1019
- "loss": 2.7693,
1020
- "step": 4050
1021
- },
1022
- {
1023
- "epoch": 5.03,
1024
- "learning_rate": 2.0711111111111114e-06,
1025
- "loss": 2.7341,
1026
- "step": 4075
1027
- },
1028
- {
1029
- "epoch": 5.03,
1030
- "learning_rate": 2.0155555555555554e-06,
1031
- "loss": 2.7995,
1032
- "step": 4100
1033
- },
1034
- {
1035
- "epoch": 5.04,
1036
- "learning_rate": 1.9600000000000003e-06,
1037
- "loss": 2.78,
1038
- "step": 4125
1039
- },
1040
- {
1041
- "epoch": 5.04,
1042
- "learning_rate": 1.9044444444444445e-06,
1043
- "loss": 2.8048,
1044
- "step": 4150
1045
- },
1046
- {
1047
- "epoch": 5.05,
1048
- "learning_rate": 1.848888888888889e-06,
1049
- "loss": 2.6663,
1050
- "step": 4175
1051
- },
1052
- {
1053
- "epoch": 5.05,
1054
- "learning_rate": 1.7933333333333337e-06,
1055
- "loss": 2.9016,
1056
- "step": 4200
1057
- },
1058
- {
1059
- "epoch": 5.06,
1060
- "learning_rate": 1.737777777777778e-06,
1061
- "loss": 2.7117,
1062
- "step": 4225
1063
- },
1064
- {
1065
- "epoch": 5.06,
1066
- "learning_rate": 1.6822222222222224e-06,
1067
- "loss": 2.6716,
1068
- "step": 4250
1069
- },
1070
- {
1071
- "epoch": 5.07,
1072
- "learning_rate": 1.6266666666666666e-06,
1073
- "loss": 2.7193,
1074
- "step": 4275
1075
- },
1076
- {
1077
- "epoch": 5.07,
1078
- "learning_rate": 1.5711111111111113e-06,
1079
- "loss": 2.7704,
1080
- "step": 4300
1081
- },
1082
- {
1083
- "epoch": 5.08,
1084
- "learning_rate": 1.5155555555555558e-06,
1085
- "loss": 2.9998,
1086
- "step": 4325
1087
- },
1088
- {
1089
- "epoch": 5.08,
1090
- "learning_rate": 1.46e-06,
1091
- "loss": 2.8433,
1092
- "step": 4350
1093
- },
1094
- {
1095
- "epoch": 5.09,
1096
- "learning_rate": 1.4044444444444447e-06,
1097
- "loss": 2.6071,
1098
- "step": 4375
1099
- },
1100
- {
1101
- "epoch": 5.09,
1102
- "learning_rate": 1.3488888888888891e-06,
1103
- "loss": 2.8095,
1104
- "step": 4400
1105
- },
1106
- {
1107
- "epoch": 5.1,
1108
- "learning_rate": 1.2933333333333334e-06,
1109
- "loss": 2.6704,
1110
- "step": 4425
1111
- },
1112
- {
1113
- "epoch": 5.1,
1114
- "learning_rate": 1.2377777777777778e-06,
1115
- "loss": 2.6676,
1116
- "step": 4450
1117
- },
1118
- {
1119
- "epoch": 5.11,
1120
- "learning_rate": 1.1822222222222223e-06,
1121
- "loss": 2.8023,
1122
- "step": 4475
1123
- },
1124
- {
1125
- "epoch": 5.11,
1126
- "learning_rate": 1.1266666666666667e-06,
1127
- "loss": 2.7526,
1128
- "step": 4500
1129
- },
1130
- {
1131
- "epoch": 5.12,
1132
- "learning_rate": 1.0711111111111112e-06,
1133
- "loss": 2.7228,
1134
- "step": 4525
1135
- },
1136
- {
1137
- "epoch": 5.12,
1138
- "learning_rate": 1.0155555555555557e-06,
1139
- "loss": 2.6382,
1140
- "step": 4550
1141
- },
1142
- {
1143
- "epoch": 5.13,
1144
- "learning_rate": 9.600000000000001e-07,
1145
- "loss": 2.7358,
1146
- "step": 4575
1147
- },
1148
- {
1149
- "epoch": 5.13,
1150
- "learning_rate": 9.044444444444445e-07,
1151
- "loss": 2.6922,
1152
- "step": 4600
1153
- },
1154
- {
1155
- "epoch": 5.14,
1156
- "learning_rate": 8.488888888888889e-07,
1157
- "loss": 2.847,
1158
- "step": 4625
1159
- },
1160
- {
1161
- "epoch": 5.14,
1162
- "learning_rate": 7.933333333333335e-07,
1163
- "loss": 2.6146,
1164
- "step": 4650
1165
- },
1166
- {
1167
- "epoch": 5.15,
1168
- "learning_rate": 7.377777777777779e-07,
1169
- "loss": 2.7914,
1170
- "step": 4675
1171
- },
1172
- {
1173
- "epoch": 5.15,
1174
- "learning_rate": 6.822222222222223e-07,
1175
- "loss": 2.645,
1176
- "step": 4700
1177
- },
1178
- {
1179
- "epoch": 5.16,
1180
- "learning_rate": 6.266666666666667e-07,
1181
- "loss": 2.717,
1182
- "step": 4725
1183
- },
1184
- {
1185
- "epoch": 6.0,
1186
- "learning_rate": 5.711111111111111e-07,
1187
- "loss": 2.751,
1188
- "step": 4750
1189
- },
1190
- {
1191
- "epoch": 6.01,
1192
- "learning_rate": 5.155555555555556e-07,
1193
- "loss": 2.6859,
1194
- "step": 4775
1195
- },
1196
- {
1197
- "epoch": 6.01,
1198
- "learning_rate": 4.6000000000000004e-07,
1199
- "loss": 2.4752,
1200
- "step": 4800
1201
- },
1202
- {
1203
- "epoch": 6.02,
1204
- "learning_rate": 4.0444444444444445e-07,
1205
- "loss": 2.6502,
1206
- "step": 4825
1207
- },
1208
- {
1209
- "epoch": 6.02,
1210
- "learning_rate": 3.488888888888889e-07,
1211
- "loss": 2.5226,
1212
- "step": 4850
1213
- },
1214
- {
1215
- "epoch": 6.03,
1216
- "learning_rate": 2.9333333333333337e-07,
1217
- "loss": 2.6241,
1218
- "step": 4875
1219
- },
1220
- {
1221
- "epoch": 6.03,
1222
- "learning_rate": 2.3777777777777777e-07,
1223
- "loss": 2.5514,
1224
- "step": 4900
1225
- },
1226
- {
1227
- "epoch": 6.04,
1228
- "learning_rate": 1.8222222222222226e-07,
1229
- "loss": 2.6996,
1230
- "step": 4925
1231
- },
1232
- {
1233
- "epoch": 6.04,
1234
- "learning_rate": 1.2666666666666666e-07,
1235
- "loss": 2.6358,
1236
- "step": 4950
1237
- },
1238
- {
1239
- "epoch": 6.05,
1240
- "learning_rate": 7.111111111111112e-08,
1241
- "loss": 2.7597,
1242
- "step": 4975
1243
- },
1244
- {
1245
- "epoch": 6.05,
1246
- "learning_rate": 1.5555555555555557e-08,
1247
- "loss": 2.6468,
1248
- "step": 5000
1249
- },
1250
- {
1251
- "epoch": 6.05,
1252
- "eval_cer": 123.45306368849984,
1253
- "eval_loss": 3.212874174118042,
1254
- "eval_runtime": 302.4073,
1255
- "eval_samples_per_second": 3.261,
1256
- "eval_steps_per_second": 1.63,
1257
- "eval_wer": 118.50381679389312,
1258
- "step": 5000
1259
- },
1260
- {
1261
- "epoch": 6.05,
1262
- "step": 5000,
1263
- "total_flos": 2.12189711818752e+19,
1264
- "train_loss": 3.0522214595794677,
1265
- "train_runtime": 5458.8622,
1266
- "train_samples_per_second": 1.832,
1267
- "train_steps_per_second": 0.916
1268
  }
1269
  ],
1270
- "max_steps": 5000,
1271
  "num_train_epochs": 9223372036854775807,
1272
- "total_flos": 2.12189711818752e+19,
1273
  "trial_name": null,
1274
  "trial_params": null
1275
  }
 
1
  {
2
  "best_metric": null,
3
  "best_model_checkpoint": null,
4
+ "epoch": 1.383,
5
+ "global_step": 1000,
6
  "is_hyper_param_search": false,
7
  "is_local_process_zero": true,
8
  "is_world_process_zero": true,
9
  "log_history": [
10
  {
11
+ "epoch": 1.38,
12
+ "learning_rate": 8.88888888888889e-08,
13
+ "loss": 0.9198,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
14
  "step": 1000
15
  },
16
  {
17
+ "epoch": 1.38,
18
+ "eval_cer": 48.17386054935105,
19
+ "eval_loss": 0.9147109389305115,
20
+ "eval_runtime": 340.3264,
21
+ "eval_samples_per_second": 2.897,
22
+ "eval_steps_per_second": 1.449,
23
+ "eval_wer": 48.06106870229008,
24
  "step": 1000
25
  },
26
  {
27
+ "epoch": 1.38,
28
+ "step": 1000,
29
+ "total_flos": 4.2463420416e+18,
30
+ "train_loss": 0.91982373046875,
31
+ "train_runtime": 1347.6358,
32
+ "train_samples_per_second": 1.484,
33
+ "train_steps_per_second": 0.742
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
34
  }
35
  ],
36
+ "max_steps": 1000,
37
  "num_train_epochs": 9223372036854775807,
38
+ "total_flos": 4.2463420416e+18,
39
  "trial_name": null,
40
  "trial_params": null
41
  }
training_args.bin CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:b0917c506d33e6aaecd26c5c143567a69a21ec072808d7d6a3e64a1189180b2d
3
- size 3515
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:559c4ce05e89d747196b9bba18aa9426caf585ced1042f6a3e013da85ed0c8dc
3
+ size 3707
vocab.json CHANGED
The diff for this file is too large to render. See raw diff