mt5_base_EN_TH_sch_wiki

This model is a fine-tuned version of google/mt5-base on the None dataset. It achieves the following results on the evaluation set:

Model description

More information needed

More information needed

More information needed

The following hyperparameters were used during training:

learning_rate: 5e-05
train_batch_size: 45
eval_batch_size: 16
seed: 42
optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
lr_scheduler_type: linear
num_epochs: 15
mixed_precision_training: Native AMP

Epoch	Step	Validation Loss	Rouge2 Precision	Rouge2 Recall	Rouge2 Fmeasure
1.0	2879	nan	0.0098	0.0051	0.0065
2.0	5758	nan	0.0098	0.0051	0.0065
3.0	8637	nan	0.0098	0.0051	0.0065
4.0	11516	nan	0.0098	0.0051	0.0065
5.0	14395	nan	0.0098	0.0051	0.0065
6.0	17274	nan	0.0098	0.0051	0.0065
7.0	20153	nan	0.0098	0.0051	0.0065
8.0	23032	nan	0.0098	0.0051	0.0065
9.0	25911	nan	0.0098	0.0051	0.0065
10.0	28790	nan	0.0098	0.0051	0.0065
11.0	31669	nan	0.0098	0.0051	0.0065
12.0	34548	nan	0.0098	0.0051	0.0065
13.0	37427	nan	0.0098	0.0051	0.0065
14.0	40306	nan	0.0098	0.0051	0.0065
15.0	43185	nan	0.0098	0.0051	0.0065