meoo225
/

mT5_base

@@ -4,9 +4,6 @@ license: apache-2.0
 base_model: google/mt5-base
 tags:
 - generated_from_trainer
-metrics:
-- precision
-- recall
 model-index:
 - name: mT5_base
   results: []
@@ -21,10 +18,7 @@ This model is a fine-tuned version of [google/mt5-base](https://huggingface.co/g
 It achieves the following results on the evaluation set:
 - Loss: 0.1703
 - Bleu Score: 51.176
-- Precision: 27.4791
-- Recall: 27.4791
 - Gen Len: 16.8805
-- Err: 27.4791
 ## Model description
@@ -47,22 +41,22 @@ The following hyperparameters were used during training:
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
-- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 3
 ### Training results
-| Training Loss | Epoch | Step | Validation Loss | Bleu Score | Precision | Recall  | Gen Len | Err     |
-|:-------------:|:-----:|:----:|:---------------:|:----------:|:---------:|:-------:|:-------:|:-------:|
-| 1.3269        | 1.0   | 838  | 0.2396          | 48.4521    | 20.7885   | 20.7885 | 16.8339 | 20.7885 |
-| 0.2831        | 2.0   | 1676 | 0.1861          | 50.5118    | 26.1649   | 26.1649 | 16.8781 | 26.1649 |
-| 0.2167        | 3.0   | 2514 | 0.1703          | 51.176     | 27.4791   | 27.4791 | 16.8805 | 27.4791 |
 ### Framework versions
-- Transformers 4.45.1
-- Pytorch 2.4.1+cu121
-- Datasets 3.0.1
-- Tokenizers 0.20.0

 base_model: google/mt5-base
 tags:
 - generated_from_trainer
 model-index:
 - name: mT5_base
   results: []
 It achieves the following results on the evaluation set:
 - Loss: 0.1703
 - Bleu Score: 51.176
 - Gen Len: 16.8805
 ## Model description
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
+- optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - num_epochs: 3
 ### Training results
+| Training Loss | Epoch | Step | Validation Loss | Bleu Score | Gen Len |
+|:-------------:|:-----:|:----:|:---------------:|:----------:|:-------:|
+| 1.3269        | 1.0   | 838  | 0.2396          | 48.4521    | 16.8339 |
+| 0.2831        | 2.0   | 1676 | 0.1861          | 50.5118    | 16.8781 |
+| 0.2167        | 3.0   | 2514 | 0.1703          | 51.176     | 16.8805 |
 ### Framework versions
+- Transformers 4.46.2
+- Pytorch 2.5.0+cu121
+- Datasets 3.1.0
+- Tokenizers 0.20.3

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
-  "transformers_version": "4.45.1"
 }

   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
+  "transformers_version": "4.46.2"
 }

logs/events.out.tfevents.1731693972.5db65e64f3ce.727.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b6ee9791abb54fd65139dcd9b4a180e741efe12320dd0d727486a6ec7689a247
-size 7095

 version https://git-lfs.github.com/spec/v1
+oid sha256:588215fde1137532bc3861ed5794e1a11da9f55f845f6d2c63c505dde48f14d9
+size 7449