Krylova
/

mt5-small-finetuned-amazon-en-de

@@ -17,11 +17,11 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google/mt5-small](https://huggingface.co/google/mt5-small) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 2.5844
-- Rouge1: 18.6058
-- Rouge2: 10.0803
-- Rougel: 18.025
-- Rougelsum: 18.2237
 ## Model description
@@ -41,8 +41,8 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5.6e-05
-- train_batch_size: 8
-- eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
@@ -50,16 +50,16 @@ The following hyperparameters were used during training:
 ### Training results
-| Training Loss | Epoch | Step  | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum |
-|:-------------:|:-----:|:-----:|:---------------:|:-------:|:-------:|:-------:|:---------:|
-| 2.6887        | 1.0   | 1301  | 2.7862          | 20.3987 | 12.8512 | 19.7713 | 19.7397   |
-| 2.5315        | 2.0   | 2602  | 2.7636          | 19.7025 | 11.5086 | 19.2285 | 19.1621   |
-| 2.9455        | 3.0   | 3903  | 2.6457          | 20.5245 | 12.445  | 19.9432 | 19.9865   |
-| 2.9864        | 4.0   | 5204  | 2.5944          | 19.0345 | 10.3224 | 18.5022 | 18.5792   |
-| 2.9746        | 5.0   | 6505  | 2.5910          | 19.5747 | 10.3954 | 18.9401 | 19.1369   |
-| 2.9246        | 6.0   | 7806  | 2.5822          | 18.5846 | 9.8889  | 18.0374 | 18.2259   |
-| 2.8968        | 7.0   | 9107  | 2.5757          | 18.8335 | 10.2201 | 18.2386 | 18.4522   |
-| 2.8645        | 8.0   | 10408 | 2.5844          | 18.6058 | 10.0803 | 18.025  | 18.2237   |
 ### Framework versions

 This model is a fine-tuned version of [google/mt5-small](https://huggingface.co/google/mt5-small) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 2.5620
+- Rouge1: 19.3915
+- Rouge2: 10.59
+- Rougel: 18.7811
+- Rougelsum: 18.9784
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 5.6e-05
+- train_batch_size: 16
+- eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 ### Training results
+| Training Loss | Epoch | Step | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum |
+|:-------------:|:-----:|:----:|:---------------:|:-------:|:-------:|:-------:|:---------:|
+| 2.8704        | 1.0   | 651  | 2.5780          | 17.9954 | 9.8425  | 17.421  | 17.5202   |
+| 2.8213        | 2.0   | 1302 | 2.5719          | 18.3944 | 9.9329  | 17.8166 | 17.9457   |
+| 2.7672        | 3.0   | 1953 | 2.5643          | 17.4605 | 9.7057  | 16.9978 | 17.0939   |
+| 2.7311        | 4.0   | 2604 | 2.5633          | 19.5332 | 11.0145 | 19.0127 | 19.1008   |
+| 2.6985        | 5.0   | 3255 | 2.5672          | 19.3155 | 10.1678 | 18.6334 | 18.8022   |
+| 2.6644        | 6.0   | 3906 | 2.5589          | 19.3282 | 10.3801 | 18.8039 | 18.9073   |
+| 2.654         | 7.0   | 4557 | 2.5540          | 19.2307 | 10.4068 | 18.6708 | 18.896    |
+| 2.6318        | 8.0   | 5208 | 2.5620          | 19.3915 | 10.59   | 18.7811 | 18.9784   |
 ### Framework versions

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7ed3e89d4b71eb6211d1e7863bb78e4bdbc148e39d673093724969a32663c3e7
 size 1200773058

 version https://git-lfs.github.com/spec/v1
+oid sha256:89709a374e8be0aa8db7f248ea59287bd466ccc7d83aedc3247c698251384cbf
 size 1200773058

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8e01c3a8b8531b9b8d88db32d1c0aa12565acd99dcd8aa23652ce885aba3c696
 size 4664

 version https://git-lfs.github.com/spec/v1
+oid sha256:6660cd3ee1ac582921d1962547ada70f40849ec7bd803e0a3745527272b3e0ed
 size 4664