End of training

Browse files

Files changed (3) hide show

README.md +20 -16
generation_config.json +2 -3
runs/Dec15_03-14-32_mgrqu6ctr1702517804785-49zpx/events.out.tfevents.1702581278.mgrqu6ctr1702517804785-49zpx.249647.0 +2 -2

README.md CHANGED Viewed

@@ -1,6 +1,6 @@
 ---
-license: mit
-base_model: facebook/bart-large-xsum
 tags:
 - generated_from_trainer
 metrics:
@@ -15,14 +15,14 @@ should probably proofread and complete it, then remove this comment. -->
 # LLM_Teached_Bart
-This model is a fine-tuned version of [facebook/bart-large-xsum](https://huggingface.co/facebook/bart-large-xsum) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.7715
-- Rouge1: 0.4781
-- Rouge2: 0.2085
-- Rougel: 0.3718
-- Rougelsum: 0.372
-- Gen Len: 41.3245
 ## Model description
@@ -47,17 +47,21 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 4
 - mixed_precision_training: Native AMP
 ### Training results
-| Training Loss | Epoch | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | Gen Len |
-|:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:------:|:---------:|:-------:|
-| 1.6623        | 1.0   | 1250 | 1.6705          | 0.4681 | 0.2057 | 0.3632 | 0.3631    | 43.4718 |
-| 1.2986        | 2.0   | 2500 | 1.6330          | 0.476  | 0.2105 | 0.3732 | 0.3737    | 39.9745 |
-| 1.0401        | 3.0   | 3750 | 1.7081          | 0.4792 | 0.2134 | 0.3762 | 0.3763    | 40.6155 |
-| 0.8853        | 4.0   | 5000 | 1.7715          | 0.4781 | 0.2085 | 0.3718 | 0.372     | 41.3245 |
 ### Framework versions

 ---
+license: apache-2.0
+base_model: facebook/bart-large
 tags:
 - generated_from_trainer
 metrics:
 # LLM_Teached_Bart
+This model is a fine-tuned version of [facebook/bart-large](https://huggingface.co/facebook/bart-large) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.6728
+- Rouge1: 0.3966
+- Rouge2: 0.1905
+- Rougel: 0.3321
+- Rougelsum: 0.3322
+- Gen Len: 19.9855
 ## Model description
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 8
 - mixed_precision_training: Native AMP
 ### Training results
+| Training Loss | Epoch | Step  | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | Gen Len |
+|:-------------:|:-----:|:-----:|:---------------:|:------:|:------:|:------:|:---------:|:-------:|
+| 1.851         | 1.0   | 1250  | 1.6235          | 0.3808 | 0.1775 | 0.3177 | 0.318     | 19.9855 |
+| 1.5876        | 2.0   | 2500  | 1.5937          | 0.389  | 0.1866 | 0.3271 | 0.3274    | 19.9782 |
+| 1.3922        | 3.0   | 3750  | 1.5800          | 0.3899 | 0.182  | 0.3244 | 0.3246    | 19.9918 |
+| 1.2551        | 4.0   | 5000  | 1.6044          | 0.3852 | 0.1854 | 0.3223 | 0.3227    | 19.9982 |
+| 1.1329        | 5.0   | 6250  | 1.6191          | 0.3978 | 0.1923 | 0.3342 | 0.3344    | 19.9855 |
+| 1.042         | 6.0   | 7500  | 1.6453          | 0.3956 | 0.192  | 0.3333 | 0.3335    | 19.9864 |
+| 0.9665        | 7.0   | 8750  | 1.6554          | 0.3945 | 0.1898 | 0.331  | 0.3312    | 19.9909 |
+| 0.9206        | 8.0   | 10000 | 1.6728          | 0.3966 | 0.1905 | 0.3321 | 0.3322    | 19.9855 |
 ### Framework versions

generation_config.json CHANGED Viewed

@@ -3,11 +3,10 @@
   "decoder_start_token_id": 2,
   "early_stopping": true,
   "eos_token_id": 2,
   "forced_eos_token_id": 2,
-  "max_length": 62,
-  "min_length": 11,
   "no_repeat_ngram_size": 3,
-  "num_beams": 6,
   "pad_token_id": 1,
   "transformers_version": "4.36.0"
 }

   "decoder_start_token_id": 2,
   "early_stopping": true,
   "eos_token_id": 2,
+  "forced_bos_token_id": 0,
   "forced_eos_token_id": 2,
   "no_repeat_ngram_size": 3,
+  "num_beams": 4,
   "pad_token_id": 1,
   "transformers_version": "4.36.0"
 }

runs/Dec15_03-14-32_mgrqu6ctr1702517804785-49zpx/events.out.tfevents.1702581278.mgrqu6ctr1702517804785-49zpx.249647.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9ad506ef3ee0140b0d2805b9e1f093b81baec882eac59519f752c26adcb82d78
-size 12319

 version https://git-lfs.github.com/spec/v1
+oid sha256:d6d742b43555c1c463fa8a7e083da50656b799bbab21cb9a5bf1fbb0021ae116
+size 13198