navjordj
/

t5-large-snl

+{
+    "eval_gen_len": 41.562881562881564,
+    "eval_loss": 1.869093418121338,
+    "eval_rouge1": 35.1506,
+    "eval_rouge2": 16.0888,
+    "eval_rougeL": 29.7007,
+    "eval_rougeLsum": 32.4251,
+    "eval_runtime": 261.235,
+    "eval_samples": 819,
+    "eval_samples_per_second": 3.135,
+    "eval_steps_per_second": 0.199,
+    "predict_gen_len": 41.73230769230769,
+    "predict_loss": 1.8758330345153809,
+    "predict_rouge1": 35.1974,
+    "predict_rouge2": 16.4972,
+    "predict_rougeL": 30.2616,
+    "predict_rougeLsum": 32.5539,
+    "predict_runtime": 419.3492,
+    "predict_samples": 1300,
+    "predict_samples_per_second": 3.1,
+    "predict_steps_per_second": 0.196
+}

README.md ADDED Viewed

+---
+tags:
+- generated_from_trainer
+datasets:
+- navjordj/SNL_summarization
+model-index:
+- name: t5-large-snl-2
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# t5-large-snl-2
+This model is a fine-tuned version of [navjordj/t5-large-snl](https://huggingface.co/navjordj/t5-large-snl) on the navjordj/SNL_summarization dataset.
+It achieves the following results on the evaluation set:
+- eval_loss: 1.8691
+- eval_rouge1: 35.1506
+- eval_rouge2: 16.0888
+- eval_rougeL: 29.7007
+- eval_rougeLsum: 32.4251
+- eval_gen_len: 41.5629
+- eval_runtime: 261.235
+- eval_samples_per_second: 3.135
+- eval_steps_per_second: 0.199
+- step: 0
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 5e-05
+- train_batch_size: 16
+- eval_batch_size: 16
+- seed: 42
+- distributed_type: multi-GPU
+- gradient_accumulation_steps: 4
+- total_train_batch_size: 64
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 20.0
+### Framework versions
+- Transformers 4.27.0.dev0
+- Pytorch 1.13.1
+- Datasets 2.10.1
+- Tokenizers 0.13.2