End of training

Files changed (6) hide show

README.md CHANGED Viewed

@@ -13,7 +13,7 @@ should probably proofread and complete it, then remove this comment. -->
 # CS505_COQE_mt5-large_train_Instruction0_SOAPL_v1
-This model is a fine-tuned version of [google/mt5-large](https://huggingface.co/google/mt5-large) on the None dataset.
 ## Model description
@@ -33,8 +33,8 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0003
-- train_batch_size: 4
-- eval_batch_size: 32
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
@@ -47,7 +47,7 @@ The following hyperparameters were used during training:
 ### Framework versions
-- Transformers 4.39.3
-- Pytorch 2.1.2
-- Datasets 2.18.0
-- Tokenizers 0.15.2

 # CS505_COQE_mt5-large_train_Instruction0_SOAPL_v1
+This model is a fine-tuned version of [google/mt5-large](https://huggingface.co/google/mt5-large) on an unknown dataset.
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 0.0003
+- train_batch_size: 8
+- eval_batch_size: 64
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 ### Framework versions
+- Transformers 4.41.2
+- Pytorch 2.3.0+cu121
+- Datasets 2.20.0
+- Tokenizers 0.19.1

config.json CHANGED Viewed

@@ -27,7 +27,7 @@
   "tie_word_embeddings": false,
   "tokenizer_class": "T5Tokenizer",
   "torch_dtype": "float32",
-  "transformers_version": "4.39.3",
   "use_cache": false,
   "vocab_size": 250112
 }

   "tie_word_embeddings": false,
   "tokenizer_class": "T5Tokenizer",
   "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
   "use_cache": false,
   "vocab_size": 250112
 }

generation_config.json CHANGED Viewed

@@ -3,5 +3,5 @@
   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
-  "transformers_version": "4.39.3"
 }

   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
+  "transformers_version": "4.41.2"
 }

runs/Jul08_02-09-05_939c593de51a/events.out.tfevents.1720404546.939c593de51a.359.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:c1dd8a0e2205a9fff6eb3c0fa7a42a0f70a4fa3ccfa8da170994e0250ade3d0a
+size 5830

tokenizer.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f98311e7ec3777cc8fa54cae946bf0ef8da4f96f0419fb81c371a7c0296ed2ff
-size 16330827

 version https://git-lfs.github.com/spec/v1
+oid sha256:ddb1b00035edffde435e24e69011b7f552691405237455cb7c3a59c890682807
+size 16330540

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8c0efec0e00cdf5ae50d1cb2ed541bf4a16ff3f915c2b69c590a84f22dbd648b
-size 4984

 version https://git-lfs.github.com/spec/v1
+oid sha256:395b45722ca26edb5eb056389f7975174ca2e8a09a2df06d24e81fe6380d2fa7
+size 5176