my-great-gpt2-review-model-katie

Files changed (5) hide show

README.md CHANGED Viewed

@@ -1,6 +1,6 @@
 ---
-base_model: distilgpt2
 license: apache-2.0
 tags:
 - generated_from_trainer
 model-index:
@@ -13,14 +13,10 @@ should probably proofread and complete it, then remove this comment. -->
 # my-great-gpt2-review-model-katie
-This model is a fine-tuned version of [distilgpt2](https://huggingface.co/distilgpt2) on the None dataset.
 It achieves the following results on the evaluation set:
-- eval_loss: 3.5874
-- eval_model_preparation_time: 0.0022
-- eval_runtime: 0.643
-- eval_samples_per_second: 155.525
-- eval_steps_per_second: 20.218
-- step: 0
 ## Model description
@@ -47,9 +43,16 @@ The following hyperparameters were used during training:
 - lr_scheduler_type: linear
 - num_epochs: 0.3
 ### Framework versions
 - Transformers 4.44.0
 - Pytorch 2.3.1+cu121
-- Datasets 2.20.0
 - Tokenizers 0.19.1

 ---
 license: apache-2.0
+base_model: distilgpt2
 tags:
 - generated_from_trainer
 model-index:
 # my-great-gpt2-review-model-katie
+This model is a fine-tuned version of [distilgpt2](https://huggingface.co/distilgpt2) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 3.8380
+- Model Preparation Time: 0.0014
 ## Model description
 - lr_scheduler_type: linear
 - num_epochs: 0.3
+### Training results
+| Training Loss | Epoch  | Step | Validation Loss | Model Preparation Time |
+|:-------------:|:------:|:----:|:---------------:|:----------------------:|
+| 3.9332        | 0.3001 | 3045 | 3.8380          | 0.0014                 |
 ### Framework versions
 - Transformers 4.44.0
 - Pytorch 2.3.1+cu121
+- Datasets 2.21.0
 - Tokenizers 0.19.1

config.json CHANGED Viewed

@@ -7,6 +7,7 @@
   ],
   "attn_pdrop": 0.1,
   "bos_token_id": 50256,
   "embd_pdrop": 0.1,
   "eos_token_id": 50256,
   "id2label": {
@@ -17,6 +18,7 @@
     "LABEL_0": 0
   },
   "layer_norm_epsilon": 1e-05,
   "model_type": "gpt2",
   "n_ctx": 1024,
   "n_embd": 768,

   ],
   "attn_pdrop": 0.1,
   "bos_token_id": 50256,
+  "do_sample": true,
   "embd_pdrop": 0.1,
   "eos_token_id": 50256,
   "id2label": {
     "LABEL_0": 0
   },
   "layer_norm_epsilon": 1e-05,
+  "max_length": 50,
   "model_type": "gpt2",
   "n_ctx": 1024,
   "n_embd": 768,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:641228b64178c3de7788a3791682bf75bfe7c63e63d6c510dc8c8a16a8ae97d4
 size 327657928

 version https://git-lfs.github.com/spec/v1
+oid sha256:bd84a55c642eafd178eceb47d09a5319212fa86efb8fac9d39da924848ff0171
 size 327657928

runs/Aug15_03-47-55_4f4ba484ebe4/events.out.tfevents.1723693686.4f4ba484ebe4.3860.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:14e0f38133a99fb177998474e594692b10303eb7eb09b74abf883936cdb7abae
-size 6832

 version https://git-lfs.github.com/spec/v1
+oid sha256:60a924732b3cf560235faa09358a5d79e6c8d92ab95d6ed07712118cdb48d0e5
+size 7523

runs/Aug15_03-47-55_4f4ba484ebe4/events.out.tfevents.1723694281.4f4ba484ebe4.3860.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:6cc5934a2ab94062c916f04d33b03fdd4eca5f7db592e24fc60785c9a2a333ad
+size 425