hieunguyenminh
/

ttl-roleplay

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

hieunguyenminh commited on Dec 22, 2023

Commit

4f844e3

·

1 Parent(s): a1d8a2a

End of training

Files changed (1) hide show

README.md +8 -6

README.md CHANGED Viewed

@@ -1,8 +1,9 @@
 ---
 license: mit
-base_model: TheBloke/zephyr-7B-beta-GPTQ
 tags:
 - generated_from_trainer
 model-index:
 - name: ttl-roleplay
   results: []
@@ -33,12 +34,12 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0002
-- train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
-- training_steps: 5
 - mixed_precision_training: Native AMP
 ### Training results
@@ -47,7 +48,8 @@ The following hyperparameters were used during training:
 ### Framework versions
-- Transformers 4.35.2
-- Pytorch 2.1.0+cu121
 - Datasets 2.15.0
-- Tokenizers 0.15.0

 ---
 license: mit
+library_name: peft
 tags:
 - generated_from_trainer
+base_model: TheBloke/zephyr-7B-beta-GPTQ
 model-index:
 - name: ttl-roleplay
   results: []
 The following hyperparameters were used during training:
 - learning_rate: 0.0002
+- train_batch_size: 32
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
+- training_steps: 30
 - mixed_precision_training: Native AMP
 ### Training results
 ### Framework versions
+- PEFT 0.7.1
+- Transformers 4.36.2
+- Pytorch 2.1.0+cu118
 - Datasets 2.15.0
+- Tokenizers 0.15.0