Model save

Browse files

Files changed (3) hide show

README.md +89 -0
model.safetensors +1 -1
runs/Dec29_05-04-54_srvrocgpu011.uct.ac.za/events.out.tfevents.1735441723.srvrocgpu011.uct.ac.za +2 -2

README.md ADDED Viewed

	@@ -0,0 +1,89 @@

+---
+library_name: transformers
+license: cc-by-nc-4.0
+base_model: facebook/mms-1b-all
+tags:
+- generated_from_trainer
+metrics:
+- wer
+model-index:
+- name: mms-1b-bigcgen-combined-25hrs-model
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# mms-1b-bigcgen-combined-25hrs-model
+This model is a fine-tuned version of [facebook/mms-1b-all](https://huggingface.co/facebook/mms-1b-all) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: inf
+- Wer: 0.5155
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 0.0003
+- train_batch_size: 4
+- eval_batch_size: 4
+- seed: 42
+- gradient_accumulation_steps: 2
+- total_train_batch_size: 8
+- optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
+- lr_scheduler_type: linear
+- lr_scheduler_warmup_steps: 100
+- training_steps: 2500
+- mixed_precision_training: Native AMP
+### Training results
+| Training Loss | Epoch  | Step | Validation Loss | Wer    |
+|:-------------:|:------:|:----:|:---------------:|:------:|
+| 14.5485       | 0.0611 | 100  | inf             | 1.0039 |
+| 6.1502        | 0.1222 | 200  | inf             | 1.0675 |
+| 5.1685        | 0.1833 | 300  | inf             | 1.0053 |
+| 2.0876        | 0.2443 | 400  | inf             | 0.5857 |
+| 1.7116        | 0.3054 | 500  | inf             | 0.5759 |
+| 1.6505        | 0.3665 | 600  | inf             | 0.5579 |
+| 1.6573        | 0.4276 | 700  | inf             | 0.5471 |
+| 1.4679        | 0.4887 | 800  | inf             | 0.5528 |
+| 1.4955        | 0.5498 | 900  | inf             | 0.5369 |
+| 1.664         | 0.6109 | 1000 | inf             | 0.5328 |
+| 1.61          | 0.6720 | 1100 | inf             | 0.5335 |
+| 1.6414        | 0.7330 | 1200 | inf             | 0.5293 |
+| 1.6321        | 0.7941 | 1300 | inf             | 0.5271 |
+| 1.4686        | 0.8552 | 1400 | inf             | 0.5297 |
+| 1.5073        | 0.9163 | 1500 | inf             | 0.5326 |
+| 1.6164        | 0.9774 | 1600 | inf             | 0.5235 |
+| 1.577         | 1.0385 | 1700 | inf             | 0.5238 |
+| 1.383         | 1.0996 | 1800 | inf             | 0.5217 |
+| 1.4391        | 1.1607 | 1900 | inf             | 0.5292 |
+| 1.5327        | 1.2217 | 2000 | inf             | 0.5255 |
+| 1.3653        | 1.2828 | 2100 | inf             | 0.5195 |
+| 1.4901        | 1.3439 | 2200 | inf             | 0.5187 |
+| 1.4263        | 1.4050 | 2300 | inf             | 0.5169 |
+| 1.4603        | 1.4661 | 2400 | inf             | 0.5179 |
+| 1.4802        | 1.5272 | 2500 | inf             | 0.5155 |
+### Framework versions
+- Transformers 4.47.1
+- Pytorch 2.5.1+cu124
+- Datasets 3.2.0
+- Tokenizers 0.21.0

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:62f3a82b36e99092da7c835ac6661678c809b3f59f5001e2c37a415472a85ce2
 size 3858885800

 version https://git-lfs.github.com/spec/v1
+oid sha256:cc6a7bd48bba45d5393ab23150b874fff57d9c61cbebf6653d8815a1ec5592e0
 size 3858885800

runs/Dec29_05-04-54_srvrocgpu011.uct.ac.za/events.out.tfevents.1735441723.srvrocgpu011.uct.ac.za CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:689f8199335d61c9697897549ee3cf89cb443375f460f30304d8fb08078a905a
-size 18947

 version https://git-lfs.github.com/spec/v1
+oid sha256:50051a186f171bf4f6beb40dd19e031ce1f02ed904fc2f8104ba97098fd56b20
+size 20148