Update README.md
Browse files
README.md
CHANGED
@@ -15,6 +15,10 @@ model-index:
|
|
15 |
|
16 |
<!-- This model card has been generated automatically according to the information the Trainer had access to. You
|
17 |
should probably proofread and complete it, then remove this comment. -->
|
|
|
|
|
|
|
|
|
18 |
|
19 |
# whisper-large-v3-turbo-finetuned-hu
|
20 |
|
|
|
15 |
|
16 |
<!-- This model card has been generated automatically according to the information the Trainer had access to. You
|
17 |
should probably proofread and complete it, then remove this comment. -->
|
18 |
+
# fontos információ, mielött használnád, tesztelnéd
|
19 |
+
|
20 |
+
Sajnos úgy tűnik, hogy a Ct2 kvantálás során valami elvész, elromlik a modellben, szinte használhatatlanná válik, az max output tokenek száma drasztikusan leesik, nagyon csonkolja a mondatokat. Még nem tudom hol a határ időben, token számban ahol eklezd csonkolni, de max 10 sec körül vagy inkább alatta.
|
21 |
+
Natív F32-ben szépen dolgozik ahogy a teszteredmények is mutatják, így viszont elveszti a sebességét, ami az értelme lenne. Lehet újra indítom a finomhangolást nativan Float16-on, hogy lássam azzal a modellel mi történik a kvantálás során. (Az original modell is Float16-ban van)
|
22 |
|
23 |
# whisper-large-v3-turbo-finetuned-hu
|
24 |
|