sarpba commited on
Commit
a76f6b2
·
verified ·
1 Parent(s): f1f3d55

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +4 -0
README.md CHANGED
@@ -15,6 +15,10 @@ model-index:
15
 
16
  <!-- This model card has been generated automatically according to the information the Trainer had access to. You
17
  should probably proofread and complete it, then remove this comment. -->
 
 
 
 
18
 
19
  # whisper-large-v3-turbo-finetuned-hu
20
 
 
15
 
16
  <!-- This model card has been generated automatically according to the information the Trainer had access to. You
17
  should probably proofread and complete it, then remove this comment. -->
18
+ # fontos információ, mielött használnád, tesztelnéd
19
+
20
+ Sajnos úgy tűnik, hogy a Ct2 kvantálás során valami elvész, elromlik a modellben, szinte használhatatlanná válik, az max output tokenek száma drasztikusan leesik, nagyon csonkolja a mondatokat. Még nem tudom hol a határ időben, token számban ahol eklezd csonkolni, de max 10 sec körül vagy inkább alatta.
21
+ Natív F32-ben szépen dolgozik ahogy a teszteredmények is mutatják, így viszont elveszti a sebességét, ami az értelme lenne. Lehet újra indítom a finomhangolást nativan Float16-on, hogy lássam azzal a modellel mi történik a kvantálás során. (Az original modell is Float16-ban van)
22
 
23
  # whisper-large-v3-turbo-finetuned-hu
24