Finetuning F5-Spanish

#14

by Ehele - opened 20 days ago

20 days ago

Hola, estoy interesado en hacer Finetuning del modelo F5-Spanish con una voz particular.
Mi dataset es de aproximadamente 9 horas de audio.
Estoy usando la interface gradio que viene en el repositorio original de F5-TTS.
Mi pregunta es si es posible usar el checkpoint en español "model_last.pt" de este repo y cómo.
Te agradezco mucho por hacer público tu excelente modelo y de antemano agradezco mucho tu atención.

jpgallegoar

Owner 17 days ago

Buenas tardes, debes modificar el código para forzar que se cargue ese y utilice ese modelo. Igualmente te recomiendo entrenar sobre el "model_1200000.safetensors" puesto que el modelo "model_last.pt" tiene información de step_count que te complicará a la hora de entrenar.

wqewqz

10 days ago

cual es la diferencia entre el mode_last.pt ? que con el normal al momento de realizar la sintensis

jpgallegoar

Owner 10 days ago

•

edited 10 days ago

Para inferencia y entrenamiento es lo mismo, la única diferencia es que model_last tiene algunos metadatos pero realmente no hay ninguna razon para utilizarlo solo lo he incluido por si alguien lo quisiera

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment