Finetuning F5-Spanish

#14
by Ehele - opened

Hola, estoy interesado en hacer Finetuning del modelo F5-Spanish con una voz particular.
Mi dataset es de aproximadamente 9 horas de audio.
Estoy usando la interface gradio que viene en el repositorio original de F5-TTS.
Mi pregunta es si es posible usar el checkpoint en español "model_last.pt" de este repo y cómo.
Te agradezco mucho por hacer público tu excelente modelo y de antemano agradezco mucho tu atención.

Buenas tardes, debes modificar el código para forzar que se cargue ese y utilice ese modelo. Igualmente te recomiendo entrenar sobre el "model_1200000.safetensors" puesto que el modelo "model_last.pt" tiene información de step_count que te complicará a la hora de entrenar.

cual es la diferencia entre el mode_last.pt ? que con el normal al momento de realizar la sintensis

Para inferencia y entrenamiento es lo mismo, la única diferencia es que model_last tiene algunos metadatos pero realmente no hay ninguna razon para utilizarlo solo lo he incluido por si alguien lo quisiera

Sign up or log in to comment