Finetuning F5-Spanish
Hola, estoy interesado en hacer Finetuning del modelo F5-Spanish con una voz particular.
Mi dataset es de aproximadamente 9 horas de audio.
Estoy usando la interface gradio que viene en el repositorio original de F5-TTS.
Mi pregunta es si es posible usar el checkpoint en español "model_last.pt" de este repo y cómo.
Te agradezco mucho por hacer público tu excelente modelo y de antemano agradezco mucho tu atención.
Buenas tardes, debes modificar el código para forzar que se cargue ese y utilice ese modelo. Igualmente te recomiendo entrenar sobre el "model_1200000.safetensors" puesto que el modelo "model_last.pt" tiene información de step_count que te complicará a la hora de entrenar.
cual es la diferencia entre el mode_last.pt ? que con el normal al momento de realizar la sintensis
Para inferencia y entrenamiento es lo mismo, la única diferencia es que model_last tiene algunos metadatos pero realmente no hay ninguna razon para utilizarlo solo lo he incluido por si alguien lo quisiera