Spaces:

riabayonaor
/

ConvertidorVoz

Runtime error

riabayonaor commited on Jun 26

Commit

9100ef3

•

1 Parent(s): 59898ad

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,35 +1,31 @@
 import gradio as gr
-from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
-import torch
-import scipy.io.wavfile
-import numpy as np
-def text_to_speech(text):
-    # Cargar el modelo y el tokenizador
-    model_name = "facebook/tts_transformer-es-css10"
-    processor = AutoTokenizer.from_pretrained(model_name)
-    model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
-    inputs = processor(text, return_tensors="pt")
-    with torch.no_grad():
-        generated_ids = model.generate(inputs.input_ids)
-    generated_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
-    # Aquí podrías generar un archivo de audio a partir del texto generado si tuvieras una función para ello
-    output_path = "/tmp/output.txt"
-    with open(output_path, "w") as f:
-        f.write(generated_text)
-    return output_path, output_path
-# Crear la interfaz de Gradio
-iface = gr.Interface(
-    fn=text_to_speech,
-    inputs="text",
-    outputs=[gr.Textbox(), gr.File()],
-    title="Spanish Text-to-Speech",
-    description="Convert text to speech in Spanish using the facebook/tts_transformer-es-css10 model."
-)
-iface.launch()

 import gradio as gr
+from tts import synthesize, TTS_LANGUAGES
+import base64
+# Definir la función de síntesis
+def synthesize_audio(text, speed, language):
+    return synthesize(text, speed, language)
+# Crear la interfaz con Gradio
+with gr.Blocks() as demo:
+    gr.Markdown(
+        """
+        <center>
+        <h1>Uso de AI para la generación de audio a partir de texto.</h1>
+        <h3>Con este espacio podrás producir audio que lee el texto de entrada. Podrás ajustar la velocidad con la que habla el modelo.</h3>
+        </center>
+        """
+    )
+    with gr.Row():
+        with gr.Column():
+            leng = gr.Radio(choices=["spa","eng"], value="spa", label="Selecciona un idioma entre Inglés (eng) y Español (spa)")
+            textbox = gr.Textbox(label="Ingrese texto")
+            slider = gr.Slider(minimum=0.1, maximum=4.0, value=1.0, step=0.1, label="Velocidad de voz")
+            button = gr.Button("Hablar")
+        with gr.Column():
+            audio_output = gr.Audio()
+            file_output = gr.File(label="Descargar audio")
+        button.click(synthesize_audio, [textbox, slider, leng], [audio_output, file_output])
+demo.launch()