Spaces:

Delik
/

pyannote-speaker-diarization-3.1

Running on Zero

Delik commited on May 3

Commit

ce1f6bf

•

1 Parent(s): 090acab

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -14,7 +14,7 @@ except Exception as e:
     pipeline = None
 @spaces.GPU
-def process_audio(audio):
     if pipeline is None:
         return "Error: Pipeline not initialized"
@@ -28,7 +28,15 @@ def process_audio(audio):
     # Use the diarization pipeline to process the audio
     try:
-        diarization = pipeline("temp.wav")
     except Exception as e:
         return f"Error processing audio: {e}"
@@ -40,9 +48,12 @@ def process_audio(audio):
 with gr.Blocks() as demo:
     audio_input = gr.Audio(type="filepath", label="Upload Audio")
     process_button = gr.Button("Process")
     diarization_output = gr.Textbox(label="Diarization Output")
-    process_button.click(fn=process_audio, inputs=audio_input, outputs=diarization_output)
 demo.launch()

     pipeline = None
 @spaces.GPU
+def process_audio(audio, num_speakers, min_speakers, max_speakers):
     if pipeline is None:
         return "Error: Pipeline not initialized"
     # Use the diarization pipeline to process the audio
     try:
+        params = {}
+        if num_speakers > 0:
+            params["num_speakers"] = num_speakers
+        if min_speakers > 0:
+            params["min_speakers"] = min_speakers
+        if max_speakers > 0:
+            params["max_speakers"] = max_speakers
+        diarization = pipeline("temp.wav", **params)
     except Exception as e:
         return f"Error processing audio: {e}"
 with gr.Blocks() as demo:
     audio_input = gr.Audio(type="filepath", label="Upload Audio")
+    num_speakers_input = gr.Number(label="Number of Speakers", value=0)
+    min_speakers_input = gr.Number(label="Minimum Number of Speakers", value=0)
+    max_speakers_input = gr.Number(label="Maximum Number of Speakers", value=0)
     process_button = gr.Button("Process")
     diarization_output = gr.Textbox(label="Diarization Output")
+    process_button.click(fn=process_audio, inputs=[audio_input, num_speakers_input, min_speakers_input, max_speakers_input], outputs=diarization_output)
 demo.launch()