ClearVoice-SR

Running on Zero

alibabasglab commited on 21 days ago

Commit

341eb54

verified ·

1 Parent(s): 9f61737

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,21 +6,22 @@ from clearvoice import ClearVoice
 import os
 @spaces.GPU
-def fn_clearvoice_sr(input_wav, sr):
-    if sr == "16000 Hz":
-        myClearVoice = ClearVoice(task='speech_enhancement', model_names=['FRCRN_SE_16K'])
-        fs = 16000
-    else:
-        myClearVoice = ClearVoice(task='speech_enhancement', model_names=['MossFormer2_SE_48K'])
-        fs = 48000
     output_wav_dict = myClearVoice(input_path=input_wav, online_write=False)
     if isinstance(output_wav_dict, dict):
         key = next(iter(output_wav_dict))
         output_wav = output_wav_dict[key]
     else:
         output_wav = output_wav_dict
-    sf.write('enhanced.wav', output_wav, fs)
-    return 'enhanced.wav'
 @spaces.GPU
 def fn_clearvoice_se(input_wav, sr):
@@ -86,7 +87,7 @@ sr_demo = gr.Interface(
     fn=fn_clearvoice_sr,
     inputs = [
         gr.Audio(label="Input Audio", type="filepath"),
-        gr.Checkbox(["Apply Enhancement"], label="Apply Speech Enhancement"),
     ],
     outputs = [
         gr.Audio(label="Output Audio", type="filepath"),

 import os
 @spaces.GPU
+def fn_clearvoice_sr(input_wav, apply_se):
+    myClearVoice = ClearVoice(task='speech_super_resolution', model_names=['MossFormer2_SR_48K'])
+    fs = 48000
+    if apply_se:
+        myClearVoice_se = ClearVoice(task='speech_enhancement', model_names=['MossFormer2_SE_48K'])
+        output_wav_dict = myClearVoice_se(input_path=input_wav, online_write=True, output_path='enhanced.wav')
+        input_wav = 'enhanced.wav'
     output_wav_dict = myClearVoice(input_path=input_wav, online_write=False)
     if isinstance(output_wav_dict, dict):
         key = next(iter(output_wav_dict))
         output_wav = output_wav_dict[key]
     else:
         output_wav = output_wav_dict
+    sf.write('enhanced_high_res.wav', output_wav, fs)
+    return 'enhanced_high_res.wav'
 @spaces.GPU
 def fn_clearvoice_se(input_wav, sr):
     fn=fn_clearvoice_sr,
     inputs = [
         gr.Audio(label="Input Audio", type="filepath"),
+        gr.Checkbox(["Apply Speech Enhancement"], label="Apply Speech Enhancement"),
     ],
     outputs = [
         gr.Audio(label="Output Audio", type="filepath"),