bert-vits2-multi-voice

Sleeping

App Files Files Community

Ailyth commited on Oct 7, 2023

Commit

a3654b1

•

1 Parent(s): b31dbfa

Update app.py

Browse files

Files changed (1) hide show

app.py +11 -7

app.py CHANGED Viewed

@@ -15,10 +15,10 @@ import pytz
 net_g = None
 models = {
-    "Gladear": "./MODELS/adorabledarling.pth",
     "MistyNikki": "./MODELS/nikki9400.pth",
     "Silverleg": "./MODELS/J8900.pth",
-    "Takemura": "./MODELS/take2.pth",
     "LucidMoon": "./MODELS/lucid.pth",
     "Rrabbitt": "./MODELS/rabbit4900.pth",
     "VivaciousViolet": "./MODELS/vv.pth",
@@ -71,10 +71,14 @@ def infer(text, sdp_ratio, noise_scale, noise_scale_w, length_scale, sid, model_
         sf.write("tmp.wav", audio, 44100)
         return audio
-def convert_wav_to_mp3(wav_file):
     tz = pytz.timezone('Asia/Shanghai')
     now = datetime.now(tz).strftime('%m%d%H%M%S')
     os.makedirs('out', exist_ok=True)
     output_path_mp3 = os.path.join('out', f"{now}.mp3")
     renamed_input_path = os.path.join('in', f"in.wav")
@@ -88,7 +92,7 @@ def tts_generator(text, sdp_ratio, noise_scale, noise_scale_w, length_scale, mod
     global net_g,speakers
     model_path = models[model]
     net_g, _, _, _ = utils.load_checkpoint(model_path, net_g, None, skip_optimizer=True)
-    print(text)
     try:
         with torch.no_grad():
             audio = infer(text, sdp_ratio=sdp_ratio, noise_scale=noise_scale, noise_scale_w=noise_scale_w, length_scale=length_scale, sid=speaker,model_dir=model)
@@ -121,12 +125,12 @@ if __name__ == "__main__":
                 gr.Markdown('''
                 **测试用**\n
-                模型路径：\n
-                huggingface.co/spaces/Ailyth/Multi-voice-TTS/tree/main 的MODELS里面
                 ''')
                 text = gr.TextArea(label="输入需要生成语音的文字", placeholder="输入文字",
                                 value="在不在？能不能借给我三百块钱买可乐",
-                                info="使用huggingface的免费CPU进行推理，因此速度不快，一次性不要输入超过500汉字。字数越多，生成速度越慢，请耐心等待",
                                   )
                 model = gr.Radio(choices=list(models.keys()), value=list(models.keys())[0], label='音声模型')
                 with gr.Accordion(label="展开设置生成参数", open=False):

 net_g = None
 models = {
+    "Mellowdear": "./MODELS/adorabledarling.pth",
     "MistyNikki": "./MODELS/nikki9400.pth",
     "Silverleg": "./MODELS/J8900.pth",
+    "Umemura": "./MODELS/take2.pth",
     "LucidMoon": "./MODELS/lucid.pth",
     "Rrabbitt": "./MODELS/rabbit4900.pth",
     "VivaciousViolet": "./MODELS/vv.pth",
         sf.write("tmp.wav", audio, 44100)
         return audio
+def now():
     tz = pytz.timezone('Asia/Shanghai')
     now = datetime.now(tz).strftime('%m%d%H%M%S')
+    return now
+def convert_wav_to_mp3(wav_file):
     os.makedirs('out', exist_ok=True)
+    now=now()
     output_path_mp3 = os.path.join('out', f"{now}.mp3")
     renamed_input_path = os.path.join('in', f"in.wav")
     global net_g,speakers
     model_path = models[model]
     net_g, _, _, _ = utils.load_checkpoint(model_path, net_g, None, skip_optimizer=True)
+    print(now()+text)
     try:
         with torch.no_grad():
             audio = infer(text, sdp_ratio=sdp_ratio, noise_scale=noise_scale, noise_scale_w=noise_scale_w, length_scale=length_scale, sid=speaker,model_dir=model)
                 gr.Markdown('''
                 **测试用**\n
+                项目文件：\n
+                huggingface.co/spaces/Ailyth/Multi-voice-TTS/tree/main
                 ''')
                 text = gr.TextArea(label="输入需要生成语音的文字", placeholder="输入文字",
                                 value="在不在？能不能借给我三百块钱买可乐",
+                                info="使用huggingface的免费CPU进行推理，因此速度不快，一次性不要输入超过500汉字。字数越多，生成速度越慢，请耐心等待，只会说中文。",
                                   )
                 model = gr.Radio(choices=list(models.keys()), value=list(models.keys())[0], label='音声模型')
                 with gr.Accordion(label="展开设置生成参数", open=False):