Spaces for Audio / Voices

John6666 's Collections

Papers

Spaces for Games / Entertainments

Spaces for Tagger / Captioner / Prompter

Spaces for Text-to-images (SDXL, Pony, SD1.5, Flux,...)

Spaces for Audio / Voices

Spaces for Generative-AI Chats

Resources for Tagging / Captioning / Prompting / LLM

My Bookmarks

Spaces for Image Upscaler / Upsampler / Resizer

LoRAs / Models (SDXL1.0, Pony, SD1.5, Flux, ...)

Spaces for Model / Space / useful Utilities in Hugging Face

Resources for Sound Processing

Spaces for LLM / VLM / NLP

Spaces for Image-to-Image / Video

日本語スペース (Spaces in Japanese language)

Gradio Themes

updated 2 days ago

Upvote

Running on Zero

374

🚀

AICoverGen
Running on Zero

12

👅🎙️🥰

SBV2 Chupa Demo
Running

3

😊🎙️📖

VisualNovel_sbv_demo
Running on CPU Upgrade

615

😊🎙️

Moe TTS
Running

6

🏺

Bert-VITS2 AI Abe&Suga&Kishida
Running

38

🚀

AICoverGen
Build error

13

:🎤

rvc-Blue-archives-hoyogames
Running

41

▶️🎤

VTuber RVC Models
Running

352

👀

RVC Inference HF
Running on Zero

235

🏃

Audio🔹Separator

Vocal and background audio separator
Running

43

📉

BlueArchiveTTS
Running

141

😆🌖😀

Multi Voice TTS(English/Chinese/Japanese)

[中文/English/日本語]multilingual text-to-speech
Running on Zero

393

🔥

Stable Audio Open Zero
Running

148

🍏

Applio

A simple, high-quality voice conversion tool
Running on Zero

1.7k

🗣️

Voice Clone
Running on Zero

159

⚡

RVC⚡ZERO

Voice conversion framework based on VITS
Running

7

🎙🐴

Multilingual Anime TTS
Runtime error

1

🎶

DiffSinger🎶 Diffusion for Singing Voice Synthesis
Running

134

🎵

Ultimate Vocal Remover WebUI
Running

240

🍏😺

Aesthetic RVC Inference HF
Running

70

⚡

Advanced RVC Inference
Running

783

🏃

Vits Models
Running

504

🎙🐴

Multilingual Anime TTS
Running

32

⚡

LoveLive-ShojoKageki VITS
Running

363

🐨

vits-uma-genshin-honkai
Running

3

🏺

おしゃべり晋さんメーカー（Style-Bert-VITS2）
Running

12

😊▶️

Hololive Style-Bert-VITS2
Running on Zero

478

🎼🎶

Midi Music Generator
Running

22

🎼

Japanese Lyric Generator
Running on L4

355

🎙

VALL E X
Running

2

🔥

AI晋さんメーカー
Running

9

📉

BangDream-ShojoKageki Bert VITS2
Running

3

📈

lovelive-ShojoKageki VITS JPZH
Running

17

🌖

Lovelive-nijigasaki-MB-iSTFT-VITS-ZH&JP
Running on T4

2.14k

🐶

Bark
Running

1.02k

🤗

OpenVoice
Running

279

🤗

OpenVoiceV2
Runtime error

60

🐠

ChatTTS OpenVoice
Running on T4

180

🌍🦜

MassivelyMultilingualTTS
Running on T4

2.31k

🐸

XTTS
Running on A10G

4.73k

🎵

MusicGen
Runtime error

517

📞

Seamless M4T v2
Runtime error

60

📉

Mars5 Space
Sleeping

11

🎙️💾🔄🗣️

FAcodecV2
Runtime error

240

👋

TTS x Hallo Talking Portrait

Generate Talking avatars from Text-to-Speech
Running on CPU Upgrade

394

🎤

RVC Genshin Impact
Running on Zero

92

📚

FoleyCrafter
Running

217

🏃

Voice Clone Multilingual

Languages ru,en,zh-cn,ja,de,fr,it,pt,pl,tr,ko,nl,cs,ar,es,hu
Running on Zero

14

🐨

Talkalkai Cover
Running on Zero

467

🎺

Image to Music v2

Get a music sample inspired by the mood of an image
Running

192

🕒

Whisper Timestamped

In-browser speech recognition w/ word-level timestamps
Running on CPU Upgrade

620

🏆

TTS Arena

Vote on the latest TTS models!
Running

20

🥇

TTSDS Benchmark and Leaderboard

Text-To-Speech (TTS) Evaluation using objective metrics.
Runtime error

6

🐨

LAKH MIDI Dataset Search

Search and explore LAKH MIDI dataset with MidiCaps
Running on Zero

24

📈

PicoAudio
Running

15

🏆

Advanced MIDI Search

Search and explore 179k+ MIDI titles
Running on Zero

80

🐠

SenseVoice
Running

230

🗣️

Whisper Speaker Diarization
Running

244

🚀

Faster Whisper Webui
Running on Zero

34

🎤

Vocal Separation SOTA
Running

95

🐠

BangDream-ShojoKageki Bert VITS2
Running

2

🐠

BangDream-ShojoKageki Api
Running

15

🐠

BangDream-ShojoKageki Bert VITS2
Running

13

🔊

Efficient Audio Captioning
Running on Zero

174

🏃

NaturalSpeech3 FACodec
Running

264

🌍

tts Text To Speech
Sleeping

4

🌍

Edge Tts
Runtime error

14

🏆

JA TTS Arena

Vote on the top Japanese TTS models!
Running

10

⚡

MIKU TTS
Running

10

🎮️🎹

Genshin music generation

Genshin Impact Game Style Music Generator
Sleeping

3

⚡

Advanced RVC Inference
Sleeping

🐠

Style Bert VITS2 MT
Paused

3

🎙️

ZeroRVC
Running

13

👁

Edge TTS w/ More Options
Runtime error

33

⚡

EZ Voice Clone
Running

3

⚡

Training Helper Rvc

easy training helper For RVC
Running on Zero

20

🚀

Anitalker
Running

7

:🎤

rvc-Blue-archives
Running on T4

75

🌊

Fish Diffusion (HiFiSinger) Demo
Running

15

🥰

Japanese Ero Voice Classifier
Running

29

😊🎙️📖

Style Bert VITS2 Editor Demo
Running on L4

433

🏆

Fish Speech 1
Running

1

⚡

Rvc Demo

A demo of RVC pip
Running

103

🐶

Bark Voice Cloning
Sleeping

1

🐸

NeonAI Coqui AI TTS Plugin
Running

105

🐸

NeonAI Coqui AI TTS Plugin
Running

151

🌍

Qwen2 Audio Instruct Demo
Runtime error

12

🔥

AICoverGen
Running

11

🔥

Harmonic Melody MIDI Mixer

Harmonize and mix any MIDI melody
Running

30

🎵

Ilaria Audio Analyzer
Running on Zero

729

😻

Ilaria RVC
Running

4

🚀 🗿

MDX UVR
Running on Zero

115

🤗

GPT SoVITS V2
Running

7

🗣️

Read My Pdf Outloud
Running

6

⚡

Vocal Remover
Running on Zero

790

🥖

Parler-TTS

High-fidelity Text-To-Speech
Runtime error

3

🥰

Japanese Ero Voice Classifier
Running

3

🐠

GPT-SoVITS-ToneControl_test
Running

20

📊

Umamusume Bert Vits2
Running

1

📈

Animalese Py
Running

2

🔶

Animalese RVC
Build error

4

📊

AI Hanser
Running on Zero

159

💻

Stable Audio Live Multiplayer
Running

547

👁

Edge TTS Text To Speech
Running

15

🐨

Youtube AI Summarizer
Running

4

🚀

AICoverGen
Running

1

💻

Animalese Js
Sleeping

1

💬

ASR Model Comparison
Running

4

🔥

AICoverGenMod
Running

1

🔨

Ilaria Converter
Running

1

👁

RVC UI TES
Build error

8

🎤

RVC Genshin Impact
Running

1

🦀

Voice2VoiceChatbot
Running

🌖

RealTimeVoicetoVoiceChatbot
sp-uhh/speech-enhancement-sgmse

Audio-to-Audio • Updated 2 days ago • 12 • 9
Running

2

🏃

RVC UI

An easy-to-use voice conversion framework based on VITS.
Sleeping

🏃

RVC
Running

🌍

AI Voice Assistance
Running on Zero

2

🗣️

Voice Clone
Sleeping

5

🌍

Optimus
Running

40

👀

Doc To Dialogue

Transform a report or document into an interview/discussion
Running

49

⚡

Voicee

Super fastest Voice Assistant
Running

6

🐟

Fish Audio API Demo
Running on Zero

65

👁

Musicgen Songstarter Demo
Running

81

▶️🐻💿

Hololive Rvc Models V2
Running

25

🎹

Advanced MIDI Renderer

Transform and render any MIDI
Sleeping

3

🚀

Imagen POP Music Medley Diffusion Transformer

Generate POP music medley with Imagen diffusion transformer
Running

2

🔥

Ultimate MIDI Classifier

Classify absolutely any MIDI by genre, song and artist
Running on Zero

4

📚

Intelligent MIDI Comparator

Intelligently compare any pair of MIDIs
Running

92

🌍

ChatTTS Speaker
Sleeping

2

🌖

Bridge Music Transformer

Generate a seamless bridge between two composition parts
Running

58

👀

vits-simple-api
Running

11

🎙️

Bert VITS Umamusume Genshin HonkaiSR
Running on Zero

41

🔊⏫

Audio SR

Fixed fork of the original audio sr!
Running on Zero

193

🎤🔄

Seed Voice Conversion
Running

40

⚡

Mini Omni
Sleeping

4

⚡

Monophonic MIDI Melody Harmonizer

Retrieval augmented harmonization of any MIDI melody
Running

10

⚡

MIDI Melody

Add a unique melody to any MIDI file
Sleeping

3

🔥

MIDI Chords Mixer

Mix chords from one MIDI to another MIDI
Running

2

🏆

Morse To Audio
Sleeping

1

🚀

RCV EASY GUI
Running

1

⚡

Advanced RVC Inference
Running

3

⚡

Lyricsgenius

Get Lyrics from Genius's Link
Running

1

👁

Groq Gradio Voice Assistant
Sleeping

2

🐠

Hex Separator
Running

3

🐠

Groq API Models

Groq API Playground
Running

17

👁

GPT-SoVITS-V2-NIIMI SORA
Paused

2

🎵

AI Tube Engine MusicGen
Paused

1

🎵

AI Tube Engine MusicGen
Paused

1

🎵

AI Tube Engine MusicGen
Paused

5

🎵

AI Tube Engine MusicGen
Build error

17

📚

GPT-SoVITS-V2-Gakuen Idolmaster
Running on Zero

8

🌖

UTMOSv2
Running

5

⚡

Mini Omni
Build error

10

👁

GPT-SoVITS-V2-misc_models
Configuration error

12

📊

Bench.audio

LMSYS bench for audio agents
Runtime error

78

🌟

Compressed Wav2Lip
Running

84

👄

Gradio Lipsync Wav2lip
Running on Zero

8

🐨

EchoMimic
Running

24

🌍

Wav2lip Gpu
Running

1

🏃

Matcha TTS Japanese

Description of Matcha TTS Japanese
Running

93

💩

DeepFilterNet2
Running on Zero

12

🇫🇷🥖

French Parler-TTS

High-fidelity Text-To-Speech
Running on Zero

260

🟣

EzAudio
Running on Zero

15

🔥

Kotoba Whisper Demo
Running

1

🦀

Matcha Tts Onnx Benchmarks

Benchmark load model and tts time
Runtime error

7

⚡

Mini Omni
Sleeping

2

🐠

AIChat-matcha-tts-onnx-en

Give your space a voice! (Demo)
Running on Zero

14

🌍

GAMA
Running on Zero

4

🏆

GAMA-IT
Sleeping

1

🦀

Sbv2 Py
Running on Zero

216

🎶

OpenMusic
Running

80

🎙️

PodcastGen

Generate a 2-speaker podcast from text input or documents!
Running

3

🐠

Mistral 7B Instruct v0.3 Matcha-TTS English

Enjoy TTS Chat
Sleeping

2

💨

Moshi
Running on Zero

47

🟣

EzAudio ControlNet
Sleeping

3

🐟

Fish Audio API Demo
Runtime error

1

🐠

Whisper En Tiny
Sleeping

7

🏃

Guided Rock Music Transformer

Controlled source augmented rock music transformer
Running on Zero

22

🎷

Long-form MusicGen

Long-form Musicgen
Running

82

💻

Multilingual TTS
Running

4

🔥

AI岸田文雄メーカー
Running

1

🔥

AI菅義偉メーカー
Running

1

😻

Audio Mouth
Running

392

📚

Pdf2audio
Running on CPU Upgrade

607

🏆

Open ASR Leaderboard
Running on T4

1.04k

🎙️

Open NotebookLM

Personalised Podcasts For All - Available in 13 Languages
Running on Zero

4

🔥

Kotoba Whisper Bilingual Demo
Running on T4

420

🗣️

MeloTTS

Fast, efficient, & multilingual text-to-speech
Running on T4

190

🐤

Canary 1b
Running

1

😻

Style Bert VITS2 SW
Runtime error

21

👁

Llama 3.2 3b Voice
Running

1

📚

Pdf2audio
Running on Zero

758

🤯

Whisper Turbo
Running on Zero

285

🤯

Realtime Whisper Turbo

Realtime implementation of Whisper large turbo
Running

143

🚀

Whisper Large V3 Turbo WebGPU

ML-powered speech recognition directly in your browser
Running on T4

265

🐢

Tortoise Tts

ExpressivText-to-Speech
Running

32

💻

Russian Text To Speech
Running

5

📉

Yt-dlp Wav
Running on T4

286

🎼

UnlimitedMusicGen

unlimited Audio generation with a few added features
Runtime error

84

🎶

AudioCraft Plus v2.0.0a (MusicGen + AudioGen)
Runtime error

22

🎼

MusicGen+ V1.2.7 (HuggingFace Version)
Running on Zero

61

🏢

VoiceRestore
Sleeping

3

⚡

Whisperturbo

whisper3 turbo
Running

35

🎙️

GPT-SoVITS-3s-cloning-free-TTS
Running

4

🏺

おしゃべり石破茂メーカー（Style-Bert-VITS2）
Running

1

🏺

おしゃべり二階俊博メーカー
Runtime error

3

🐠

Text To Meow
Running

4

🔥

Rvc Ui
Running

26

🌍

Reverb ASR Demo
Running

2

😻

Ilaria RVC Mod
Running on T4

311

🚀

Resemble Enhance
Running

2

💻

Openai Whisper Large V3 Turbo
Running

46

💻

RVC PlayGround
Running

56

🚀

Podcastfy.ai - An Open Source alternative to NotebookLM's podcast feature
Running on Zero

70

🎞️🎺

Video to Music

Generate and apply matching music background to video shot
Running

179

👂🎞️

Video SoundFX

Generates a sound effect that matches video shot
Paused

171

👂

Image2SFX Comparison

Generates audio environment from an image
Running on Zero

192

🍏

Applio
Running on Zero

1.79k

🗣️

F5-TTS

F5-TTS & E2-TTS: Zero-Shot Voice Cloning (Unofficial Demo)
Sleeping

1

💜

Heartbeat
Running on Zero

281

🤗🏆

TTS Spaces Arena

Blind vote on HF TTS models!
Running on CPU Upgrade

68

🧝‍♀️🧛‍♂️🧚‍♀️

xVASynth TTS

CPU powered, low RTF, emotional, multilingual TTS
Running

289

🎶

— AI Jukebox —

Generate music powered by AI
Running on L40S

333

🐠

TANGO

Co-Speech Gesture Video Generation
Running on Zero

14

🥰🎤📝

Anime Whisper Demo
Running on Zero

63

🏢

Ichigo Llama3.1 S Instruct
Running

8

🚀

Whisper Japanese Phone Demo

Whisper model to transcript japanese audio to katakana.
Running on Zero

175

📈

ClearerVoice-Studio (Speech Enhancement, Separation and Extraction)

Better AI powered platform to purify your speech signal
Running

20

♫🔒

Steganography

Text | Image | Audio | Video to Spectrogram || Steganography
Running

15

🔥

AICoverGenMod
Running

13

🚀

UVR5 UI
Sleeping

16

🗣️

Diva Realtime Chat
Running on Zero

2

👁

Kotoba Whisper Diarization Demo
Running on Zero

11

📚

Synthio Stable Audio Open

Stable audio open model from Synthio paper.
Sleeping

1

🚀

RYO EVC
Runtime error

1

😻

UVR
Running on Zero

35

🌒

Moonshine ASR

Fast & efficient ASR outperforming Whisper!
Running

23

🔊

seewav-gui
Running on Zero

72

🎵

RWKV Music

Generate MIDI music using RWKV v4!
Running

4

💻

MP3 Transcribe

Whisper Transcribe MP3 files, use a GPU to convert faster!
Running on Zero

7

🗣️0️⃣

StyleTTS 2 Zero

Efficient, fast, and natural text to speech with StyleTTS 2!
Running on Zero

249

😻

MaskGCT TTS Demo

MaskGCT TTS Demo
Running on Zero

70

🎵

MelodyFlow
Running on Zero

580

🤫

Whisper Large V3
Sleeping

6

🚀

Ultimate Chords Progressions Transformer

Self-correcting multi-instrumental chords transformer
Runtime error

8

🎶♫

Chords Progressions Transformer

Chords-conditioned music transformer
Running on Zero

25

⚡

Fast Whisper Turbo

Ultra-fast Whisper Turbo inference ⚡
Running on A10G

298

🔊

AudioLDM2 Text2Audio Text2Music Generation
Running

3

🗣️👂

Hey Buddy!

In-Browser Audio Wake-Word Spotting
Sleeping

3

🎹

Streamlit Pianoroll

Streamlit pianoroll playback element
Running

9

⚡

Audio-Separator

Audio-Separator by Politrees
Running on Zero

99

🚀

Giant Music Transformer

Fast multi-instrumental music transformer
Sleeping

23

🌖

Omni Mini (WebRTC)
Sleeping

5

🎹

Fortepyan Datasets

Streamlit browser for piano music datasets.
Running

4

🎹

PIANO Dataset

Demo of masking tasks from the PIANO dataset
Running on L40S

135

💬

Fish Agent

An end-to-end (e2e) Voice Language Model by Fish Audio.
Running

7

🎵

Audio to Stems to MIDI Converter
Running

27

🌍

Podcast Generation

Generate podcasts with AI avatars
Running

🐠

ChatTTS OpenVoice
Sleeping

1

📚

OpenVoice
Running on Zero

9

🗣️

F5-TTS

F5-TTS & E2-TTS: Zero-Shot Voice Cloning (Unofficial Demo)
Running

317

📊

Bark with Voice Cloning
Running on Zero

9

🎼🎶

Midi Music Generator
Running

4

🎵

Audio Lyrics Extractor
Running

10

🤔

Did StyleTTS 2 Generate It?

Did StyleTTS 2 generate that audio?!?
Paused

35

🌍

Hertz Dev

base model for mono-channel completion
Running on Zero

10

⚡

Xtts
Running on Zero

236

💬

ChatTTS Forge
Running on Zero

1.87k

❤️

Kokoro TTS

Upgraded to v1.0!
Running

6

🌖

Pipertts
Running

56

🎧

Nexa Omni Demo
Running on Zero

13

😻

MaskGCT TTS Demo

MaskGCT TTS Demo
Sleeping

20

📚

Video2music
Runtime error

798

🔊

Audioldm Text To Audio Generation
Running

2

🦀

So VITS SVC
Sleeping

2

👀

GPT SoVITS
Running on Zero

320

🗣️

Spanish F5

Spanish finetune for the original F5 model.
Sleeping

2

🎤⚡🎤

Dolce SVC
Sleeping

2

🎤🦊

Dolce TTS
Running

1

⚡

Lipsync
Sleeping

5

☕🐰🎤

Chino TTS
Running

2

🐨

Style Bert VITS2 NO
Running

1

📉

Style Bert VITS2 SU

シャルティアのAI音声合成モデルを作りました。
Sleeping

1

🔥

Style Bert VITS2 MHY

早乙女乱馬（女）のAI音声合成モデルを作りました。
Sleeping

1

🚀

Style Bert VITS2 SAR

ベアトリスのAI音声合成モデルを作りました。
Running on L4

38

⚡

Talk To Ultravox

Talk to Fixie.ai's Ultravox with WebRTC ⚡️
Running

2

🏃

SoundOfWater

Estimate physical properties merely from pouring sound!
Running

9

🐢

Llama Code Editor

Create interactive HTML web pages with your voice
Running on CPU Upgrade

31

🐨

sutra-avatar-v2
Sleeping

1

🌍

Audio Transcriber

Record an audio, then use AI to transcribe and translate it.
Running on Zero

18

🖌️🎶

Inpaint Music Transformer

Large and fast music transformer for pitches inpainting
Running

53

🐠

OuteTTS 0.2 500M Demo
Running

20

🌖

Tsukasa 司 Speech
Running

8

🎵

MusicGen Continuation
Running

5

🚀

Semanticodec Ultra Low Bitrate Audio Codec

Ultra-low bitrate neural audio codec (0.31~1.40 kbps) with a
Running

20

📚

Audiosr Versatile Audio Super Resolution

Versatile audio super resolution (any -> 48kHz) with AudioSR
Running on Zero

2

🐠

OuteTTS 0.2 500M Demo GPU
Running

2

💬

ChatTTS Forge English interface

TTS tool
Running

1

📚

Style Bert VITS2 RU2

short_description: 猫屋敷まゆのAI音声合成モデルを作りました。
Running

13

🥰🎤🤔

Galgame Voice Finder
Sleeping

1

👁

Vad Go
Running on Zero

156

👀

Indic Parler-TTS

A demo of Indic Parler-TTS
Sleeping

1

🐳

Voice Activity Detection
Running

5

👀

Vikhr 4o
Running

18

🏢

Wespeaker Demo
Sleeping

4

💻

Wesep Tse 2speaker Demo

Target Speaker Extraction with WeSep
Running

13

🐢

Wenet Demo
Running

5

🏆

Open_ASR_Leaderboard
Running

39

🗣️

Text-to-Speech WebGPU

WebGPU text-to-Speech powered by OuteTTS and Transformers.js
Running

13

📈

SpeechScore (Speech Quality Metrics and Evaluation)

A home for scoring speech quality
Running

2

🐠

Fish Speech Benchmark

Non official benchmark by Fish Speech
Running on Zero

6

👅🎙️🥰

Chupa Generator
Running on Zero

5

🌖

Japanese Parler-TTS Mini Demo
Running on Zero

4

🏢

Japanese Parler-TTS Large Demo
Runtime error

3

⚡

Make Anime Emotion Dataset
Running

6

😊😱😠

Anime Speech Emotion Recognition
Running on Zero

515

🔊

MMAudio — generating synchronized audio from video/text
Running on Zero

28

🗣️

Voice Clone
Running on Zero

166

🐠

Sound AI SFX

SText to Audio(Sound SFX) Generator
Runtime error

5

👁

Talk To Moshi

Talk to Kyutai's moshi - powered by Gradio WebRTC!
Running on T4

371

⚡

HierSpeech++ (Zero-shot TTS)
Running

11

🌍

Talk To Gradio Docs Rag

Talk to the Gradio docs! Powered by Pydantic and WebRTC ⚡️
Running

6

📊

Melody Workshop

"One-minute creation by AI Coding Autonomous Agent MOUSE-I"
Running on Zero

12

📉

Text2midi
Running on Zero

98

🔊🔊

Audio Llama

generated sound from video/text and search
Running

2

🐢

VM Sound Classification
Sleeping

2

🪷

Lotus
Running

112

🌙

Moonshine Web

Real-time in-browser speech recognition
Running

8

💻

Openai Realtime Voice

Talk with openAI's new Realtime Voice API
Running on Zero

8

🏆

Fast GeCo
Running on Zero

6

📉

SoloAudio
Running on Zero

5

🐨

SSR Speech
Running

23

🎶

Music Genre Classifier

Music Genre Classifier
Running

2

🪕🎵

Guzheng Playing Tech

Guzheng Performance Technique Recognizer
Restarting

2

🪕🎶

Chinese Instruments

Chinese Traditional Instrument Sound Retriever
Running

2

🪕🎼

Pentatonic Mode

Chinese Music Pentatonic Mode Detector
Running

3

🐨

Audio Edit
Paused

4

🔊

MMAudio

Video to Audio
Running

9

🎙️

Audio Transcription
Sleeping

5

📉

Audio 8D

Make your audio to 8D
Running

14

⚡

Audio Separator

Audio-Separator Demo
Running

2

🎤

Real-time Whisper WebGPU (Vue)

Yet another Real-time Whisper with WebGPU, written in Vue
Sleeping

6

🦀

MIDI Identification

Identify any MIDI
Running

2

🌙

Moonshine Web (Vue)

Yet another Real-time in-browser STT, re-implemented in Vue
Running

5

🧸

アイリ VTuber

アイリ VTuber. LLM powered Live2D/VRM living character.
Running

9

🎵🖥️

Figured Bass Calculator

figured bass calculator
Running

155

🚀

Ebook2audiobook V2.0 Beta

Added improvements, 1107+ languages supported
Running

3

🐸📖

Ebook2audiobook_v1.0

V1.0Convert any Ebook to AudioBook with Xtts + VoiceCloning!
Running

9

🪈📖

Ebook2audiobookPiper-tts

Converts Ebooks into audiobooks with piper-tts
Running

6

⚡

Ebook2AudiobookV2.0_Docker_Test

First ebook2audiobook Dockerfile test
Running

11

🎵🔘

Music Vision

Audio Visualization Circle Effect Tool
Running

4

📟

MS1-X Virtual Synth

Ready-to-play synth instrument!
Running

8

🎮️💬

hoyoTTS

Genshin Impact & Honkai Star Rail Game Character Voice TTS
Running

9

🪕

Erhu Playing Tech

Erhu Performance Technique Recognizer
Running

9

🎙

Bel Canto Discriminator

Discriminator of Bel Canto and Chinese Folk Singing
Running

12

🎹

Pianos

Piano Sound Quality Classifier
Running

13

🎤

Chest Falsetto Discriminator

Discriminator of Chest Vocie and Falsetto
Running on L4

148

🥳

CosyVoice2-0.5B
Running on Zero

5

👾

Monster Piano Transformer

Ultra-fast and very well fitted solo Piano music transformer
Running

2

🌖

Style Bert VITS2 IM2

ヘスティアのAI音声合成モデルを作りました。
Sleeping

1

🏃

Style Bert VITS2 YHK2

フレイヤのAI音声合成モデルを作りました。
Paused

2

📻🎙️

Anachrovox V0.1 Emerald (Bugged)

Hands-Free AI Voice Chat with a Retro Vibe
Paused

3

📻🎙️

Anachrovox V0.1 Azure (Bugged)

Hands-Free AI Voice Chat with a Retro Vibe
Paused

2

📻🎙️

Anachrovox V0.1 Amber (Bugged)

Hands-Free AI Voice Chat with a Retro Vibe
Running

77

📉🦀

MIDI-Melody-Generator

"One-minute creation by AI Coding Autonomous Agent MOUSE-I"
Running on Zero

22

📊

Audio Separator
Running

17

🥇

Open Universal Arabic Asr Leaderboard

A benchmark for open-source multi-dialect Arabic ASR models
Running on Zero

252

🔥

MusicGen Streaming
Running

2.51k

⚡️

Whisper JAX
Running on Zero

25

📝

Parler-TTS Streaming

High-fidelity Text-To-Speech
Running on L4

299

👄

LatentSync

Audio Conditioned LipSync with Latent Diffusion Models
Sleeping

242

🎼

Singing Voice Conversion
Running

54

🔥

Text To Speech
Running on Zero

4

🔥

DeepfakeDetection

Deepfake Detection
Running

2

🦀

Felguk Audio Edit

Audio edit
Running on Zero

224

🎴

Kokoro TTS Zero

✨[With v1.0.0] Accelerated TTS on Kokoro-82M
Running

4

📚🎧

📚 𝕡𝕕𝕗 𝕥𝕠 𝕊𝕡𝕖𝕖𝕔𝕙 ℂ𝕠𝕟𝕧𝕖𝕣𝕥𝕖𝕣 🎧

Accessibility PDF & pasted text to speech converter w/ gTTs
Running on L4

1.21k

😭

SadTalker
Running

2

😎

OLLAMA TTS CLIENT
Running

8

🚀

Piper TTS Spanish
Running

46

🦀🦀

Audio Visualizer

Audio Visualizer
Sleeping

1

🦀

JARVIS2

2
Running on Zero

276

🚀

TangoFlux

Text to Audio (Sound SFX) Generator
Running

275

🎤

Rvc Models
Running

8

🎼🎶

Karaoke MIDI Search
Running

17

🎵

Semantic Audio Search w/ Transformers.js
Running on Zero

15

⚡

Misaki G2P

G2P
Running on Zero

3

📈

ClearerVoice-Studio (Speech Super Resolution)

Better AI powered platform to purify your speech signal
Running

1

🏃

Style Bert VITS2 NHR

結束いのりのAI音声合成モデルを作りました。
Running

1

🌖

Style-Bert-VITS2-AJU YM

ドラクエ３の女勇者のAI音声合成モデルを作りました。
Running

1

⚡

Style Bert VITS2 AKT

喜屋武飛夏のAI音声合成モデルを作りました。
Running

58

📉📉

3DAudio-Spectrum-Analyzer

"One-minute creation by AI Coding Autonomous Agent MOUSE-I"
Running on Zero

49

🔊

OuteTTS 0.3 1B Demo
Sleeping

43

🤯

Badassgi

Korean Speech Transcribe(Text) and English Translate(Korean)
Running on Zero

19

🎷🎸🎹🎺🎙️🎚️🎛️🎧

Audiocraft

Demo for Jasco Model Music Stems Generation
Running

154

🗣️

Kokoro Text-to-Speech

High-quality speech synthesis powered by Kokoro TTS
Running

2

⚡

AudioTranscribe

Transcribe and summarise audio files using AI.
Running

9

🎵⬇️

Parser163

NetEase Cloud Music MP3 Direct URL Parser
Runtime error

3

🌖

GSV MiSide Japanese

GPT-SoVITS for MITA!
Running on Zero

2

🎺🥁

Guided Accompaniment Transformer

Guided melody accompaniment generation with transformers
Running

5

✨

Faster Whisper Webui with translate
Running on Zero

247

🔥

Llasa 3b Tts

Zero Shot voice cloning with llasa 3b (Unofficial Demo)
Running on A10G

62

🎤

Qwen-Audio
Running on Zero

17

🐨

Egyptian Arabic TTS

A humble space for trying EGTTS V0.1
Running on A100

92

👩‍🎤

YuE
Running on Zero

15

👩‍🎤

YuE

work in progress
Running on Zero

2

⚡

Make Custom Voices With KokoroTTS

Make Custom Voices With KokoroTTS
Running

3

🎨

MIDI Loops Mixer

Mix random MIDI loops into one coherent music composition
Running

2

👀

Text To Speech Online
Running

3

🎤

Speech To Text Online
Running on Zero

11

🔥

Llasa 8b Tts

Zero Shot voice cloning with llasa 3b (Unofficial Demo)
Running on Zero

12

🦦

soundfont-generator

Generate soundfonts with latent flow matching
Running

2

📈

Beepbox

beepbox
Running on Zero

1

🏃

Voice Clone Multilingual

Languages ru,en,zh-cn,ja,de,fr,it,pt,pl,tr,ko,nl,cs,ar,es,hu

Upvote

Collection guide
Browse collections

Spaces for Audio / Voices

AICoverGen

SBV2 Chupa Demo

VisualNovel_sbv_demo

Moe TTS

Bert-VITS2 AI Abe&Suga&Kishida

AICoverGen

rvc-Blue-archives-hoyogames

VTuber RVC Models

RVC Inference HF

Audio🔹Separator

BlueArchiveTTS

Multi Voice TTS(English/Chinese/Japanese)

Stable Audio Open Zero

Applio

Voice Clone

RVC⚡ZERO

Multilingual Anime TTS

DiffSinger🎶 Diffusion for Singing Voice Synthesis

Ultimate Vocal Remover WebUI

Aesthetic RVC Inference HF

Advanced RVC Inference

Vits Models

Multilingual Anime TTS

LoveLive-ShojoKageki VITS

vits-uma-genshin-honkai

おしゃべり晋さんメーカー（Style-Bert-VITS2）

Hololive Style-Bert-VITS2

Midi Music Generator

Japanese Lyric Generator

VALL E X

AI晋さんメーカー

BangDream-ShojoKageki Bert VITS2

lovelive-ShojoKageki VITS JPZH

Lovelive-nijigasaki-MB-iSTFT-VITS-ZH&JP

Bark

OpenVoice

OpenVoiceV2

ChatTTS OpenVoice

MassivelyMultilingualTTS

XTTS

MusicGen

Seamless M4T v2

Mars5 Space

FAcodecV2

TTS x Hallo Talking Portrait

RVC Genshin Impact

FoleyCrafter

Voice Clone Multilingual

Talkalkai Cover

Image to Music v2

Whisper Timestamped

TTS Arena

TTSDS Benchmark and Leaderboard

LAKH MIDI Dataset Search

PicoAudio

Advanced MIDI Search

SenseVoice

Whisper Speaker Diarization

Faster Whisper Webui

Vocal Separation SOTA

BangDream-ShojoKageki Bert VITS2

BangDream-ShojoKageki Api

BangDream-ShojoKageki Bert VITS2

Efficient Audio Captioning

NaturalSpeech3 FACodec

tts Text To Speech

Edge Tts

JA TTS Arena

MIKU TTS

Genshin music generation

Advanced RVC Inference

Style Bert VITS2 MT

ZeroRVC

Edge TTS w/ More Options

EZ Voice Clone

Training Helper Rvc

Anitalker

rvc-Blue-archives

Fish Diffusion (HiFiSinger) Demo