10款優(yōu)秀的開源TTS語音模型推薦
在平時的語音合成TTS整理中,目前有許多優(yōu)秀的文本轉(zhuǎn)語音(TTS)模型可以推薦,以下是我整理的一些在研究和實際應(yīng)用中表現(xiàn)突出的10款優(yōu)秀TTS語音模型:
ai 賣貨主播大模型Streamer-Sales銷冠用的這款TTS模型,支持英語、日語和中文,零樣本文本到語音(TTS)。
集成工具包:github:https://github.com/RVC-Boss/GPT-SoVITS
效果穩(wěn)定非常好,支持克隆語音。經(jīng)過 30 萬小時的英語、中文和日語音頻數(shù)據(jù)的訓練。
模型:https://huggingface.co/fishaudio/fish-speech-1.2
在線版:https://fish.audio/zh-CN/
支持多種語言包括英語、中文,能夠進行同語言生成和跨語言生成,能處理各種文本,敘述性文本、情感表達、描述性文本等,能根據(jù)不同的情感和語境生成相應(yīng)的語音。
項目:https://bytedancespeech.github.io/seedtts_tech_report/
4、ChatTTS
對話式 TTS(可多人),支持中英文,韻律細膩。
github:https://github.com/2noise/ChatTTS
模型:https://huggingface.co/2Noise/ChatTTS/tree/main
5、Parler-TTS
可以控制音調(diào)、速度、性別、噪音水平、情緒特征等等
github:https://github.com/huggingface/parler-tts
模型:https://huggingface.co/parler-tts
6、MetaVoice-1B
支持多語言,在英語處理上實現(xiàn)了情感語音節(jié)奏
github:https://github.com/metavoiceio/metavoice-src
7、MARS5-TTS
MARS5可以為體育解說、動漫等韻律復(fù)雜和多樣化的場景生成語音
github:https://github.com/Camb-ai/MARS5-TTS
原生支持英語、西班牙語、法語、中文、日語和韓語,具有靈活的語音風格控制和零樣本跨語言語音克隆能力。
github:https://github.com/myshell-ai/OpenVoice
支持中英文雙語,包含2000多種不同的音色
github:https://github.com/netease-youdao/EmotiVoice/blob/main/README.zh.md
10、StyleTTS2
近乎人類水平的文本轉(zhuǎn)語音庫,它利用風格擴散和對抗訓練與大型語音語言模型 (SLM) 來實現(xiàn)人類水平的 TTS 合成。
github:https://github.com/yl4579/StyleTTS2
以上是我整理的10款優(yōu)秀TTS語音模型,這些模型在不同的應(yīng)用場景和硬件配置下各有優(yōu)劣,選擇合適的模型需要根據(jù)具體應(yīng)用和資源進行評估。