
ChatTTS-Forge
ChatTTS-Forge簡(jiǎn)介
ChatTTS-Forge是一個(gè)圍繞 TTS生成模型開發(fā)的項(xiàng)目,為用戶提供靈活的TTS生成能力,支持多種音色、風(fēng)格控制、長(zhǎng)文本推理等功能,ChatTTS-Forge提供了各種API(應(yīng)用程序編程接口),開發(fā)人員可以直接使用這些API輕松將文本轉(zhuǎn)換為語(yǔ)音。
ChatTTS-Forge 是一個(gè)圍繞 TTS(文本轉(zhuǎn)語(yǔ)音)生成模型開發(fā)的項(xiàng)目。為用戶提供靈活的TTS生成能力,支持多種音色、風(fēng)格控制、長(zhǎng)文本推理等功能。
ChatTTS-Forge提供了各種API(應(yīng)用程序編程接口),開發(fā)人員可以直接使用這些API輕松將文本轉(zhuǎn)換為語(yǔ)音。此外,它還提供了易于使用的網(wǎng)頁(yè)界面(WebUI),允許用戶直接在網(wǎng)頁(yè)上輸入文本并生成語(yǔ)音,無(wú)需編程。
ChatTTS-Forge的主要特點(diǎn):
TTS生成:支持多種TTS模型推理,包括ChatTTS、CosyVoice、FishSpeech、GPT-SoVITS等,用戶可以自由選擇和切換語(yǔ)音。
音調(diào)管理:內(nèi)置多種音調(diào),并且可以上傳自定義音調(diào)。用戶可以通過上傳音頻或文本來(lái)創(chuàng)建和使用自定義鈴聲。
風(fēng)格控制:提供多種風(fēng)格控制選項(xiàng),包括調(diào)整語(yǔ)音速度、音調(diào)、音量,以及添加語(yǔ)音增強(qiáng)(Enhancer)以提高輸出質(zhì)量。
長(zhǎng)文本處理:支持超長(zhǎng)文本自動(dòng)切分和推理,可以處理生成長(zhǎng)文本音頻內(nèi)容。
SSML支持:使用類似XML的SSML語(yǔ)法進(jìn)行高級(jí)TTS合成控制,適合更詳細(xì)的語(yǔ)音生成場(chǎng)景。
ASR(自動(dòng)語(yǔ)音識(shí)別) :集成Whisper模型,支持語(yǔ)音轉(zhuǎn)文本功能。
ChatTTS-Forge的技術(shù)和方法:
API服務(wù)器:用Python編寫的API服務(wù)器提供高效的TTS服務(wù),支持多個(gè)并發(fā)請(qǐng)求和自定義配置。
WebUI :基于Gradio的用戶界面,用戶可以通過簡(jiǎn)單的操作界面體驗(yàn)TTS功能。
Docker 支持:提供 Docker 容器化部署選項(xiàng),以簡(jiǎn)化本地和服務(wù)器上的部署過程。
ChatTTS-Forge WebUI 的特點(diǎn):
TTS(文本到語(yǔ)音) :通過WebUI,用戶可以使用各種不同的TTS模型輸入文本并生成語(yǔ)音。
音調(diào)切換:支持多種預(yù)設(shè)音調(diào)切換,用戶可以選擇不同的聲音來(lái)生成語(yǔ)音。
自定義語(yǔ)音上傳:用戶可以上傳自己的語(yǔ)音文件,實(shí)時(shí)生成個(gè)性化語(yǔ)音。
風(fēng)格控制:您可以調(diào)整語(yǔ)音的風(fēng)格,包括語(yǔ)速、音高、音量等參數(shù),以生成滿足特定需求的語(yǔ)音。
長(zhǎng)文本處理:支持處理很長(zhǎng)的文本,自動(dòng)將長(zhǎng)文本分割成小段并按順序生成語(yǔ)音,適合生成長(zhǎng)音頻內(nèi)容。
批量處理:用戶可以設(shè)置批量大小,以提高長(zhǎng)文本的推理速度。
精煉器:這個(gè)工具 允許您微調(diào)文本以優(yōu)化生成的語(yǔ)音,對(duì)于處理無(wú)限長(zhǎng)度的文本特別有用。
語(yǔ)音增強(qiáng):集成增強(qiáng)模型以提高生成語(yǔ)音的質(zhì)量并使其聽起來(lái)更自然。
生成歷史:保存最近的3次生成結(jié)果,方便用戶比較不同設(shè)置下的語(yǔ)音效果。
多模型支持:WebUI支持多種TTS模型,包括ChatTTS、CosyVoice、FishSpeech、GPT-SoVITS等,用戶可以根據(jù)自己的需求選擇合適的模型。
SSML支持:使用類似XML的SSML語(yǔ)法來(lái)控制語(yǔ)音合成過程,適合需要更復(fù)雜控制的場(chǎng)景。
播客工具:幫助用戶從博客腳本創(chuàng)建長(zhǎng)格式、多字符的音頻內(nèi)容。
字幕生成:從字幕文件創(chuàng)建 SSML 腳本以生成各種語(yǔ)音內(nèi)容。
GitHub:https://github.com/lenML/ChatTTS-Forge
在線體驗(yàn):https://huggingface.co/spaces/lenML/ChatTTS-Forge