Voice-Pro:一款集字幕、翻譯和TTS于一體的多語言音頻處理工具
Voice-Pro,一款集字幕、翻譯和TTS于一體的多語言音頻處理工具 ,一鍵安裝。
Voice-Pro支持超過90多種語言的實時翻譯,適合直播或即時翻譯場景。
Voice-Pro主要功能:
Studio選項卡
提供 YouTube 下載器、噪音消除、字幕、翻譯和 TTS 的集成環境
ffmpeg支持的所有視頻/音頻格式都可以使用
可選擇輸出音頻格式(wav、flac、mp3)
100 種語言的語音識別和字幕創建
選擇適合 PC 性能的字幕創建選項(Whisper 模型和計算類型)
翻譯成 100 多種語言并通過 TTS 生成語音
多語言視頻中保留了原始視頻的BGM和音效。
支持TTS語音速度、音量、音調調節
Whisper Caption卡
專門用于創建字幕的選項卡。支持 90 多種語言
顯示使用視頻創建的字幕
提供世界級亮點功能
提供降噪功能(1-Demucs、2-MDXNet)
Translate選項卡
專用翻譯選項卡。支持 100 多種語言
支持字幕文件(ass、ssa、srt、mpl2、tmp、vtt、microdvd、json)
也可以直接輸入文字
自動檢測上傳文件的語言
TTS選項卡
僅 TTS 選項卡。支持超過100種語言和400種語音
支持字幕文件(ass、ssa、srt、mpl2、tmp、vtt、microdvd、json)
也可以直接輸入文字
自動檢測上傳文件的語言
音調、音量和速度可調
Live Translation選項卡
實時語音識別和翻譯支持
選擇音頻輸入源,例如麥克風、揚聲器等。
提供保存捕獲的音頻、識別的字幕和翻譯的字幕的功能
Batch選項卡
批量處理大量文件
字幕、翻譯、TTS
Voice-Pro特征:
您可以下載 YouTube 視頻(mp4、webm)并將其另存為音頻文件(mp3、wav、flac)。
您可以通過消除噪音和分離人聲來提高語音識別的準確性。使用MDX-Net和Meta的Demucs 。
您可以輕松制作多語言視頻。
一鍵安裝。安裝后,您可以永久使用它,無需額外費用。 (※ 免費版有30分鐘使用時間限制)
提供Web-UI 。推薦使用谷歌Chrome瀏覽器。
Voice-Pro項目地址:https://github.com/abus-aikorea/voice-pro