Whisper 是一種通用的語音識別模型。它在不同音頻的大型數(shù)據(jù)集上進行訓練,也是一個多任務模型,可以執(zhí)行多語言語音識別以及語音翻譯和語言識別。
Whisper 是Openai 開源音頻轉文字的語音識別模型。它在不同音頻的大型數(shù)據(jù)集上進行訓練,也是一個多任務模型,可以執(zhí)行多語言語音識別以及語音翻譯和語言識別。
Whisper有五種模型尺寸,提供速度和準確性的平衡,其中English-only模型提供了四種選擇。下面是可用模型的名稱、大致內存需求和相對速度。
AI Companion App
AIdea
碼多多Al智能聊天系統(tǒng)是一款基于人工智能技術的聊天系統(tǒng)AI源碼。...
字節(jié)跳動旗下推出的一個免費AI編程助手,一個基于 AI 的云 I...
一個字節(jié)跳動開源的多模態(tài) AI 代理工具,Agent TARS能...
AI角色動畫工具,通過先進的視頻處理和3D渲染技術,Motion...
AnimateDiff 是一個能夠將個性化的文本轉換為圖像的擴展...
ProPainter,一鍵移除視頻內的移動物體,一鍵移除視頻水印...
TryOnDiffusion就谷歌推出的一項新虛擬試穿功能,能夠...
一個專門收集和分享中國大陸從小學到大學的教材資源的開源項目,特別...
基于flet的一款多功能娛樂軟件,實現(xiàn)了瀏覽圖片、音樂、小說、各...
一個免費開源的在線簡歷生成器,用戶可以實時編輯簡歷并一鍵導出 P...