Whisper 是一種通用的語音識別模型。它在不同音頻的大型數(shù)據(jù)集上進行訓練,也是一個多任務(wù)模型,可以執(zhí)行多語言語音識別以及語音翻譯和語言識別。
Whisper 是Openai 開源音頻轉(zhuǎn)文字的語音識別模型。它在不同音頻的大型數(shù)據(jù)集上進行訓練,也是一個多任務(wù)模型,可以執(zhí)行多語言語音識別以及語音翻譯和語言識別。
Whisper有五種模型尺寸,提供速度和準確性的平衡,其中English-only模型提供了四種選擇。下面是可用模型的名稱、大致內(nèi)存需求和相對速度。
AI Companion App
AIdea
碼多多Al智能聊天系統(tǒng)是一款基于人工智能技術(shù)的聊天系統(tǒng)AI源碼。...
字節(jié)跳動旗下推出的一個免費AI編程助手,一個基于 AI 的云 I...
一個字節(jié)跳動開源的多模態(tài) AI 代理工具,Agent TARS能...
AI角色動畫工具,通過先進的視頻處理和3D渲染技術(shù),Motion...
AnimateDiff 是一個能夠?qū)€性化的文本轉(zhuǎn)換為圖像的擴展...
ProPainter,一鍵移除視頻內(nèi)的移動物體,一鍵移除視頻水印...
TryOnDiffusion就谷歌推出的一項新虛擬試穿功能,能夠...
一個開源的會議筆記AI工具,適合經(jīng)常參加會議的人使用。Hyprn...
一款基于Flutter開發(fā)的B站開源第三方客戶端。支持Andro...
一款可以通過AI代理實現(xiàn)Android設(shè)備的自動化操作開源框架,...