我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

Hotshot:可生成長達(dá)10秒720P視頻

Hotshot:可生成長達(dá)10秒720p視頻的文生圖模型

Hotshot 推出了一種ai模型,可以生成分辨率為 1280 x 720 像素的 10 秒剪輯。

該初創(chuàng)公司于周一推出了該模型,也稱為 Hotshot,進(jìn)入公共預(yù)覽版。它加入了市場上不斷增長的人工智能視頻生成器的行列。 OpenAI、Runway ML Inc. 和許多其他初創(chuàng)公司同樣提供能夠根據(jù)用戶提示生成短片的模型。

Hotshot 去年推出了一款面向消費者的人工智能圖像生成應(yīng)用程序。據(jù)VentureBeat 報道,該公司似乎已經(jīng)關(guān)閉了該服務(wù),以專注于新興的視頻生成領(lǐng)域。據(jù)報道,Hotshot 得到了 SV Angel、天使投資人 Lachy Groom 和 Reddit Inc. 聯(lián)合創(chuàng)始人 Alexis Ohanian 的支持。

該公司花了幾個月的時間開發(fā)了最新的視頻生成模型。作為該項目的一部分,它創(chuàng)建了三個不同的神經(jīng)網(wǎng)絡(luò):核心 Hotshot 模型和另外兩個幫助準(zhǔn)備 AI 視頻生成器的訓(xùn)練數(shù)據(jù)集的神經(jīng)網(wǎng)絡(luò)。

Hotshot的主要功能:

  • 文本到視頻轉(zhuǎn)換:用戶可以輸入文本描述,如場景、角色或動作,Hotshot將自動生成3秒的視頻。

  • 生成長達(dá)10秒的高清視頻:該工具能夠生成分辨率為1280 x 720像素的10秒剪輯。

  • 生成GIF動畫:使用最新的圖像生成技術(shù),Hotshot可以將復(fù)雜的文字描述轉(zhuǎn)換為逼真的GIF動畫。

  • 無水印視頻輸出 :免費用戶生成的視頻沒有水印,為創(chuàng)作者提供了更多的自由。

在該計劃的第一階段,Hotshot 整理了一個包含 6 億個剪輯的存儲庫,并配有描述其內(nèi)容的字幕。它將這些剪輯與十億張圖像結(jié)合起來,創(chuàng)建視頻生成模型的訓(xùn)練數(shù)據(jù)集。 Hotshot 團(tuán)隊成員 John Mullan、Duncan Crawbuck、Chaitu Aluru 和 Aakash Sastry 表示:“我們知道我們希望聯(lián)合在圖像和視頻上訓(xùn)練模型,以便利用比視頻豐富得多的可公開訪問的圖像數(shù)據(jù)。”在一篇博文中解釋過。

在該項目的下一階段,該公司開發(fā)了一個人工智能模型,為其訓(xùn)練數(shù)據(jù)集中的視頻生成字幕。字幕可以幫助神經(jīng)網(wǎng)絡(luò)更好地理解正在訓(xùn)練的剪輯。人工智能因此收集到的額外知識提高了其輸出的質(zhì)量。

Hotshot發(fā)現(xiàn)市場上現(xiàn)有的字幕生成模型并不能滿足其要求。作為回應(yīng),該公司采用了其中一個現(xiàn)有模型,并在包含 300,000 個帶有手動創(chuàng)建字幕的剪輯的訓(xùn)練數(shù)據(jù)集上對其進(jìn)行了定制。 “幾周后,我們就擁有了一個視頻字幕器,我們很高興用它來注釋我們數(shù)億個視頻樣本,”Hotshot 團(tuán)隊詳細(xì)介紹道。

該公司為支持視頻生成器的開發(fā)而構(gòu)建的第二個輔助人工智能模型是自動編碼器。這種算法可以獲取一段數(shù)據(jù)(在本例中為視頻),并刪除人工智能訓(xùn)練不需要的細(xì)節(jié)。刪除多余的信息可以降低存儲要求,從而降低成本。

在準(zhǔn)備好自動編碼器和字幕模型后,Hotshot 花了四個月的時間訓(xùn)練其 AI 視頻生成器。該公司使用了 Nvidia 公司的數(shù)千個 H100 圖形處理單元,在該項目期間累計了數(shù)百萬個處理小時。

Hotshot 的工程師應(yīng)用了多項優(yōu)化來降低訓(xùn)練運行的基礎(chǔ)設(shè)施要求。該公司以 bfloat16 格式存儲了項目中使用的許多文件,該格式可以將 32 位數(shù)據(jù)壓縮為 16 位,以節(jié)省存儲空間。此外,它還提前執(zhí)行了一些通常在訓(xùn)練過程中執(zhí)行的計算,以更好地利用 Nvidia 芯片的處理能力。

Hotshot 的新人工智能可作為其網(wǎng)站上免費視頻生成服務(wù)的一部分進(jìn)行訪問。該公司還計劃通過應(yīng)用程序編程接口向開發(fā)人員提供該模型。

Hotshot AI視頻生成模型目前已經(jīng)進(jìn)入了公開的 “預(yù)覽” 階段,用戶可以在 Hotshot 的官方網(wǎng)站上免費體驗這個模型,不過需要注意的是,每天的生成次數(shù)被限制在兩個視頻。

Hotshot官網(wǎng)地址:https://hotshot.co/

收藏
#文字轉(zhuǎn)視頻 #圖文轉(zhuǎn)視頻
最新工具
unDraw
unDraw

美國設(shè)計師Katerina Limpitsouni創(chuàng)作的開源插畫...

Storyset
Storyset

一個由知名素材平臺Freepik公司旗下的免費在線自定義矢量插畫...

Jigsaw Planet
Jigsaw Planet

一個數(shù)百萬免費在線拼圖平臺,用戶能直接通過瀏覽器創(chuàng)建、游玩和分享...

GeoFS
GeoFS

一款免費的網(wǎng)頁版多人飛行模擬器網(wǎng)站,只要瀏覽器就可以運行,不需要...

Avido AI
Avido AI

通過 AI 技術(shù)幫用戶生成適合 YouTube 和 TikTok...

表答AI
表答AI

一款能抓取網(wǎng)頁內(nèi)容并能情感分析的數(shù)據(jù)分析產(chǎn)品,并把采集分析過程自...

Recaster AI
Recaster AI

通過導(dǎo)入產(chǎn)品圖像或數(shù)據(jù),生成定制的SEO內(nèi)容,支持從Shopif...

ScanPDF
ScanPDF

一個能夠讓PDF看起來就像是掃描件一樣的在線免費工具。只需點擊鼠...

SkylineWebCams
SkylineWebCams

在美洲、歐洲、亞洲、非洲及大洋洲59個國家,提供全球五大洲實時高...

Ezgif
Ezgif

一個簡單、免費的在線 GIF 制作工具和基礎(chǔ)動畫圖像編輯工具集,...

主站蜘蛛池模板: 晋中市| 五河县| 林西县| 休宁县| 黄浦区| 沂南县| 定结县| 二手房| 阜城县| 南乐县| 顺昌县| 松滋市| 武汉市| 栖霞市| 延安市| 双鸭山市| 磐安县| 五常市| 绵阳市| 上蔡县| 深泽县| 乌拉特中旗| 湟中县| 万山特区| 海安县| 佛冈县| 类乌齐县| 万山特区| 云龙县| 河北区| 洮南市| 太谷县| 阜平县| 本溪| 安达市| 寿阳县| 临湘市| 安图县| 罗山县| 东乌| 通海县|