首頁 > Ai導航 > Ai工具箱 > Ai開源項目

Audio2Photoreal

從音頻生成全身逼真的虛擬人物形象。它可以從多人對話中語音中生成與對話相對應的逼真面部表情、完整身體和手勢動作。

#Ai工具箱 #Ai開源項目

訪問Audio2Photoreal

Audio2Photoreal簡介

Meta ai最近發布了一項炸裂的技術：Audio2PhotoReal，從音頻生成全身逼真的虛擬人物形象。它可以從多人對話中語音中生成與對話相對應的逼真面部表情、完整身體和手勢動作。

這些生成的虛擬人物不僅在視覺上很逼真，而且能夠準確地反映出對話中的手勢和表情細節，如指點、手腕抖動、聳肩、微笑、嘲笑等。

Audio2PhotoReal工作原理：

Audio2PhotoReal結合了向量量化的樣本多樣性和通過擴散獲得的高頻細節的優勢，以生成更具動態性和表現力的動作。

1、數據集捕獲：首先捕獲了一組豐富的雙人對話數據集，這些數據集允許進行逼真的重建。

2、運動模型構建：項目構建了一個包括面部運動模型、引導姿勢預測器和身體運動模型的復合運動模型。

3、面部運動生成：使用預訓練的唇部回歸器處理音頻，提取面部運動相關的特征。

利用條件擴散模型根據這些特征生成面部運動。

4、身體運動生成：以音頻為輸入，自回歸地輸出每秒1幀的向量量化（VQ）引導姿勢。將音頻和引導姿勢一起輸入到擴散模型中，以30幀/秒的速度生成高頻身體運動。

5、虛擬人物渲染：將生成的面部和身體運動傳入訓練好的虛擬人物渲染器，生成逼真的虛擬人物。

6、結果展示：最終展示的是根據音頻生成的全身逼真虛擬人物，這些虛擬人物能夠表現出對話中的細微表情和手勢動作。

Audio2Photoreal項目地址：https://github.com/facebookresearch/audio2photoreal/

Audio2Photoreal論文地址：https://arxiv.org/pdf/2401.01885.pdf

Zero123

IP-Adapter-FaceID

與Audio2Photoreal相關工具

Audionautix

一個專注于提供免費可商用背景音樂的在線平臺，由作曲家 Jason Shaw 創立，為創作者如視頻博主、自媒體人、等提供無...

AudioTextHub

一個免費AI文本轉語音平臺，它的核心優勢是獨創的AI風格提示詞技術，能控制語音的情感、語調、語速和特效。

PhotoFox AI

把一張產品照片，短時間內變成工作室風格照片、生活場景照片、滾動展示視頻等多種素材，并且保持品牌風格統一。幫電商賣家解決拍...

Aice PS

網頁版AI照片編輯器，利用Google aistudio的的先進能力，支持 AI 生成圖片、智能修圖、創意濾鏡等功能，適...

Photodot AI

一個在線修圖工具，不用下載安裝，打開網頁就能用。你直接用文字告訴它想改啥——比如給汽車換個顏色、換輪轂、加尾翼，或者給人...

id-photo

證件照大師，專業的證件照在線處理網站，具有證件照換底色，證件照質量壓縮，證件照合成等證件照處理功能。

最新工具

FastBuildAI

一個面向AI開發者，創業者設計的開源AI應用框架，它幾分鐘就能部...

AiPyApp

一款以Python為核心的開源新人工智能體助手，結合大模型和 P...

LandPPT

一個基于大語言模型的開源免費AIPPT生成平臺，支持將文檔內容自...

BongoCat

一款輕量級、開源且跨平臺的桌面貓咪寵物應用，由開發者ayoung...

ValueCell AI

全球首個開源金融智能體平臺，采用社區驅動和多智能體模式，Valu...

FlyCut Caption

一款開源的視頻字幕編輯工具，支持智能生成字幕、編輯字幕和裁剪視頻...

ChopperBot

一款能用于像虎牙、斗魚、抖音、BiliBili、TikTok、T...

Awesome-Nano-Banana

JimmyLv創建的GitHub倉庫，專門收集和展示Google...

ReactBits

一個免費開源的動畫化、可交互React組件庫，里面有好多動畫化、...

Aice PS

網頁版AI照片編輯器，利用Google aistudio的的先進...

用戶登錄

我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

Audio2Photoreal

Audio2Photoreal簡介

與Audio2Photoreal相關工具

最新工具