首頁 > Ai資訊 > Ai產品

阿里巴巴EMO：一張圖片和音頻即可生成談話或唱歌視頻

阿里巴巴EMO于2024-02-28發布在Ai產品

阿里巴巴集團智能計算研究院隆重推出EMO：Emote Portrait Alive，一種突破性的 AI，只需圖像和音頻即可生成富有表現力的人像視頻！同時生成視頻的長度和你音頻長度相匹配，談話和唱歌視頻栩栩如生，支持任意語音、任意語速、任意圖像...

與傳統方法不同，EMO使用直接的音頻到視頻方法，繞過了對中間3D模型或面部標志的需求。確保了整個視頻的無縫幀轉換和一致的身份保留，從而產生了高度表現力和逼真的動畫，這意味著更平滑的過渡和更自然的表情。

EMO甚至擅長制作各種風格的歌唱視頻！想象一下，只用你最喜歡的藝術家的一張圖片來制作音樂視頻！

EMO研究論文：https://arxiv.org/pdf/2402.17485.pdf

EMO開源地址：https://humanaigc.github.io/emote-portrait-alive/

EMO主要功能：

1、音頻驅動的人像視頻生成：利用單張參考圖像和音頻輸入（如說話或唱歌），EMO能夠生成具有表情變化和頭部動態的虛擬人像視頻。這意味著用戶可以通過提供一張靜態圖片和相應的音頻文件，來創造出說話或唱歌的動態視頻。無論視頻中的人物進行怎樣的表情變化或頭部動作，其基礎特征都來源于這張參考圖片。

2、表情豐富的動態渲染和頭部姿勢支持： EMO特別強調在視頻中生成自然而富有表情的面部動作，它可以捕捉微妙的面部表情和頭部運動，創造出栩栩如生的談話和唱歌視頻，從而生成看起來自然、生動的面部動畫，增加了視頻的動態性和真實感。

3、支持多種語言和肖像風格：該技術不限于特定語言或音樂風格，能夠處理多種語言的音頻輸入，并且支持多樣化的肖像風格，包括歷史人物、繪畫作品、3D模型和AI生成內容等。

4、快速節奏同步： EMO能夠處理快節奏的音頻，如快速的歌詞或說話，確保虛擬人像的動作與音頻節奏保持同步。

5、跨演員表現轉換： EMO能夠實現不同演員之間的表現轉換，使得一位演員的虛擬形象能夠模仿另一位演員或聲音的特定表演，拓展了角色描繪的多樣性和應用場景。

EMO應用場景：

創建即時配音
為電影和視頻游戲創建逼真且富有表現力的角色
開發引人入勝的互動教育材料
給虛擬助手一個更像人類的外觀和感覺
讓視頻電話會議更具吸引力和個性化
制作更引人入勝、更令人難忘的營銷和廣告視頻

實驗結果表明，EMO不僅能夠制作令人信服的口語視頻，還能夠制作各種風格的歌唱視頻，在表現力和真實感方面明顯優于現有的最先進的方法。為視頻生成設定了新的標準，對于未來來說意義重大。

Promptbase商城新上線Sora和通義萬相提示詞

AI智能體（AI Agent）是什么？有哪些應用產品

Qwen-Image：阿里云通義千問團隊開源的圖形海

Qwen-Image：阿里云通義千問團隊開源的圖形海

2025-08-06

ThinkSound：阿里巴巴通義實驗室推出的多模態

ThinkSound：阿里巴巴通義實驗室推出的多模態

2025-07-25

阿里Ovis-U1：具備多模態理解、圖像生成、圖像編

阿里Ovis-U1：具備多模態理解、圖像生成、圖像編

2025-06-30

Qwen VLo：阿里巴巴推出的多模態統一理解與生成

Qwen VLo：阿里巴巴推出的多模態統一理解與生成

2025-06-28

Mnn3dAvatar：阿里開源的3D數字人框架，直

Mnn3dAvatar：阿里開源的3D數字人框架，直

2025-06-12

VRAG-RL：阿里通義團隊推出的一款基于視覺感知R

VRAG-RL：阿里通義團隊推出的一款基于視覺感知R

2025-06-03

最新工具

Custom Cursor

一個能讓你擁有個性化光標的網站。Custom Cursor網站有...

橙子8設計

一站式AI電商圖片制作平臺，專為電商和跨境賣家服務。不用專業設計...

Sandspiel

一款基于細胞自動機和實時物理的開源像素沙盤游戲，玩家可以在虛擬沙...

印象地圖

這是個可以幫你記住全國省市位置的測試工具。打開網站就能用，選個模...

Sandtris

一款把經典俄羅斯方塊和流沙物理效果結合的休閑游戲。玩家需要利用沙...

Maze Toys

一個以迷宮游戲為主的網站，提供多種類型的迷宮玩法，包括Mini、...

AiPyApp

一款以Python為核心的開源新人工智能體助手，結合大模型和 P...

Adobe Express

Adobe推出的一站式設計工具，整合了圖像、視頻、文檔/PDF、...

Intangible AI

創意行業空間智能AI平臺，通過簡潔的3D界面與空間智能技術解決A...

法大大iTerms

法大大推出的一站式法律AI工作臺，基于自研法律大模型的AI智能體...

用戶登錄

我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

阿里巴巴EMO：一張圖片和音頻即可生成談話或唱歌視頻

相關文章

最新文章

最新工具