我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

Ai應用
Ai資訊
AI生圖
AI生視頻
FastbuildAI

首頁 > Ai資訊 > Ai產品

HunyuanCustom：騰訊混元推出并開源的全新的多模態定制化視頻生成工具

HunyuanCustom于2025-05-09發布在Ai產品

HunyuanCustom是什么？

HunyuanCustom 是騰訊混元推出并開源的基于多模態驅動的定制化視頻生成框架，可以生成具有特定主題的視頻，同時支持文本、圖像、音頻和視頻等多種輸入條件。

HunyuanCustom：騰訊混元推出并開源的全新的多模態定制化視頻生成工具.webp

HunyuanCustom模型架構

基于 HunyuanVideo：HunyuanCustom 是在 HunyuanVideo 的基礎上構建的，專注于生成與特定主題一致的視頻。
多模態融合：引入了基于 LLaVA 的文本-圖像融合模塊，增強對多模態輸入的理解。此外，還設計了針對音頻和視頻的特定條件注入機制，以實現多模態條件下的視頻生成。

HunyuanCustom核心功能

多模態輸入生成視頻：融合了文本、圖像、音頻、視頻等多模態輸入生成視頻的能力，具備高度控制力和生成質量。
單主體視頻生成：用戶只需上傳一張包含目標人物或物體的圖片，并提供一句文本描述，就能識別出圖片中的身份信息，并在完全不同的動作、服飾與場景中生成連貫自然的視頻內容。例如上傳一張人物照片，輸入“他正在遛狗”，即可生成相應視頻。
多主體視頻生成：用戶提供一張人物和一張物體的照片，并輸入文字描述，能讓這兩個主體按要求出現在視頻里。比如提供一張人物和一包薯片的照片，輸入“一名男子正在游泳池旁邊，手里拿著薯片進行展示”，即可生成對應視頻。
單主體視頻配音：在音頻驅動（單主體）模式下，用戶可以上傳人物圖像并配上音頻語音，模型便可生成人物在任意場景中說話、唱歌或進行其他音視頻同步表演的效果，廣泛適用于數字人直播、虛擬客服、教育演示等場景。
視頻局部編輯：在視頻驅動模式下，支持將圖片中的人物或物體自然地替換或插入到任意視頻片段中，進行創意植入或場景擴展，輕松實現視頻重構與內容增強。

HunyuanCustom技術優勢

身份一致性高：通過業內領先的主體一致性建模能力，在單人、非人物體、多主體交互等多種場景，都能保持身份特征在視頻全程的一致性與連貫性，人物不會“變臉”，物體不會“漂移”。
可控性強：具有較強的控制信號跟隨能力，包括遵循來自文本、參考主體圖像和語音等多種模態信號的控制，可較好地生成用戶需要對象、場景和動作。
視頻生成質量高：得益于騰訊混元視頻大模型的強大能力，在人物細節還原、動作流暢性、光影真實度等方面都達到業內領先水平。

HunyuanCustom應用場景

廣告場景：可以快捷變換商品背景、模特可以快速換衣服。
電商和客服場景：可以快速低成本制作出生動的數字人商品介紹視頻，或者制作特定穿著的數字人客服視頻。
影視場景：快速制作短劇和小故事短視頻。
教育科普場景：通過音頻驅動生成講解視頻。

HunyuanCustom單主體生成能力已經開源并在混元官網上線，用戶可以在“模型廣場 - 圖生視頻 - 參考生視頻”中體驗，其他能力已于5月內陸續對外開源。你可以通過以下鏈接訪問相關信息：

體驗入口：https://hunyuan.tencent.com/modelSquare/home/play?modelId=192
項目官網：https://hunyuancustom.github.io/
代碼：https://github.com/Tencent/HunyuanCustom
技術報告：https://arxiv.org/pdf/2505.04512

收藏

ZenCtrl：單張主體圖像生成多視角、多場景的高分辨率圖像

上一篇

ZenCtrl：單張主體圖像生成多視角、多場景的高分辨率圖像

ZeroSearch：阿里巴巴開源的一種創新大模型搜索引擎框架

下一篇

ZeroSearch：阿里巴巴開源的一種創新大模型搜索引擎框架

相關文章

Hunyuan-Large-Vision：騰訊混元視

Hunyuan-Large-Vision：騰訊混元視

2025-08-13

HunyuanVideo-Avatar ：騰訊混元推

HunyuanVideo-Avatar ：騰訊混元推

2025-05-29

騰訊元寶瀏覽器插件上線Chrome應用商店

騰訊元寶瀏覽器插件上線Chrome應用商店

2025-05-16

PrimitiveAnything：騰訊AIPD和清

PrimitiveAnything：騰訊AIPD和清

2025-05-14

如何使用騰訊元器創建AI智能體教程指南

如何使用騰訊元器創建AI智能體教程指南

2025-03-23

騰訊元寶如何使用讀取并分析復雜Excel表格的功能

騰訊元寶如何使用讀取并分析復雜Excel表格的功能

2025-03-22

最新文章

最新工具

VoiceNovel

一個通過AI把小說變成有聲內容的在線平臺，它把用戶上傳的小說轉成...

SchedPilot

個人和團隊用的社交媒體內容調度管理工具，用AI技術實現多平臺發內...

MultiPost

一款免費開源的瀏覽器擴展，能將文本、圖片、視頻等內容一鍵分發到 ...

AI快研俠

一個專注用AI幫用戶高效完成研究工作的產品，AI快研俠圍繞“研究...

GameCreator

Catsoft Studios開發的游戲引擎，兼顧專業和愛好者需...

GirlsGoGames

簡稱GGG，是一個特別受女孩歡迎的在線免費游戲平臺。它提供各種有...

SweetyGame

一個專門做給女孩子玩的小游戲網站，主要以可愛、時尚、名人元素為...

eSearch

一款開源跨平臺工具，能截屏、OCR 識別、搜索、翻譯、貼圖、以圖...

打字俠

一個在線中文打字練習平臺，主要幫用戶提升打字速度和準確度，覆蓋從...

Fable Prism

Fable Prism 是在線動效設計平臺 Fable 推出的A...

人生若只如初見

用戶登錄

主站蜘蛛池模板：建始县| 闽清县| 北碚区| 肥西县| 涡阳县| 西华县| 丰台区| 孟津县| 湖北省| 康乐县| 阳城县| 安徽省| 团风县| 焦作市| 安丘市| 江永县| 普安县| 珠海市| 通州市| 南郑县| 阿拉善右旗| 漾濞| 紫金县| 澳门| 田东县| 遂溪县| 怀来县| 莱芜市| 东明县| 竹山县| 东山县| 新野县| 会泽县| 罗平县| 江都市| 阿拉善左旗| 民和| 沭阳县| 屏边| 鹿泉市| 招远市|