高說服力數字人:基于文心多模態大模型,具備“劇本生成”能力,聲形超逼真
高說服力數字人是什么?
高說服力數字人是2025年4月25日,在百度Create大會上,百度創始人李彥宏發布的數字人產品。高說服力數字人聲形超逼真、內容更專業、互動更靈活,能帶來超越真人的體驗。它由百度電商“慧播星”平臺打造,基于文心4.5大模型,具備“劇本生成”能力,能讓表情、語氣、動作隨臺詞實時調整,使情緒轉折和動作切換自然流暢。比如百度生成的數字人,相貌、聲音、動作和神情都很逼真,幾乎和真人一樣。
高說服力數字人核心技術
劇本驅動多模匹配:借助大語言模型生成劇本,涵蓋臺詞、視覺標簽和語音標簽生成。生成臺詞時,同步生成數字人的動作、表情和語調等信息,對齊各模態位置,實現多模態內容匹配和位置對齊,生成有表現力、形神兼備的數字人。
多智能體調度:數字人能依據直播間實時熱度和轉化情況,靈活調度助播、場控、運營等角色促進轉化,像適時切換鏡頭畫面、調度圖片和視頻素材等,實現“一人即一支營銷團隊”。例如某汽車直播間,數字人主播講解時,助播同步調出3D車型模型,轉化效率提升40%。
多模高度融合:可完美復刻真人與直播間裝修。百度研制數字人視頻生成大模型,將視頻、劇本、語音等多模態信號用于數字人高可控生成,再通過影空間對齊生成足夠時長的視頻內容。
面向數字人場景的語音合成:基于文心大模型預測文本風格、情緒及韻律起伏,通過文本自控語音合成大模型實現指令遵循合成,控制聲音效果平滑流暢,結合直播文本和發音人信息,合成自然流暢的聲音。
高說服力數字人應用場景
電商直播:這是高說服力數字人的重要應用領域。它能不知疲倦直播,覆蓋商品講解到氛圍引導全流程。如某美妝直播間,數字人導購轉化率比真人高25%;“溶溶精致生活”用慧播星數字人直播,月GMV達15萬+,收益提升30%;“美麗家居服工廠”GMV增長60%;美妝個護品牌“左顏右色”用數字人試妝展示,單場GMV達29萬+,直播間轉化率提升60%。數字人還能根據直播間實時反饋自動決策,如發放優惠券、切換商品等。
其他領域:目前數字人系統正拓展到多行業,廣泛應用于法律、教育、金融、汽車等垂類場景。部分汽車經銷商用數字人進行車型介紹和互動問答;圖書直播中,數字人能引經據典;健康產品帶貨時,能結合用戶血糖等數據個性化推薦。法律行業的“法在心間”,新增律師數字人項目,依托慧播星腳本創作和大模型知識儲備,精準解答法律問題、規避風險詞,上線后線索獲取成本降低75%,線索量提升近5倍。
高說服力數字人優勢
低門檻:百度慧播星有“一鍵克隆”功能,用戶錄一段最短2分鐘的直播視頻上傳訓練,就能擁有專屬數字人,人人可當主播。還能用ai幫寫直播腳本,打造個性化直播間。
低成本:目前使用“高說服力數字人”直播月均成本控制在千元以內,比傳統直播節省約80%。系統技術成本也在下降,過去一年下降約三分之二。在百度站內,商家借助平臺扶持,幾乎零成本就能開播。
高說服力數字人使用教程
錄制視頻:打開百度APP,搜索“慧播星”,點擊“手機端一鍵開播”“創建數字人”。用手機錄制一段2-3分鐘的真人出鏡視頻,視頻要求全程露臉,無需準備專業設備。
選擇或自定義人設、主題和腳本:在等待視頻上傳時,可以選擇慧播星準備好的人設,如情感咨詢、讀書分享等,AI會自動生成人設指南、直播主題和腳本。也可以自定義人設,如塑身愛好者等,并選擇“AI幫我寫”腳本來生成相關內容,整個腳本生成過程不到2分鐘。
等待數字人制作完成:制作時間一般在3小時左右,制作好后會通過短信通知,頁面也會提示開播時間。