高說服力數(shù)字人:基于文心多模態(tài)大模型,具備“劇本生成”能力,聲形超逼真
高說服力數(shù)字人是什么?
高說服力數(shù)字人是2025年4月25日,在百度Create大會上,百度創(chuàng)始人李彥宏發(fā)布的數(shù)字人產(chǎn)品。高說服力數(shù)字人聲形超逼真、內(nèi)容更專業(yè)、互動更靈活,能帶來超越真人的體驗。它由百度電商“慧播星”平臺打造,基于文心4.5大模型,具備“劇本生成”能力,能讓表情、語氣、動作隨臺詞實時調(diào)整,使情緒轉(zhuǎn)折和動作切換自然流暢。比如百度生成的數(shù)字人,相貌、聲音、動作和神情都很逼真,幾乎和真人一樣。
高說服力數(shù)字人核心技術(shù)
劇本驅(qū)動多模匹配:借助大語言模型生成劇本,涵蓋臺詞、視覺標(biāo)簽和語音標(biāo)簽生成。生成臺詞時,同步生成數(shù)字人的動作、表情和語調(diào)等信息,對齊各模態(tài)位置,實現(xiàn)多模態(tài)內(nèi)容匹配和位置對齊,生成有表現(xiàn)力、形神兼?zhèn)涞臄?shù)字人。
多智能體調(diào)度:數(shù)字人能依據(jù)直播間實時熱度和轉(zhuǎn)化情況,靈活調(diào)度助播、場控、運(yùn)營等角色促進(jìn)轉(zhuǎn)化,像適時切換鏡頭畫面、調(diào)度圖片和視頻素材等,實現(xiàn)“一人即一支營銷團(tuán)隊”。例如某汽車直播間,數(shù)字人主播講解時,助播同步調(diào)出3D車型模型,轉(zhuǎn)化效率提升40%。
多模高度融合:可完美復(fù)刻真人與直播間裝修。百度研制數(shù)字人視頻生成大模型,將視頻、劇本、語音等多模態(tài)信號用于數(shù)字人高可控生成,再通過影空間對齊生成足夠時長的視頻內(nèi)容。
面向數(shù)字人場景的語音合成:基于文心大模型預(yù)測文本風(fēng)格、情緒及韻律起伏,通過文本自控語音合成大模型實現(xiàn)指令遵循合成,控制聲音效果平滑流暢,結(jié)合直播文本和發(fā)音人信息,合成自然流暢的聲音。
高說服力數(shù)字人應(yīng)用場景
電商直播:這是高說服力數(shù)字人的重要應(yīng)用領(lǐng)域。它能不知疲倦直播,覆蓋商品講解到氛圍引導(dǎo)全流程。如某美妝直播間,數(shù)字人導(dǎo)購轉(zhuǎn)化率比真人高25%;“溶溶精致生活”用慧播星數(shù)字人直播,月GMV達(dá)15萬+,收益提升30%;“美麗家居服工廠”GMV增長60%;美妝個護(hù)品牌“左顏右色”用數(shù)字人試妝展示,單場GMV達(dá)29萬+,直播間轉(zhuǎn)化率提升60%。數(shù)字人還能根據(jù)直播間實時反饋自動決策,如發(fā)放優(yōu)惠券、切換商品等。
其他領(lǐng)域:目前數(shù)字人系統(tǒng)正拓展到多行業(yè),廣泛應(yīng)用于法律、教育、金融、汽車等垂類場景。部分汽車經(jīng)銷商用數(shù)字人進(jìn)行車型介紹和互動問答;圖書直播中,數(shù)字人能引經(jīng)據(jù)典;健康產(chǎn)品帶貨時,能結(jié)合用戶血糖等數(shù)據(jù)個性化推薦。法律行業(yè)的“法在心間”,新增律師數(shù)字人項目,依托慧播星腳本創(chuàng)作和大模型知識儲備,精準(zhǔn)解答法律問題、規(guī)避風(fēng)險詞,上線后線索獲取成本降低75%,線索量提升近5倍。
高說服力數(shù)字人優(yōu)勢
低門檻:百度慧播星有“一鍵克隆”功能,用戶錄一段最短2分鐘的直播視頻上傳訓(xùn)練,就能擁有專屬數(shù)字人,人人可當(dāng)主播。還能用ai幫寫直播腳本,打造個性化直播間。
低成本:目前使用“高說服力數(shù)字人”直播月均成本控制在千元以內(nèi),比傳統(tǒng)直播節(jié)省約80%。系統(tǒng)技術(shù)成本也在下降,過去一年下降約三分之二。在百度站內(nèi),商家借助平臺扶持,幾乎零成本就能開播。
高說服力數(shù)字人使用教程
錄制視頻:打開百度APP,搜索“慧播星”,點擊“手機(jī)端一鍵開播”“創(chuàng)建數(shù)字人”。用手機(jī)錄制一段2-3分鐘的真人出鏡視頻,視頻要求全程露臉,無需準(zhǔn)備專業(yè)設(shè)備。
選擇或自定義人設(shè)、主題和腳本:在等待視頻上傳時,可以選擇慧播星準(zhǔn)備好的人設(shè),如情感咨詢、讀書分享等,AI會自動生成人設(shè)指南、直播主題和腳本。也可以自定義人設(shè),如塑身愛好者等,并選擇“AI幫我寫”腳本來生成相關(guān)內(nèi)容,整個腳本生成過程不到2分鐘。
等待數(shù)字人制作完成:制作時間一般在3小時左右,制作好后會通過短信通知,頁面也會提示開播時間。