
智譜清影
智譜清影簡介
智譜清影是智譜ai最新推出的AI視頻生成工具,智譜清影支持文本生成視頻和圖像生成視頻兩種模式,能夠快速生成6秒,分辨率高達1440x960的視頻內容,僅需30秒的時間。
智譜清影基于多模態大模型技術底座構建,其核心視頻生成模型為CogVideoX,采用了新型DiT架構,可以更高效地壓縮視頻信息,并融合文本、時間和空間三個維度。此外,智譜清影還具備較高的可控性,用戶可以通過語言控制生成的視頻內容。
智譜清影亮點與特性:
文生視頻:用戶輸入文本描述或腳本,AI根據這些文本信息生成視頻內容。
圖生視頻:用戶上傳一張或多張靜態圖像,AI分析圖像內容后生成動態視頻。
添加背景音樂:支持為生成的視頻添加背景音樂,包括安靜、輕松歡快、傷感、史詩、搞怪等類型。
快速生成: 與市場上其他同類產品相比,清影能夠顯著縮短生成視頻的時間。用戶僅需等待約30秒,就能獲得一段6秒的視頻,推理時間從以往的分鐘級壓縮到了秒級,大大提高了效率。
高可控性: 清影通過優化技術和自研的端到端視頻理解模型,提升了對用戶指令的遵循能力,使得生成的視頻更貼近用戶的創意意圖。用戶通過詳細描述場景、鏡頭語言和細節,可以得到滿意的結果,減少了“試錯”次數。
風格多樣: 用戶可以選擇不同的風格進行創作,包括但不限于卡通3D、黑白、油畫和電影感等,滿足個性化和創意表達的需求。
全民可用: 清影智能體對所有用戶開放,無論是普通用戶還是開發者,都能輕松使用。企業和開發者還可以通過API調用,集成文生視頻和圖生視頻能力到自己的應用中。
自帶配樂: 清影還提供配樂功能,用戶生成的視頻可以自動配上音樂,簡化了視頻創作流程,使得即便是沒有專業技能的用戶也能快速產出有聲有色的視頻內容。
技術基礎: 清影背后的技術支撐是智譜AI自研的視頻生成大模型CogVideoX,該模型采用了類似于Sora的DiT結構,能夠融合文本、時間和空間信息,優化后的模型推理速度比前代提升了6倍。
智譜清影技術特點:
快速生成:僅需30秒即可完成6秒視頻的生成。
高效的指令遵循能力:即使是復雜的prompt,清影也能準確理解并執行。
內容連貫性:生成的視頻能夠較好地還原物理世界中的運動過程。
畫面調度靈活性:例如,鏡頭能夠流暢地跟隨畫面中的三只狗狗移動。
智譜清影行業應用:
廣告制作
電影剪輯
短視頻制作
創意內容創作
如何使用智譜清影生成視頻?
1、訪問平臺:打開智譜清言官網 chatglm.cn/video,注冊并登錄賬號。
2、選擇生成方式:在清影智能體中選擇“AI文生視頻”或“AI圖生視頻”功能。
3、輸入提示詞:
文生視頻:輸入詳細的文本描述或腳本。提示詞越詳細,生成的視頻質量越高。例如,與其輸入“一個小男孩喝咖啡”,不如輸入“攝影機平移,一個小男孩坐在公園的長椅上,手里拿著一杯熱氣騰騰的咖啡。他穿著一件藍色的襯衫,看起來很愉快,背景是綠樹成蔭的公園,陽光透過樹葉灑在男孩身上”。
圖生視頻:上傳一張或多張靜態圖像,并選擇圖像風格。可以使用清影提供的智能體來生成提示詞,確保描述準確且詳細。
4、選擇視頻風格和參數:選擇想要生成的視頻風格,包括卡通3D、黑白、油畫、電影感等。還可以設置情感氛圍和運鏡方式。
5、添加背景音樂:清影支持為生成的視頻添加背景音樂,包括安靜、輕松歡快、傷感、史詩、搞怪等類型。
6、生成視頻:點擊生成視頻按鈕,預計排隊1分鐘左右,即可生成視頻結果。清影能夠在30秒內完成6秒視頻的生成。
7、優化提示詞:
提示詞結構要盡可能清晰,復雜公式可以包括鏡頭語言、光影、主體描述、主體運動、場景描述和情緒/氛圍。例如:“攝影機平移,一個小男孩坐在公園的長椅上,手里拿著一杯熱氣騰騰的咖啡。他穿著一件藍色的襯衫,看起來很愉快,背景是綠樹成蔭的公園,陽光透過樹葉灑在男孩身上”。
智譜清影與其他AI視頻生成工具相比,智譜清影能夠在30秒內生成6秒的視頻內容,這比許多其他AI視頻生成工具要快得多。例如,目前處于第一梯隊的可靈AI生成單個5秒視頻一般需要2到5分鐘。
在首發測試期間,智譜清影對企業和開發者開放API調用式體驗,同時向所有C端用戶提供免費試用服務。