VideoPainter:騰訊等開(kāi)源的支持任意長(zhǎng)度視頻修復(fù)編輯工具,支持通過(guò)文字指令實(shí)現(xiàn)視頻編輯
VideoPainter是什么
VideoPainter是由香港中文大學(xué)、騰訊ARC Lab、東京大學(xué)和澳門大學(xué)等機(jī)構(gòu)聯(lián)合推出的開(kāi)源視頻修復(fù)和編輯框架,能處理任意長(zhǎng)度的視頻內(nèi)容。它通過(guò)創(chuàng)新的雙分支架構(gòu)、輕量級(jí)上下文編碼器和預(yù)訓(xùn)練的擴(kuò)散模型,能夠高效地處理任意長(zhǎng)度的視頻修復(fù)任務(wù),支持通過(guò)文字指令實(shí)現(xiàn)視頻編輯,輸入提示詞,它就會(huì)自動(dòng)識(shí)別需要修改的視頻內(nèi)容并完成修改,支持長(zhǎng)視頻,適用于DiT模型。
VideoPainter核心功能
任意長(zhǎng)度視頻修復(fù):可處理各種時(shí)長(zhǎng)的視頻,修復(fù)遮擋或損壞部分。
背景保留與前景生成:借助雙分支架構(gòu),精準(zhǔn)保留背景并高質(zhì)量生成前景。
文本指導(dǎo)視頻編輯:能通過(guò)文本指令對(duì)視頻進(jìn)行添加、刪除等編輯操作。
對(duì)象一致性維持:長(zhǎng)視頻中保持對(duì)象身份一致,避免漂移或突變。
插件式控制:可與不同擴(kuò)散模型或LoRA結(jié)合,滿足多樣編輯需求。
VideoPainter技術(shù)原理
雙分支架構(gòu):把視頻修復(fù)任務(wù)分成背景處理和前景生成兩部分,提高效率且避免信息混淆。
目標(biāo)區(qū)域ID重采樣:推理階段將前一視頻片段遮罩區(qū)域特征拼接到當(dāng)前片段,保持長(zhǎng)視頻中對(duì)象一致性。
插件式控制:支持多種風(fēng)格化骨干網(wǎng)絡(luò)或LoRA,兼容T2V和I2V擴(kuò)散模型,方便用戶選基礎(chǔ)模型。
VideoPainter能修復(fù)的視頻損傷類型
遮擋區(qū)域畫(huà)面。
因編碼錯(cuò)誤或損壞產(chǎn)生的畫(huà)面問(wèn)題。
長(zhǎng)視頻中的對(duì)象漂移問(wèn)題。
背景與前景不平衡問(wèn)題。
根據(jù)文字指令進(jìn)行修復(fù)編輯。
VideoPainter應(yīng)用場(chǎng)景
影視修復(fù)制作:修復(fù)老電影、電視劇損壞畫(huà)面。
廣告營(yíng)銷:快速生成視頻,添加或替換背景、道具。
視頻創(chuàng)作直播:實(shí)時(shí)修復(fù)視頻錯(cuò)誤或干擾。
VR與AR應(yīng)用:生成沉浸式視頻,修復(fù)或修改虛擬場(chǎng)景。
教育培訓(xùn):制作教學(xué)視頻,修復(fù)古籍影像。
VideoPainter使用方法
下載安裝:訪問(wèn)VideoPainter的GitHub項(xiàng)目頁(yè)面,下載源代碼壓縮包并解壓。
環(huán)境配置:確保計(jì)算機(jī)滿足系統(tǒng)要求,安裝所需Python包(通常運(yùn)行 pip install -r requirements.txt)。
運(yùn)行程序:打開(kāi)終端或命令提示符,進(jìn)入解壓后的項(xiàng)目目錄,運(yùn)行 python main.py ,可能需提供命令行參數(shù)。
使用界面:?jiǎn)?dòng)Gradio界面進(jìn)行視頻修復(fù)、編輯,若沒(méi)有,需通過(guò)命令行交互。
高級(jí)功能:了解并使用雙分支架構(gòu)、目標(biāo)區(qū)域ID重采樣和插件式控制等高級(jí)功能優(yōu)化效果。
保存導(dǎo)出:處理完成后保存導(dǎo)出修復(fù)后的視頻,選合適格式和質(zhì)量設(shè)置。
相關(guān)鏈接
項(xiàng)目官網(wǎng):https://yxbian23.github.io/project/video-painter/
GitHub倉(cāng)庫(kù):https://github.com/TencentARC/VideoPainter
HuggingFace模型庫(kù):https://huggingface.co/TencentARC/VideoPainter
arXiv技術(shù)論文:https://arxiv.org/pdf/2503.05639