MotionFollower:將一個視頻中的人物動作轉移到另一個視頻中的人物身上
在視頻編輯的動態(tài)領域,將運動從一個視頻無縫傳輸到另一個視頻的能力一直是人們渴望的功能。MotionFollower 作為一種突破性的解決方案出現,可以在保持原始視頻的背景和主角外觀的同時實現精確的運動編輯。這種輕量級的分數引導擴散模型重新定義了視頻動作編輯的可能性,提供無與倫比的性能和效率。
舉個例子,假設我們有兩個視頻:
源視頻:一段風景優(yōu)美的公園視頻,視頻中的主角是一位穿著紅色衣服的女性,她正在站著沒有動作。
目標視頻:一段舞蹈視頻,視頻中的主角是一位穿著藍色衣服的男性,他在跳舞。
使用MotionFollower,我們可以將目標視頻中男性的舞蹈動作轉移到源視頻中女性的身上。
同時在將運動信息轉移到源視頻中的人物時,保持源視頻中人物的外觀不變,包括他們的服裝、面貌等特征,只改變他們的動作。
技術見解:
MotionFollower 因解決了在不影響原始主角的外觀和背景的情況下修改視頻中的運動信息的挑戰(zhàn)而脫穎而出。 MotionFollower 利用輕量級信號控制器來控制姿勢和外觀,通過卷積塊將這些控制集成到去噪過程中,從而無需進行大量的注意力計算。該模型采用具有重建和編輯分支的兩分支架構,以確保保留紋理細節(jié)和復雜背景的分數指導原則為指導。
架構概述。在訓練中,兩個輕量級信號控制器和U-Net是可訓練的。
MotionFollower 的核心是能夠通過將目標姿勢和源外觀編碼為離散信號來操縱運動。分數引導原則增強了建模能力,在分數估計過程中注入適當的指導,以保持原始視頻和編輯視頻之間的一致性。這種方法可顯著減少 GPU 內存使用量(與 MotionEditor 等領先競爭對手相比最多可減少 80%),同時在處理大型攝像機運動和復雜背景方面提供卓越的性能。
我們的 MotionFollower 與其他最先進模型的定性比較
行業(yè)應用:
MotionFollower 的應用范圍遍及各個行業(yè)。在娛樂領域,它可以讓編輯人員將復雜的舞蹈動作或動作序列從參考視頻轉移到新內容,從而徹底改變視頻制作,無需大量重新拍攝即可創(chuàng)造令人驚嘆的視覺效果。在廣告中,品牌可以制作動態(tài)廣告,讓產品與不斷變化的環(huán)境互動,從而提高觀眾的參與度和創(chuàng)造力。此外,在運動分析領域,MotionFollower可用于分析運動員的動作,幫助教練和訓練師通過可視化和比較技術來制定更好的訓練計劃。
未來展望:
展望未來,MotionFollower 為視頻編輯技術的進一步進步奠定了基礎。未來的發(fā)展可能包括實時動作編輯功能,擴大其在現場直播和交互式虛擬現實體驗中的使用。人工智能驅動的增強功能的結合將繼續(xù)突破界限,允許對視頻內容進行更精確和更具創(chuàng)造性的控制。隨著技術的成熟,它將開啟視頻制作的新時代,想象力的限制是唯一的限制。
MotionFollower 不僅僅是一個工具;更是一個工具。它是視頻編輯創(chuàng)新的催化劑。通過提供輕量、高效、高效的動作傳遞解決方案,為各領域的創(chuàng)作者開辟了新的可能性。這一革命性的模型為視頻動態(tài)編輯樹立了新標準,使所有人都能進行復雜且高質量的編輯。