我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

SignLLM:第一個多語種手語生成模型

method.jpg

SignLLM,第一個多語種手語生成模型,可以將輸入的文本或提示轉化為相應的手語手勢視頻。SignLLM通過先進的ai技術生成和翻譯多種手語。SignLLM引入了首個多語言手語數據集,名為 Prompt2Sign,并基于此數據集開發了多種生成手語的模型。此數據集將大量視頻轉化為便于模型訓練的格式,優化了如 seq2seq 和 text2text 等翻譯模型的訓練。基于這些數據集,我們展示了 SignLLM 的基準結果,表明我們的模型在八種手語的手語生成任務中達到了最先進的性能。

SignLLM受到在廣泛的多語言文本語料庫上訓練的大型語言模型 (LLMs) 強大翻譯能力的啟發,我們的目標是利用現成的 LLMs 來處理 SLT。在本文中,我們對手語視頻進行規范化以體現口語的語言特征,并提出了一種新穎的 SignLLM 框架,將手語視頻轉換為類似語言的表示形式,以提高現成的 LLMs 的可讀性。 

SignLLM 包含兩個關鍵模塊:

1、矢量量化視覺符號模塊將符號視頻轉換為一系列離散字符級符號標記。

2、代碼本重建和對齊模塊將這些字符級標記轉換為單詞級使用最佳傳輸公式進行符號表示。符號-文本對齊損失進一步彌合了符號和文本標記之間的差距,增強了語義兼容性。我們在兩個廣泛使用的 SLT 基準測試中取得了最先進的無光澤結果。

SignLLM GITHUB地址:https://signllm.github.io/

收藏

相關文章

最新工具
PrettyScale
PrettyScale

一個在線面部分析及顏值打分網站,用戶通過上傳照片或直接用攝像頭參...

圓周旅跡
圓周旅跡

一款旅游出行AI智能規劃APP,它可以直接從小紅書這些平臺導入別...

Wonderplan AI
Wonderplan AI

一個免費的AI旅游規劃工具,能根據你的喜好、需求生成專屬行程,支...

智寫流程
智寫流程

一個能自動記錄網頁操作并生成操作指南的工具。它能捕捉鼠標點擊、鍵...

ReactBits
ReactBits

一個免費開源的動畫化、可交互React組件庫,里面有好多動畫化、...

電視眼
電視眼

也叫TV眼,是一個在線網絡電視直播網站,提供全國5000+個電視...

Excel Dashboard Ai
Excel Dashboard Ai

一款能自動把 Excel 或 CSV 文件變成帶交互功能的儀表盤...

ByRutor
ByRutor

俄羅斯的一個免費游戲資源下載網站,提供超23,000多款游戲,涵...

RandomStreetView
RandomStreetView

一個可以隨機展示全球谷歌街景照片的網站,每次點按鈕,系統會隨機選...

ZType
ZType

官網:zty.pe,一個把打字練習和射擊游戲結合的在線工具。玩家...

主站蜘蛛池模板: 神池县| 安岳县| 江孜县| 杨浦区| 文昌市| 岐山县| 巴林右旗| 海阳市| 西吉县| 黎平县| 甘洛县| 高淳县| 富川| 抚州市| 镇沅| 滨海县| 汉阴县| 天镇县| 榆树市| 清新县| 盈江县| 壶关县| 克什克腾旗| 门头沟区| 和静县| 北川| 赤城县| 峨眉山市| 鄯善县| 壤塘县| 建阳市| 凉城县| 古交市| 皋兰县| 辽阳市| 共和县| 远安县| 张北县| 乌海市| 富阳市| 马关县|