我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

SignLLM:第一個(gè)多語種手語生成模型

method.jpg

SignLLM,第一個(gè)多語種手語生成模型,可以將輸入的文本或提示轉(zhuǎn)化為相應(yīng)的手語手勢視頻。SignLLM通過先進(jìn)的ai技術(shù)生成和翻譯多種手語。SignLLM引入了首個(gè)多語言手語數(shù)據(jù)集,名為 Prompt2Sign,并基于此數(shù)據(jù)集開發(fā)了多種生成手語的模型。此數(shù)據(jù)集將大量視頻轉(zhuǎn)化為便于模型訓(xùn)練的格式,優(yōu)化了如 seq2seq 和 text2text 等翻譯模型的訓(xùn)練?;谶@些數(shù)據(jù)集,我們展示了 SignLLM 的基準(zhǔn)結(jié)果,表明我們的模型在八種手語的手語生成任務(wù)中達(dá)到了最先進(jìn)的性能。

SignLLM受到在廣泛的多語言文本語料庫上訓(xùn)練的大型語言模型 (LLMs) 強(qiáng)大翻譯能力的啟發(fā),我們的目標(biāo)是利用現(xiàn)成的 LLMs 來處理 SLT。在本文中,我們對(duì)手語視頻進(jìn)行規(guī)范化以體現(xiàn)口語的語言特征,并提出了一種新穎的 SignLLM 框架,將手語視頻轉(zhuǎn)換為類似語言的表示形式,以提高現(xiàn)成的 LLMs 的可讀性。 

SignLLM 包含兩個(gè)關(guān)鍵模塊:

1、矢量量化視覺符號(hào)模塊將符號(hào)視頻轉(zhuǎn)換為一系列離散字符級(jí)符號(hào)標(biāo)記。

2、代碼本重建和對(duì)齊模塊將這些字符級(jí)標(biāo)記轉(zhuǎn)換為單詞級(jí)使用最佳傳輸公式進(jìn)行符號(hào)表示。符號(hào)-文本對(duì)齊損失進(jìn)一步彌合了符號(hào)和文本標(biāo)記之間的差距,增強(qiáng)了語義兼容性。我們?cè)趦蓚€(gè)廣泛使用的 SLT 基準(zhǔn)測試中取得了最先進(jìn)的無光澤結(jié)果。

SignLLM GITHUB地址:https://signllm.github.io/

收藏

相關(guān)文章

最新工具
Quick Prompt
Quick Prompt

一個(gè)專注于提示詞(Prompt)的管理和快速輸入的瀏覽器擴(kuò)展插件...

FoldNFly
FoldNFly

一個(gè)專注于紙飛機(jī)折疊教程的網(wǎng)站,提供豐富的紙飛機(jī)設(shè)計(jì)資源、制作指...

VoiceCanvas
VoiceCanvas

一款文本轉(zhuǎn)語音工具,支持 50 多種語言,具備語音克隆功能,僅需...

Loud Fame
Loud Fame

一款A(yù)I視頻生成和編輯工具,能夠?qū)⑵胀ㄒ曨l轉(zhuǎn)換為具有動(dòng)漫風(fēng)格的視...

PPT世界
PPT世界

QIJ鰭跡旗下產(chǎn)品,集PPT模板下載、設(shè)計(jì)教程、交流社區(qū)和定制服...

職達(dá)AI簡歷
職達(dá)AI簡歷

一個(gè)專業(yè)的 AI 簡歷優(yōu)化平臺(tái),提供簡歷&求職一站式服務(wù)...

喵記多APP
喵記多APP

快手推出的邊聊天邊記錄的AI筆記,主要功能包括管理筆記,如剪藏、...

暢圖
暢圖

一款由摹客推出的AI原生可視化工具,專為個(gè)人和團(tuán)隊(duì)的創(chuàng)意表達(dá)、知...

Ztalk ai
Ztalk ai

一個(gè)AI驅(qū)動(dòng)的會(huì)議實(shí)時(shí)語音翻譯平臺(tái),可以與 Zoom、Googl...

Supercut
Supercut

一款屏幕錄制工具,能幫你快速錄下屏幕上的內(nèi)容,錄制的視頻可以自動(dòng)...

主站蜘蛛池模板: 嘉善县| 永寿县| 高陵县| 贺兰县| 桃源县| 永州市| 赣榆县| 贡山| 宁津县| 珠海市| 西丰县| 松潘县| 涞水县| 营口市| 公安县| 日喀则市| 宜阳县| 五莲县| 涡阳县| 鱼台县| 冷水江市| 资阳市| 静安区| 延边| 永宁县| 芜湖市| 青神县| 盘山县| 巴塘县| 平遥县| 眉山市| 保定市| 新建县| 玉溪市| 奇台县| 房山区| 敖汉旗| 平乡县| 府谷县| 确山县| 涿鹿县|