我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

SignLLM:第一個多語種手語生成模型

method.jpg

SignLLM,第一個多語種手語生成模型,可以將輸入的文本或提示轉化為相應的手語手勢視頻。SignLLM通過先進的ai技術生成和翻譯多種手語。SignLLM引入了首個多語言手語數(shù)據(jù)集,名為 Prompt2Sign,并基于此數(shù)據(jù)集開發(fā)了多種生成手語的模型。此數(shù)據(jù)集將大量視頻轉化為便于模型訓練的格式,優(yōu)化了如 seq2seq 和 text2text 等翻譯模型的訓練。基于這些數(shù)據(jù)集,我們展示了 SignLLM 的基準結果,表明我們的模型在八種手語的手語生成任務中達到了最先進的性能。

SignLLM受到在廣泛的多語言文本語料庫上訓練的大型語言模型 (LLMs) 強大翻譯能力的啟發(fā),我們的目標是利用現(xiàn)成的 LLMs 來處理 SLT。在本文中,我們對手語視頻進行規(guī)范化以體現(xiàn)口語的語言特征,并提出了一種新穎的 SignLLM 框架,將手語視頻轉換為類似語言的表示形式,以提高現(xiàn)成的 LLMs 的可讀性。 

SignLLM 包含兩個關鍵模塊:

1、矢量量化視覺符號模塊將符號視頻轉換為一系列離散字符級符號標記。

2、代碼本重建和對齊模塊將這些字符級標記轉換為單詞級使用最佳傳輸公式進行符號表示。符號-文本對齊損失進一步彌合了符號和文本標記之間的差距,增強了語義兼容性。我們在兩個廣泛使用的 SLT 基準測試中取得了最先進的無光澤結果。

SignLLM GITHUB地址:https://signllm.github.io/

收藏

相關文章

最新工具
CodeBuff
CodeBuff

一款在終端使用的 AI 編程工具,它能夠快速索引代碼庫、精準地編...

百度Comate AI IDE
百度Comate AI IDE

百度推出的文心快碼獨立AI原生開發(fā)環(huán)境工具,這是行業(yè)內(nèi)首個具備多...

unDraw
unDraw

美國設計師Katerina Limpitsouni創(chuàng)作的開源插畫...

Storyset
Storyset

一個由知名素材平臺Freepik公司旗下的免費在線自定義矢量插畫...

Jigsaw Planet
Jigsaw Planet

一個數(shù)百萬免費在線拼圖平臺,用戶能直接通過瀏覽器創(chuàng)建、游玩和分享...

GeoFS
GeoFS

一款免費的網(wǎng)頁版多人飛行模擬器網(wǎng)站,只要瀏覽器就可以運行,不需要...

Avido AI
Avido AI

通過 AI 技術幫用戶生成適合 YouTube 和 TikTok...

表答AI
表答AI

一款能抓取網(wǎng)頁內(nèi)容并能情感分析的數(shù)據(jù)分析產(chǎn)品,并把采集分析過程自...

Recaster AI
Recaster AI

通過導入產(chǎn)品圖像或數(shù)據(jù),生成定制的SEO內(nèi)容,支持從Shopif...

ScanPDF
ScanPDF

一個能夠讓PDF看起來就像是掃描件一樣的在線免費工具。只需點擊鼠...

主站蜘蛛池模板: 双柏县| 乐昌市| 和硕县| 东宁县| 光泽县| 新河县| 高邮市| 江北区| 乐昌市| 永城市| 衡南县| 东平县| 大港区| 台中县| 惠水县| 洛隆县| 顺义区| 肃宁县| 泌阳县| 墨竹工卡县| 淮南市| 民勤县| 吉安市| 广灵县| 蒙自县| 东兴市| 英德市| 临邑县| 五原县| 新野县| 始兴县| 容城县| 龙山县| 江永县| 乡城县| 庆元县| 云南省| 五家渠市| 姜堰市| 腾冲县| 永兴县|