我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

Ai應用
Ai資訊
AI生圖
AI生視頻
AI數(shù)字人系統(tǒng)

首頁 > Ai資訊 > Ai產(chǎn)品

StarVector：用于生成可縮放矢量圖形的開源多模態(tài)視覺模型

映技派于2025-03-22發(fā)布在Ai產(chǎn)品

StarVector是什么？

StarVector 是一種由 ServiceNow Research、Mila - Quebec ai Institute 和 ETS Montreal 聯(lián)合開發(fā)的新型開源多模態(tài)視覺-語言模型，專門用于生成可縮放矢量圖形（SVG）。

StarVector：用于生成可縮放矢量圖形的開源多模態(tài)視覺模型.webp

StarVector核心功能

圖像到 SVG 的轉換（Image-to-SVG）：能夠將圖像直接轉換為 SVG 代碼，實現(xiàn)圖像的矢量化。
文本到 SVG 的生成（Text-to-SVG）：可以根據(jù)文本指令生成相應的 SVG 圖形。

StarVector技術特點

多模態(tài)架構：StarVector 采用多模態(tài)架構，能夠同時處理圖像和文本信息，將視覺和語言模型無縫集成。
直接操作 SVG 代碼空間：與一些中間表示方法不同，StarVector 直接在 SVG 代碼空間中操作，生成標準的、可編輯的 SVG 代碼。
大規(guī)模數(shù)據(jù)集訓練：StarVector 在包含超過 200 萬個 SVG 樣本的 SVG-Stack 數(shù)據(jù)集上進行訓練，確保模型能夠泛化到各種矢量化任務。
兩種規(guī)模模型：提供 StarVector-1B（包含 10 億參數(shù)）和 StarVector-8B（包含 80 億參數(shù)）兩種模型，以滿足不同計算資源和性能需求。

StarVector架構與原理

圖像編碼器：使用 Vision Transformer（ViT）處理圖像，將圖像分割成小塊并依次處理。
LLM 適配器：將圖像編碼器生成的嵌入向量非線性投影到視覺標記，以便與語言模型集成。
Transformer 解碼器架構：將視覺標記或文本標記序列映射到 SVG 代碼。

StarVector性能表現(xiàn)

在圖像到 SVG 和文本到 SVG 的任務中，StarVector 的性能優(yōu)于現(xiàn)有模型，例如在 SVG-Bench 基準測試中，StarVector-8B 在多個指標上均優(yōu)于 GPT-4 Vision（2023）和 Potrace 等模型。

在 SVG-Diagrams 數(shù)據(jù)集的圖像矢量化任務中，StarVector-8B 在 DinoScore 和 LPIPS 等指標上表現(xiàn)優(yōu)異。

StarVector應用場景

設計與創(chuàng)意領域：幫助設計師快速生成 SVG 文件，提高設計效率。
技術繪圖與圖表生成：能夠生成復雜的技術圖表和圖形，適用于工程、科學等領域。

StarVector相關鏈接

項目地址：https://starvector.github.io/

StarVector GitHub 倉庫：https://github.com/starvector

StarVector 論文：https://arxiv.org/html/2312.11556v3

收藏

Fin-R1：一款基于Qwen2.5的金融推理型大語言模型

上一篇

Fin-R1：一款基于Qwen2.5的金融推理型大語言模型

MusicInfuser：一個可以根據(jù)音樂和文本生成舞蹈視頻的模型

下一篇

MusicInfuser：一個可以根據(jù)音樂和文本生成舞蹈視頻的模型

相關文章

最新文章

最新工具

unDraw

美國設計師Katerina Limpitsouni創(chuàng)作的開源插畫...

Storyset

一個由知名素材平臺Freepik公司旗下的免費在線自定義矢量插畫...

Jigsaw Planet

一個數(shù)百萬免費在線拼圖平臺，用戶能直接通過瀏覽器創(chuàng)建、游玩和分享...

GeoFS

一款免費的網(wǎng)頁版多人飛行模擬器網(wǎng)站，只要瀏覽器就可以運行，不需要...

Avido AI

通過 AI 技術幫用戶生成適合 YouTube 和 TikTok...

表答AI

一款能抓取網(wǎng)頁內(nèi)容并能情感分析的數(shù)據(jù)分析產(chǎn)品，并把采集分析過程自...

Recaster AI

通過導入產(chǎn)品圖像或數(shù)據(jù)，生成定制的SEO內(nèi)容，支持從Shopif...

ScanPDF

一個能夠讓PDF看起來就像是掃描件一樣的在線免費工具。只需點擊鼠...

SkylineWebCams

在美洲、歐洲、亞洲、非洲及大洋洲59個國家，提供全球五大洲實時高...

Ezgif

一個簡單、免費的在線 GIF 制作工具和基礎動畫圖像編輯工具集，...

人生若只如初見

用戶登錄

主站蜘蛛池模板：南皮县| 无为县| 新闻| 本溪| 嘉善县| 定结县| 新巴尔虎右旗| 梓潼县| 通城县| 宜川县| 宁河县| 诏安县| 清流县| 望城县| 靖安县| 东辽县| 五寨县| 凤翔县| 利津县| 桓仁| 桐城市| 乌鲁木齐县| 邻水| 济阳县| 玉山县| 平定县| 齐河县| 许昌市| 和平县| 彰化市| 宁夏| 柘荣县| 漳浦县| 翁牛特旗| 乌拉特中旗| 武安市| 合川市| 岱山县| 三穗县| 山西省| 三台县|