Stability AI發(fā)布新圖片生成模型Stable Cascade
文生圖領(lǐng)域的領(lǐng)先公司 Stability AI 最近發(fā)布了一款名為 Stable Cascade 的新模型,這是一個(gè)基于 Würstchen 架構(gòu)的文本生成圖像模型。除了提供檢查點(diǎn)和推理腳本之外,Stability ai還發(fā)布了用于微調(diào)、ControlNet 和 LoRA 培訓(xùn)的腳本,使用戶能夠進(jìn)一步試驗(yàn)這種新架構(gòu),可以在 Stability GitHub 頁(yè)面上找到該架構(gòu)。
Stability AI承諾Stable Cascade比其行業(yè)領(lǐng)先的前身 Stable Diffusion 更快、更強(qiáng)大,后者是許多其他文本到圖像生成 AI 工具的基礎(chǔ)。
Stable Cascade是什么?
Stable Cascade 是一種文本到圖像生成模型,可以從自然語(yǔ)言提示中生成逼真且多樣化的圖像。
Stable Cascade 可以生成照片并可以進(jìn)行各種圖像編輯任務(wù),或嘗試提高現(xiàn)有圖片的分辨率。例如提高現(xiàn)有圖像的分辨率、修改圖像的特定部分或從另一個(gè)圖像的邊緣創(chuàng)建新圖像。
除了標(biāo)準(zhǔn)的文本到圖像生成之外,Stable Cascade 還可以執(zhí)行圖像變化和圖像到圖像生成。
跟隨模型一起發(fā)布的 Controlnet功能:
局部重繪:輸入與文本提示附帶的蒙版配對(duì)的圖像。該模型根據(jù)提供的文本提示填充圖像的遮罩部分。
Canny Edge:通過跟蹤輸入到模型的現(xiàn)有圖像的邊緣來(lái)生成新圖像。該測(cè)試也可以從草圖進(jìn)行擴(kuò)展。
2x超分辨率:也可用于C階段生成的潛在空間。
我在哪里可以找到 Stable Cascade,我可以用它做什么?
Stable Cascade 目前在 GitHub 上僅用于研究目的,不用于商業(yè)用途。
Stable Cascade github源碼庫(kù):https://github.com/Stability-AI/StableCascade
Stability AI 提供了一個(gè) Colab 筆記本,演示了如何使用 Stable Cascade 進(jìn)行各種圖像生成和編輯任務(wù)。您還可以在他們的網(wǎng)站上瀏覽 Stable Cascade 生成的一些圖像示例。
Stable Cascade 是一種多功能模型,可用于各種應(yīng)用,例如內(nèi)容創(chuàng)作、設(shè)計(jì)、教育、娛樂等。例如,您可以使用 Stable Cascade 生成虛構(gòu)人物、風(fēng)景、動(dòng)物、徽標(biāo)或任何其他可以用文本描述的圖像。
您還可以使用“穩(wěn)定級(jí)聯(lián)”來(lái)增強(qiáng)或修改現(xiàn)有圖像,例如提高其分辨率、更改其樣式、添加或刪除對(duì)象或從其邊緣創(chuàng)建新圖像。