日韩一区二区三区在线免费观看-开心久久婷婷综合中文字幕-欧美激情91-久久国产福利-欧美日韩日本国产亚洲在线-国产精品极品国产中出

谷歌下場(chǎng)優(yōu)化擴(kuò)散模型,三星手機(jī)運(yùn)行 Stable Diffusion,12 秒內(nèi)出圖

2023-04-27 14:26:16來(lái)源:ZAKER科技  

機(jī)器之心報(bào)道

編輯:陳萍、小舟


(資料圖片僅供參考)

Speed Is All You Need:谷歌提出針對(duì) Stable Diffusion 一些優(yōu)化建議,生成圖片速度快速提升。

Stable Diffusion 在圖像生成領(lǐng)域的知名度不亞于對(duì)話大模型中的 ChatGPT。其能夠在幾十秒內(nèi)為任何給定的輸入文本創(chuàng)建逼真圖像。由于 Stable Diffusion 的參數(shù)量超過(guò) 10 億,并且由于設(shè)備上的計(jì)算和內(nèi)存資源有限,因而這種模型主要運(yùn)行在云端。

在沒(méi)有精心設(shè)計(jì)和實(shí)施的情況下,在設(shè)備上運(yùn)行這些模型可能會(huì)導(dǎo)致延遲增加,這是由于迭代降噪過(guò)程和內(nèi)存消耗過(guò)多造成的。

如何在設(shè)備端運(yùn)行 Stable Diffusion 引起了大家的研究興趣,此前,有研究者開(kāi)發(fā)了一個(gè)應(yīng)用程序,該應(yīng)用在 iPhone 14 Pro 上使用 Stable Diffusion 生成圖片僅需一分鐘,使用大約 2GiB 的應(yīng)用內(nèi)存。

此前蘋(píng)果也對(duì)此做了一些優(yōu)化,他們?cè)?iPhone、iPad、Mac 等設(shè)備上,半分鐘就能生成一張分辨率 512x512 的圖像。高通緊隨其后,在安卓手機(jī)端運(yùn)行 Stable Diffusion v1.5 ,不到 15 秒生成分辨率 512x512 的圖像。

近日,谷歌發(fā)表的一篇論文中《 Speed Is All You Need: On-Device Acceleration of Large Diffusion Models via GPU-Aware Optimizations 》,他們實(shí)現(xiàn)了在 GPU 驅(qū)動(dòng)的設(shè)備上運(yùn)行 Stable Diffusion 1.4 ,達(dá)到 SOTA 推理延遲性能(在三星 S23 Ultra 上,通過(guò) 20 次迭代生成 512 × 512 的圖像僅需 11.5 秒)。此外,該研究不是只針對(duì)一種設(shè)備;相反,它是一種通用方法,適用于改進(jìn)所有潛在擴(kuò)散模型。

在沒(méi)有數(shù)據(jù)連接或云服務(wù)器的情況下,這項(xiàng)研究為在手機(jī)上本地運(yùn)行生成 AI 開(kāi)辟了許多可能性。Stable Diffusion 去年秋天才發(fā)布,今天已經(jīng)可以塞進(jìn)設(shè)備運(yùn)行,可見(jiàn)這個(gè)領(lǐng)域發(fā)展速度有多快。

論文地址:https://arxiv.org/pdf/2304.11267.pdf

為了達(dá)到這一生成速度,谷歌提出了一些優(yōu)化建議,下面我們看看谷歌是如何優(yōu)化的。

方法介紹

該研究旨在提出優(yōu)化方法來(lái)提高大型擴(kuò)散模型文生圖的速度,其中針對(duì) Stable Diffusion 提出一些優(yōu)化建議,這些優(yōu)化建議也適用于其他大型擴(kuò)散模型。

首先來(lái)看一下 Stable Diffusion 的主要組成部分,包括:文本嵌入器(text embedder)、噪聲生成(noise generation)、去噪神經(jīng)網(wǎng)絡(luò)(denoising neural network)和圖像解碼器(image decoder,如下圖 1 所示。

然后我們具體看一下該研究提出的三種優(yōu)化方法。

專用內(nèi)核:Group Norm 和 GELU

組歸一化(GN)方法的工作原理是將特征圖的通道(channel)劃分為更小的組,并獨(dú)立地對(duì)每個(gè)組進(jìn)行歸一化,從而使 GN 對(duì)批大小的依賴性降低,更適合各種批大小和網(wǎng)絡(luò)架構(gòu)。該研究沒(méi)有按順序執(zhí)行 reshape、取均值、求方差、歸一化這些操作,而是設(shè)計(jì)了一個(gè)獨(dú)特的 GPU shader 形式的內(nèi)核,它可以在一個(gè) GPU 命令中執(zhí)行所有這些操作,而無(wú)需任何中間張量(tensor)。

高斯誤差線性單元(GELU)作為常用的模型激活函數(shù),包含大量數(shù)值計(jì)算,例如乘法、加法和高斯誤差函數(shù)。該研究用一個(gè)專用的 shader 來(lái)整合這些數(shù)值計(jì)算及其伴隨的 split 和乘法操作,使它們能夠在單個(gè) AI 作畫(huà)調(diào)用中執(zhí)行。

提高注意力模塊的效率

Stable Diffusion 中的文本到圖像 transformer 有助于對(duì)條件分布進(jìn)行建模,這對(duì)于文本到圖像生成任務(wù)至關(guān)重要。然而,由于內(nèi)存復(fù)雜性和時(shí)間復(fù)雜度,自 / 交叉注意力機(jī)制在處理長(zhǎng)序列時(shí)遇到了困難。基于此,該研究提出兩種優(yōu)化方法,以緩解計(jì)算瓶頸。

一方面,為了避免在大矩陣上執(zhí)行整個(gè) softmax 計(jì)算,該研究使用一個(gè) GPU shader 來(lái)減少運(yùn)算操作,大大減少了中間張量的內(nèi)存占用和整體延遲,具體方法如下圖 2 所示。

另一方面,該研究采用 FlashAttention [ 7 ] 這種 IO 感知的精確注意力算法,使得高帶寬內(nèi)存(HBM)的訪問(wèn)次數(shù)少于標(biāo)準(zhǔn)注意力機(jī)制,提高了整體效率。

Winograd 卷積

Winograd 卷積將卷積運(yùn)算轉(zhuǎn)換為一系列矩陣乘法。這種方法可以減少許多乘法運(yùn)算,提高計(jì)算效率。但是,這樣一來(lái)也會(huì)增加內(nèi)存消耗和數(shù)字錯(cuò)誤,特別是在使用較大的 tile 時(shí)。

Stable Diffusion 的主干在很大程度上依賴于 3 × 3 卷積層,尤其是在圖像解碼器中,它們占了 90% 。該研究對(duì)這一現(xiàn)象進(jìn)行了深入分析,以探索在 3 × 3 內(nèi)核卷積上使用不同 tile 大小的 Winograd 的潛在好處。研究發(fā)現(xiàn) 4 × 4 的 tile 大小最佳,因?yàn)樗谟?jì)算效率和內(nèi)存利用率之間提供了最佳平衡。

實(shí)驗(yàn)

該研究在各種設(shè)備上進(jìn)行了基準(zhǔn)測(cè)試:三星 S23 Ultra(Adreno 740)和 iPhone 14 Pro Max(A16)。基準(zhǔn)測(cè)試結(jié)果如下表 1 所示:

很明顯,隨著每個(gè)優(yōu)化被激活,延遲逐漸減少(可理解為生成圖像時(shí)間減少)。具體而言,與基線相比:在三星 S23 Ultra 延遲減少 52.2%;iPhone 14 Pro Max 延遲減少 32.9%。此外,該研究還對(duì)三星 S23 Ultra 端到端延遲進(jìn)行評(píng)估,在 20 個(gè)去噪迭代 step 內(nèi),生成 512 × 512 像素圖像,不到 12 秒就達(dá)到 SOTA 結(jié)果。

小型設(shè)備可以運(yùn)行自己的生成式人工智能模型,這對(duì)未來(lái)意味著什么?我們可以期待一波。

關(guān)鍵詞:

責(zé)任編輯:hnmd003

相關(guān)閱讀

相關(guān)閱讀

精彩推送

推薦閱讀

国产综合精品一区| 六月丁香婷婷色狠狠久久| 亚洲一区视频| 欧美成人黄色| 1769国产精品视频| 日韩视频免费| 日韩高清不卡一区二区| 精品国产中文字幕第一页 | 日韩视频在线一区二区三区| 香蕉成人av| 日韩av一二三| 人禽交欧美网站| 国内精品亚洲| 91成人超碰| 日日夜夜免费精品| 欧美色婷婷久久99精品红桃| 福利一区二区免费视频| 国产精品巨作av| 日本黄色免费在线| 日韩黄色一级片| 免费人成黄页网站在线一区二区| 91麻豆精品| 日韩视频一区二区三区在线播放免费观看| 亚洲高清资源| 99久久99热这里只有精品| 午夜av成人| 青青操综合网| 亚洲国产导航| 国产精品7m凸凹视频分类| 久久国产三级| 亚洲天堂久久| 国产精品第十页| 国产香蕉精品| 蜜臀精品一区二区三区在线观看| 欧美理论电影在线精品| av在线私库| 精品久久亚洲| 中文另类视频| 美女网站色精品尤物极品姐弟| 精品欧美日韩精品| 久久久久国产精品午夜一区| 欧美视频精品| 亚洲午夜一级| 欧美黄在线观看| 蜜臀久久久99精品久久久久久| 国产真实有声精品录音| 97精品国产| 青青草97国产精品麻豆| 久久精品亚洲| 日韩视频二区| 久久69av| 国产精品成人国产| 在线国产一区| 亚洲视频分类| 丁香久久综合| 一级欧洲+日本+国产| 国产在线观看91一区二区三区| 9999国产精品| 久久国产综合| 国产精品中文| 欧美日韩在线精品一区二区三区激情综合| 日本精品影院| 国产精品视频一区视频二区| 伊人久久视频| 国产精品99久久| 日韩成人伦理电影在线观看| 国产亚洲精品精品国产亚洲综合| 欧美日韩少妇| 亚洲人成毛片在线播放女女| 91欧美极品| 六月丁香婷婷久久| 免费精品99久久国产综合精品| 91精品丝袜国产高跟在线| 青草国产精品久久久久久| 日本欧美一区二区三区乱码| а天堂中文最新一区二区三区| 蜜桃伊人久久| 99久久人爽人人添人人澡| 国产欧美一区二区三区国产幕精品| 亚洲中字黄色| 精品久久亚洲| 欧洲一级精品| 六月婷婷一区| 欧美一区二区三区激情视频 | 亚洲精选91| 日韩国产一区二区三区| 欧美日韩国产免费观看| 亚洲精品不卡在线观看| 国产精品一级在线观看| 久久精品国产亚洲aⅴ| 97精品国产| 99视频一区| 欧美亚洲激情| 国产毛片久久久| 日日狠狠久久偷偷综合色| 麻豆精品视频在线观看免费| 美女一区网站| 日韩av有码| 夜夜夜久久久| 欧美中文字幕一区二区| 国产成人福利av| 日韩av综合| 国产欧美日韩免费观看| 亚洲理伦在线| 日韩国产欧美在线视频| 欧美片第1页| 黑人巨大精品欧美一区二区桃花岛| 亚洲激情精品| 久久不射2019中文字幕| 综合亚洲自拍| 欧美精品国产一区二区| 久久精品国产精品亚洲精品| 日韩视频网站在线观看| 中国色在线日|韩| 国产精品99久久精品| 激情久久久久| 精品久久久久久久久久久aⅴ| 香港久久久电影| 日本在线中文字幕一区| 国产精品日本一区二区不卡视频 | 国产伦精品一区二区三区在线播放| 亚洲精品国产setv| 怕怕欧美视频免费大全| 国产一区二区三区天码| 欧美欧美黄在线二区| 国产欧美日韩精品一区二区三区 | 丝袜亚洲另类丝袜在线| 久久国产福利| 日产精品一区二区| 91日韩欧美| 日韩欧美一区免费| 日韩精品第一| 久久精品久久久精品美女| 日韩和欧美一区二区三区| 亚洲人成人一区二区三区| 中文字幕一区二区三区在线视频 | 国产韩国精品一区二区三区| 天天射成人网| 日韩在线一区二区| 亚洲天堂资源| 国产九九精品| 91成人在线网站| 综合综合综合综合综合网| 日韩视频一二区| 久久久久久影院| 99成人在线| av女在线播放| 欧美伊人久久| 99久久久久国产精品| 免费一级欧美在线观看视频| 成人黄色毛片| 一区二区毛片| 999精品嫩草久久久久久99| 国内黄色精品| 亚洲成人黄色| 1024日韩| 亚洲欧美日韩在线观看a三区| 三级欧美在线一区| 极品视频在线| 欧美91在线|欧美| 亚洲免费专区| 中文字幕日韩亚洲| 天堂99x99es久久精品免费| 激情小说一区| 黄色成人91| 久久毛片亚洲| 99久久99久久精品国产片果冰| 国产99在线| 欧美一区二区三区免费看| 电影中文字幕一区二区| 爱爱精品视频| 伊人久久婷婷| 色综合天天色| 国产亚洲精aa在线看| 欧美交a欧美精品喷水| 一区精品久久| 亚洲日本在线观看视频| 国产成人ay| 韩日一区二区三区| 在线精品亚洲欧美日韩国产| 欧美日韩1区| 日韩精品欧美| 国产拍在线视频| 欧美精品三级在线| 亚洲午夜精品久久久久久app| www.youjizz.com在线| 一区二区电影在线观看| 日韩精品欧美| 日韩欧美午夜| 亚洲精品中文字幕99999| 伊人色**天天综合婷婷| 国产一区二区高清在线| 玖玖精品一区| 蜜桃视频一区二区| 中文字幕亚洲精品乱码| 亚洲高清久久| 国产一区二区久久久久| 在线精品国产亚洲| 三级在线观看一区二区 | 亚洲肉体裸体xxxx137|