日韩一区二区三区在线免费观看-开心久久婷婷综合中文字幕-欧美激情91-久久国产福利-欧美日韩日本国产亚洲在线-国产精品极品国产中出

首頁 > 新聞 > 智能 > 正文

國產(chǎn)替代狂奔,中國版英偉達(dá)何時現(xiàn)身?

2023-07-11 13:28:50來源:ZAKER科技  

導(dǎo)語:在國產(chǎn) GPU 突圍的道路上,部分廠商已經(jīng)走出了自己的路。但鑒于硬件、生態(tài)等各方面的差距,這樣必定是一條充滿荊棘的長路。

最近,風(fēng)頭正盛的英偉達(dá)在算力領(lǐng)域又下一城。

在最新的最新 MLPerf 訓(xùn)練基準(zhǔn)測試中,英偉達(dá)的 H100 僅用 11 分鐘就訓(xùn)練完了 GPT-3。

并且還在所有的八項(xiàng)測試中都創(chuàng)下了新紀(jì)錄。


(資料圖片)

可以說,這是一款專為 AI、HPC 和數(shù)據(jù)分析而設(shè)計的 " 性能怪獸 "。

憑借著 4nm 制程、800 億個晶體管、18432 個 CUDA 核心,以及專用的 Transformer 引擎,H100 將大模型訓(xùn)練速度提高了 6 倍。

同時,H100 還支持 NVLink Switch 系統(tǒng),可以實(shí)現(xiàn)單節(jié)點(diǎn)內(nèi)和節(jié)點(diǎn)間的全方位 GPU 通信,從而支持百億億級(Exascale)的工作負(fù)載。

這也是其能在 MLPerf 8 項(xiàng)基準(zhǔn)測試中橫掃其他競爭者的重要原因。

在算力愈發(fā)重要的 AIGC 時代,任何能提高模型訓(xùn)練、機(jī)器學(xué)習(xí)的硬件技術(shù),都成了各大 AI 企業(yè)垂涎欲滴的產(chǎn)物。

然而,目前在 GPU 領(lǐng)域,大部分國內(nèi)企業(yè),仍然只能仰賴英偉達(dá)一家的技術(shù)。

在國內(nèi)算力愈發(fā)捉襟見肘,以及國際風(fēng)云變幻的敏感時刻,國內(nèi)的 GPU 廠商,能否奮力追趕,解決這一 " 卡脖子 " 難題,以至于成為下一個 " 英偉達(dá) " 呢?

種子選手的秘密

在目前國內(nèi)一票 GPU 的 " 種子選手 " 中,一家名叫壁仞科技的企業(yè)引起了人們的注意。

原因很簡單,那就是其產(chǎn)品 BR100 不僅創(chuàng)下了全球算力紀(jì)錄,并且宣稱其峰值算力達(dá)到了英偉達(dá) A100 的 3 倍,甚至還能對標(biāo)沒發(fā)售的 H100。

然而,稍微了解過國內(nèi)芯片行業(yè)的人都知道,在芯片領(lǐng)域,國內(nèi)的炒作太多了,徒有其表的例子也太多了。

那么,做出這個 " 媲美英偉達(dá) "GPU 的企業(yè),究竟是什么來頭?其自主研發(fā)的 BR100,是否真的像其宣傳的那樣出色?

要回答這個問題,我們不妨先看看壁仞科技的創(chuàng)始班底,技術(shù)背景究竟如何。

作為一家通用智能芯片設(shè)計研發(fā)商的壁仞科技,成立于 2019 年,團(tuán)隊由國內(nèi)外芯片和云計算領(lǐng)域的專家和研發(fā)人員組成。

其創(chuàng)始人張旭博士,不僅擁有清華大學(xué)和斯坦福大學(xué)的博士學(xué)位,還曾是英偉達(dá)的高級架構(gòu)師,負(fù)責(zé) Volta 架構(gòu)的設(shè)計和開發(fā)。

除此之外, 團(tuán)隊其他成員的技術(shù)身份,也頗為亮眼。

李新榮,聯(lián)席 CEO,曾任 AMD 全球副總裁、中國研發(fā)中心總經(jīng)理,負(fù)責(zé) AMD 大中華區(qū)的研發(fā)建設(shè)和管理工作。

洪洲,CTO,曾在 NVIDIA、S3、華為等工作操刀 GPU 工程項(xiàng)目,擁有超過 30 年的 GPU 領(lǐng)域經(jīng)驗(yàn)。

焦國方,軟件生態(tài)環(huán)境主要負(fù)責(zé)人,曾在高通領(lǐng)導(dǎo)和產(chǎn)品研發(fā)了 5 代 Adreno 移動 GPU 系統(tǒng)架構(gòu)。

這樣的團(tuán)隊背景,決定了壁仞科技的技術(shù)底色。

依據(jù)之前在英偉達(dá)、AMD、高通、商湯科技等知名企業(yè)的研發(fā)經(jīng)驗(yàn)和技術(shù)積累,壁仞科技研發(fā)了自主原創(chuàng)的芯片架構(gòu)——壁立仞。

壁立仞架構(gòu)基于 SIMT(單指令多線程)模型,針對 AI 場景進(jìn)行了專用的優(yōu)化和定制。

其最大的特點(diǎn),就是可以將多個小芯片拼成一個大芯片,每個小芯片只做一部分功能,然后通過高速互連組合成一個大芯片。

這樣可以提高芯片的良率和可靠性,同時降低成本和功耗,實(shí)現(xiàn)更強(qiáng)大的算力和擴(kuò)展性。

這就是壁仞科技所謂的Chiplet的設(shè)計理念。

這種技術(shù)的難點(diǎn)在于如何保證芯片之間的高速通信和協(xié)作,同時避免信號干擾和功耗過高。

因此,如何設(shè)計合適的芯片分割和組合方案,使得每個芯片都能發(fā)揮最大的效能,同時減少電磁干擾和熱耗散,就成了 Chiplet 能否成功的關(guān)鍵。

對此,壁仞科技使用了兩種關(guān)鍵的技術(shù)2.5DCoWoS 和 BLink,來攻克這一難關(guān)。

簡單地說,2.5D CoWoS 技術(shù)是一種把多個芯片堆疊在一起的技術(shù),它利用了一個硅基板作為中介層,縮短了芯片之間的距離,從而提高了信號的傳輸速度和質(zhì)量。

而 BLink 則在中介層上,建立了一個專用的接口,它可以讓多個芯片之間直接傳輸數(shù)據(jù),而不需要經(jīng)過其他的電路或芯片,從而減少了延遲和功耗。

然而,盡管 2.5D CoWoS、BLink 這些技術(shù),讓壁仞科技打造出了算力更強(qiáng)的 BR100,但這些技術(shù),目前在國際上并不罕見,其他 GPU 廠商也有過類似的設(shè)計。

例如,Nvidia 的 A100 和 H100 GPU 都采用了 CoWoS 技術(shù),把 GPU 芯片和 HBM 內(nèi)存堆疊在一起,提高了內(nèi)存帶寬和計算性能。而 Nvidia 還開發(fā)了自己的 NVLink 接口,類似于 BLink 接口,可以讓多個 GPU 之間高速互聯(lián)。

此外,AMD 也有自己的 Infinity Fabric 接口,可以實(shí)現(xiàn)類似的功能。

那既然這是一種 " 大家都能用 " 的技術(shù),那壁仞科技怎么就做到讓 BR100 算力達(dá)到 A100 三倍的呢?而英偉達(dá)真就會坐視著自己被超越了?

其實(shí),這樣的結(jié)果,是二者在不同數(shù)據(jù)格式下的表現(xiàn)所致。

具體來說,BR100 的巨大算力,更多是在矩陣 FP32 數(shù)據(jù)格式下的表現(xiàn)。

一般來說,數(shù)據(jù)格式占用的位數(shù)越多,它的范圍和精度就越高,但是也會消耗更多的空間和電力。

而矩陣 FP32 其實(shí)就是一種特殊的 FP32 數(shù)據(jù)格式,它只用了 19 位來存儲一個浮點(diǎn)數(shù),這樣做的目的是為了讓矩陣 FP32 能夠兼容 Tensor Core 這種專門用于加速矩陣乘法的硬件單元。

矩陣乘法是深度學(xué)習(xí)中最常見和最重要的計算操作之一,所以使用矩陣 FP32 可以大幅提升深度學(xué)習(xí)的性能。

但是,矩陣 FP32 也有一個缺點(diǎn),就是它的精度比向量 FP32 低,也就是說它能表示的浮點(diǎn)數(shù)的范圍和細(xì)節(jié)程度比向量 FP32 小。

這樣就會導(dǎo)致一些誤差和損失,在某些情況下可能會影響模型的質(zhì)量和效果。

因此,矩陣 FP32 和英偉達(dá) A100 的向量 FP32 并不等價,因?yàn)榫仃?FP32 只適用于矩陣乘法這種特定的計算操作,并不能代表 GPU 的整體性能。

生態(tài)之痛

除了技術(shù)方面的較量外,軟件生態(tài)上的壁壘,也是國產(chǎn) GPU 無法忽視的一道屏障。

從某種程度上說,這樣的壁壘比某些具體技術(shù)的難點(diǎn),更難以攻克。

在 GPU 領(lǐng)域,業(yè)界流傳著一種說法:"CUDA 是 Nvidia 最深的護(hù)城河 "。

這是因?yàn)?,早在十幾年前,在業(yè)內(nèi)大部分人都認(rèn)為 GPU 只能處理圖形相關(guān)的計算時,英偉達(dá)就已經(jīng)意識到了 GPU 在 AI 領(lǐng)域的潛力和價值,并開始了相應(yīng)的布局,在 2006 年推出了通用并行計算架構(gòu) CUDA。

在 CUDA 問世前,人們在進(jìn)行各種計算任務(wù)時,用的都是 CPU,而非 GPU。

然而,CPU 雖然具有很強(qiáng)的 " 通用性 ",可以處理各種計算,但是它的速度不夠快,而且核心數(shù)量有限。

而相較之下,只能處理圖形計算的 GPU,不僅速度很快快,而且有很多很多的核心。

通過 CUDA,在進(jìn)行 AI 計算時,人們可以將神經(jīng)元之間的計算分配到 GPU 的不同核心上,并行地進(jìn)行運(yùn)算。這樣就大大提高了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和推理的速度、效果。

英偉達(dá)看到了 CUDA 的巨大潛力,于是不斷地完善和優(yōu)化 CUDA 的技術(shù)和生態(tài)。

例如讓 CUDA 支持 C、C++、Fortran、Python 等多種編程語言,或是提供了針對不同領(lǐng)域和應(yīng)用優(yōu)化的庫和工具,比如圖像處理庫、深度學(xué)習(xí)庫、自動駕駛庫等等。

這樣的優(yōu)化,為開發(fā)者提供了極大的便利,使其不用再學(xué)習(xí)新的編程語言,或是從頭開始編寫代碼。

于是,越來越多的人用慣了,用舒服了,CUDA 的生態(tài)就這么被搭建起來了。

誠然,在 CUDA 構(gòu)建自身生態(tài)壁壘的過程中,也不是沒有遇到過競爭者,但最后這些對手都一一成為了 " 陪跑者 "。

例如,蘋果公司和 Khronos Group 在 2009 年推出的 OpenCL,也有過想成為行業(yè)標(biāo)準(zhǔn)的想法,讓人們可以用不同廠商的 CPU、GPU、來做異構(gòu)計算。

然而,OpenCL 沒有 CUDA 那么高效和靈活,需要更多的編程技巧和優(yōu)化工作,這就加大了開發(fā)者的負(fù)擔(dān)。

而英偉達(dá)的老對手 AMD,也想要提供一個通用并行計算平臺,并推出了相應(yīng)的產(chǎn)品 ROCm,它跟 CUDA 的架構(gòu)非常類似,甚至有一個工具叫 hipify,可以把 CUDA 代碼轉(zhuǎn)換成 ROCm 代碼。

但是 ROCm 只能用在 AMD 的 GPU 上,而且只支持幾款顯卡。

于是,綜合對比下來,更多的開發(fā)者還是選擇了 " 通用性 "、" 易用性 " 都更勝一籌的 CUDA。

如今,在軟件生態(tài)方面,壁仞科技也推出了自主研發(fā)的 BIRENSUPA 軟件平臺,試圖通過 " 無縫運(yùn)行 " 的方式,讓開發(fā)者無需修改代碼,就可以在 BR100 系列產(chǎn)品上運(yùn)行原本基于 CUDA 的應(yīng)用。

這樣,習(xí)慣了使用 CUDA 的用戶,如果轉(zhuǎn)而使用 BR100 系列產(chǎn)品,可以獲得更高的計算性能和更低的功耗成本。

然而,這樣的思路,卻面臨著幾大挑戰(zhàn),而其中之一,就是 BR100 系列產(chǎn)品在通用計算生態(tài)上的支持。

BIRENSUPA 軟件平臺

因?yàn)椋谪鹂萍紴榱颂岣?BR100 系列產(chǎn)品在 AI 計算方面的性能和能效,也對流處理器進(jìn)行了一些優(yōu)化和定制,比如說使用 BF16 替代 FP16 作為主要的數(shù)據(jù)格式,以及增加了一些針對 AI 的硬件指令和功能。

這樣,BR100 就可能犧牲了部分通用計算能力,導(dǎo)致其在一些非 AI 的應(yīng)用場景和領(lǐng)域上表現(xiàn)不佳或者不兼容。

而這也是為什么,BR100 的主要應(yīng)用場景,大多是復(fù)旦大學(xué)、清華大學(xué)這類高校的人工智能計算和高性能計算項(xiàng)目。

除此之外,BR100 系列產(chǎn)品,在算力利用率上也存在著風(fēng)險。

雖然,BR100 的架構(gòu)是通用的,如果如果壁仞科技愿意,也同樣可以將其用于通用類的計算。

但因?yàn)?BR100 的內(nèi)部算力帶寬已經(jīng)明顯超過 PCIe 和 HBM2e 的帶寬,所以絕大部分?jǐn)?shù)據(jù)可能都要在 GPU 內(nèi)流轉(zhuǎn)。

這就意味著,雖然 BR100 的算力很強(qiáng)大,它的數(shù)據(jù)來源和輸出通道,都不夠快,不能及時地給它送來或者拿走數(shù)據(jù)。

而如果一個軟件生態(tài)主要支持通用處理, 它的 GPU 芯片往往就需要有足夠高的外部帶寬,來獲取各種類型的數(shù)據(jù)。

這是因?yàn)?,不同類型的?yīng)用,往往對帶寬的需求和敏感度都不同。一些大型的應(yīng)用,可能需要更高的帶寬,才能更好地計算。

最后,也是最具風(fēng)險的一點(diǎn),就是雖然壁仞科技宣稱,BR100 要無縫地支持 CUDA 生態(tài),但 CUDA 不是一個開源生態(tài),英偉達(dá)在其中埋下了大量專利壁壘。

如果壁仞科技真的打算撬動這塊壁壘,則很可能受到英偉達(dá)的在專利上的反擊。

綜上所述,雖然目前在國產(chǎn) GPU 突圍的道路上,部分廠商已經(jīng)走出了自己的路,但鑒于硬件、生態(tài)等各方面的差距,這樣的道路,必定是一條充滿荊棘的長路。

關(guān)鍵詞:

責(zé)任編輯:hnmd003

相關(guān)閱讀

相關(guān)閱讀

精彩推送

推薦閱讀

蜜桃视频第一区免费观看| 51vv免费精品视频一区二区| 夜鲁夜鲁夜鲁视频在线播放| 4438全国亚洲精品观看视频| 国产专区一区| 亚洲免费综合| 在线一区视频观看| 国产亚洲高清在线观看| 精品亚洲成人| 男人操女人的视频在线观看欧美| 欧美性aaa| 国产一区二区三区日韩精品| 伊人久久大香线蕉av不卡| 两个人看的在线视频www| 日本不卡高清视频| 51vv免费精品视频一区二区| 国产亚洲一级| 日本伊人午夜精品| 精品国产乱码久久久久久1区2匹| 久久成人精品| 国产精品大片| 久久中文字幕av| 日韩成人三级| 国产一区日韩| 一本久道久久综合婷婷鲸鱼| 激情久久99| 极品尤物一区| 国产精品久久观看| 国产在线日韩精品| 伊人影院久久| 青青青伊人色综合久久| 日韩精品一卡| 牛牛精品一区二区| 在线播放一区二区精品视频| 成人影院天天5g天天爽无毒影院| 久久资源综合| 好吊视频一区二区三区四区| 国产精品亚洲综合久久| 精品国产乱码久久久久久1区2匹| 欧美国产一级| 日韩电影在线看| 日本黄色精品| 日韩成人一区二区三区在线观看| 久久亚洲一区| 成人羞羞在线观看网站| 蜜桃传媒麻豆第一区在线观看| 欧美日本不卡高清| 欧美天天视频| 久久悠悠精品综合网| 亚洲免费观看| 国产精品欧美一区二区三区不卡| 欧美日韩免费观看一区=区三区 | 成人国产精品一区二区网站| 欧洲杯半决赛直播| 亚洲美女色禁图| 午夜亚洲影视| 日韩av一区二区三区四区| freexxx性亚洲精品| 999国产精品一区| 黑人一区二区三区| 小说区图片区色综合区| 日本va欧美va精品| 久久动漫亚洲| 久久久久毛片免费观看| 偷拍精品精品一区二区三区| 久久精品影视| 欧美国产免费| 中文一区一区三区高中清不卡免费| 日韩激情视频在线观看| 免费成人在线电影| 激情欧美丁香| 国产日产精品_国产精品毛片| 色综合狠狠操| 日韩精品一区二区三区免费观影| 久久一区亚洲| 色综合久久网| 日韩精品第二页| 欧美日韩国产高清电影| 国产乱码精品一区二区三区亚洲人 | 日韩视频在线直播| 777午夜精品电影免费看| 久久中文亚洲字幕| 国产精品日韩精品在线播放| 吉吉日韩欧美| 天天射综合网视频| 青草伊人久久| 99视频这里有精品| 偷拍精品精品一区二区三区| 雨宫琴音一区二区在线| 日韩欧美高清一区二区三区| 电影天堂国产精品| 在线综合亚洲| 久久久久久9| 亚洲调教一区| 日本系列欧美系列| 日韩欧美在线中字| 免费日韩视频| 亚洲夜间福利| 韩国精品福利一区二区三区| 国产视频一区二| 免费永久网站黄欧美| 久久uomeier| 免费中文字幕日韩欧美| 欧美一区三区| 亚洲视频国产精品| 国产精品日本一区二区三区在线| 亚洲成人高清| 91影院成人| 国产精品美女久久久| 久久久久中文| 亚洲啊v在线免费视频| 国产精品手机在线播放| 亚洲人metart人体| 一区二区三区成人精品| 91大神在线观看线路一区| 午夜激情电影在线播放| 欧美gay男男猛男无套| 9l亚洲国产成人精品一区二三| 91欧美在线| 国产农村妇女精品一区二区| av一区二区高清| 欧美一区二区三区激情视频| 欧洲精品一区| 久久久精品日韩| 精品国产一区探花在线观看 | 国产在视频一区二区三区吞精| 春色校园综合激情亚洲| 亚洲女同同性videoxma| 亚洲午夜一级| 欧美+亚洲+精品+三区| 7777精品| 第四色中文综合网| 亚洲v天堂v手机在线| 亚洲麻豆一区| 伊人久久大香伊蕉在人线观看热v 伊人久久大香线蕉综合影院首页 伊人久久大香 | 国产91在线播放精品| 美女一区网站| 日韩aaaa| yellow在线观看网址| 狂野欧美性猛交xxxx巴西| 欧美日韩hd| 亚洲午夜电影| 亚洲天堂偷拍| 成人激情诱惑| 日韩黄色小视频| 亚洲欧美一级| 999色成人| 96sao精品免费视频观看| 国产亚洲字幕| 国产一区二区三区免费观看在线 | 久久精品一区二区三区中文字幕 | 成人黄色av| 蜜臀久久久久久久| 久久成人精品| 免费在线观看视频一区| 石原莉奈在线亚洲二区| 香蕉av777xxx色综合一区| 国产精品毛片在线看| 99av国产精品欲麻豆| 亚洲深夜激情| 日韩在线一区二区三区| 欧美r级电影| 日韩国产一区| 卡一卡二国产精品| 久久亚州av| 综合干狼人综合首页| 精品国产一级| 91精品国产乱码久久久竹菊| 亚洲手机视频| 日本福利一区| 都市激情亚洲一区| 亚洲网色网站| 亚洲精品无播放器在线播放| 亚洲人人精品| 国产亚洲一区二区手机在线观看| 最新亚洲精品| 久久久久久亚洲精品美女| 国产精品一线| 精品久久ai电影| 不卡日本视频| 性色av一区二区怡红| 久久久久久久高潮| 国产66精品| 欧美午夜精彩| 狠狠入ady亚洲精品经典电影| caoporn视频在线| 欧美不卡高清一区二区三区| 久久久久黄色| 国产区精品区| 欧美色综合网| 99久久久国产精品美女| 免费一级欧美片在线观看| 国产成人精品亚洲日本在线观看| 久久精品久久综合| 国内不卡的一区二区三区中文字幕| www.久久爱.com| 精品国产123区| 亚洲在线日韩| 另类一区二区| 日韩vs国产vs欧美|