免费观看黄a一级视频_一级毛片看看_亚洲AⅤ无码日韩AV无码网站_国产未成满18禁止_亚洲无码免费网站_午夜影院播放版_97亚洲精品国偷自产在_国产毛片一区二区三区va在线_久久www免费人成人片_成人网欧美在线视频

/ EN
13922884048

技術(shù)交流

Technology Exchange
/
/

3D 封裝將成為主要工藝? !芯片巨頭決戰(zhàn)先進(jìn)封裝!

發(fā)布時(shí)間:2022-03-18作者來(lái)源:薩科微瀏覽:2700

一、3D 封裝將成為主要工藝


轉(zhuǎn)自:智東西

近日,中國(guó)臺(tái)灣工業(yè)技術(shù)研究院研究總監(jiān) Yang Rui 預(yù)測(cè),臺(tái)積電將在芯片制造業(yè)再占主導(dǎo)地位五年,此后 3D 封裝將成為主要工藝挑戰(zhàn)。

過(guò)去十年各種計(jì)算工作負(fù)載飛速發(fā)展,而摩爾定律卻屢屢被傳將走到盡頭。面對(duì)更家多樣化的計(jì)算應(yīng)用需求,為了將更多功能 " 塞 " 到同一顆芯片里,先進(jìn)封裝技術(shù)成為持續(xù)優(yōu)化芯片性能和成本的關(guān)鍵創(chuàng)新路徑。

臺(tái)積電、英特爾、三星均在加速 3D 封裝技術(shù)的部署。今年 8 月,這三大芯片制造巨頭均亮出,使得這一戰(zhàn)場(chǎng)愈發(fā)硝煙四起。

▲英特爾封裝技術(shù)路線(xiàn)圖

通過(guò)三大芯片制造巨頭的先進(jìn)封裝布局,我們可以看到在接下來(lái)的一年,3D 封裝技術(shù)將是超越摩爾定律的重要?dú)⑹诛怠?

一、先進(jìn)封裝:將更多功能塞進(jìn)一顆芯片

此前芯片多采用 2D 平面封裝技術(shù),但隨著異構(gòu)計(jì)算應(yīng)用需求的增加,能將不同尺寸、不同制程工藝、不同材料的芯片集成整合的 3D 封裝技術(shù),已成為兼顧更高性能和更高靈活性的必要選擇。

從[敏感詞] 3D 封裝技術(shù)落地進(jìn)展來(lái)看,英特爾 Lakefield 采用 3D 封裝技術(shù) Foveros,臺(tái)積電的 3D 封裝技術(shù) SoIC 按原計(jì)劃將在 2021 年量產(chǎn),三星的 3D 封裝技術(shù)已應(yīng)用于 7nm EUV 芯片。

為什么要邁向先進(jìn)封裝技術(shù)?主要原因有二點(diǎn),一是迄今處理器的大多數(shù)性能限制來(lái)自?xún)?nèi)存帶寬,二是生產(chǎn)率提高。

一方面,存儲(chǔ)帶寬的開(kāi)發(fā)速度遠(yuǎn)遠(yuǎn)低于處理器邏輯電路的速度,因此存在 " 內(nèi)存墻 " 的問(wèn)題。

在傳統(tǒng) PCB 封裝中,走線(xiàn)密度和信號(hào)傳輸速率難以提升,因而內(nèi)存帶寬緩慢增長(zhǎng)。而先進(jìn)封裝的走線(xiàn)密度短,信號(hào)傳輸速率有很大的提升空間,同時(shí)能大大提高互連密度,因而先進(jìn)封裝技術(shù)成為解決內(nèi)存墻問(wèn)題的主要方法之一。

另一方面,高性能處理器的體系架構(gòu)越來(lái)越復(fù)雜,晶體管的數(shù)量也在增加,但先進(jìn)的半導(dǎo)體工藝仍然很昂貴,并且生產(chǎn)率也不令人滿(mǎn)意。

在半導(dǎo)體制造中,芯片面積越小,往往成品率越高。為了降低使用先進(jìn)半導(dǎo)體技術(shù)的成本并提高良率,一種有效的方法是將大芯片切分成多個(gè)小芯片,然后使用先進(jìn)的封裝技術(shù)將它們連接在一起。

在這一背景下,以臺(tái)積電、英特爾、三星為代表的三大芯片巨頭正積極探索 3D 封裝技術(shù)及其他先進(jìn)封裝技術(shù)。

二、臺(tái)積電的3D封裝組合拳

今年 8 月底,臺(tái)積電推出 3DFabric 整合技術(shù)平臺(tái),旨在加快系統(tǒng)級(jí)方案的創(chuàng)新速度,并縮短上市時(shí)間。

臺(tái)積電 3DFabric 可將各種邏輯、存儲(chǔ)器件或?qū)S眯酒c SoC 集成在一起,為高性能計(jì)算機(jī)、智能手機(jī)、IoT 邊緣設(shè)備等應(yīng)用提供更小尺寸的芯片,并且可通過(guò)將高密度互連芯片集成到封裝模塊中,從而提高帶寬、延遲和電源效率。

3DFabric 由臺(tái)積電前端和后端封裝技術(shù)組成。

前端 3D IC 技術(shù)為臺(tái)積電 SoIC 技術(shù),于 2018 年首次對(duì)外公布,支持 CoW(Chip on Wafer)和 WoW(Wafer on Wafer)兩種鍵合方式。

▲ a 為芯片分割前的 SoC;b、c、d 為臺(tái)積電 SoIC 服務(wù)平臺(tái)支持的多種分區(qū)小芯片和重新集成方案

通過(guò)采用硅穿孔(TSV)技術(shù),臺(tái)積電 SoIC 技術(shù)可達(dá)到無(wú)凸起的鍵合結(jié)構(gòu), 從而可將不同尺寸、制程、材料的小芯片重新集成到一個(gè)類(lèi)似 SoC 的集成芯片中,使最終的集成芯片面積更小,并且系統(tǒng)性能優(yōu)于原來(lái)的 SoC。

臺(tái)積電后端技術(shù)包括 CoWoS(Chip on Wafer on Substrate)和 InFO(Integrated Fan-out)系列封裝技術(shù),已經(jīng)廣泛落地。例如今年全球 TOP 500 超算榜排名[敏感詞]的日本超算 " 富岳 " 所搭載的 Fujitsu A64FX 處理器采用了臺(tái)積電 CoWoS 封裝技術(shù),蘋(píng)果手機(jī)芯片采用了臺(tái)積電 InFO 封裝技術(shù)。

此外,臺(tái)積電擁有多個(gè)專(zhuān)門(mén)的后端晶圓廠,負(fù)責(zé)組裝和測(cè)試包括 3D 堆疊芯片在內(nèi)的硅芯片,將其加工成封裝后的設(shè)備。

這帶來(lái)的一大好處是,客戶(hù)可以在模擬 IO、射頻等不經(jīng)常更改、擴(kuò)展性不大的模塊上采用更成熟、更低成本的半導(dǎo)體技術(shù),在核心邏輯設(shè)計(jì)上采用[敏感詞]的半導(dǎo)體技術(shù),既節(jié)約了成本,又縮短了新產(chǎn)品的上市時(shí)間。

臺(tái)積電 3DFabric 將先進(jìn)的邏輯、高速存儲(chǔ)器件集成到封裝模塊中。在給定的帶寬下,高帶寬內(nèi)存(HBM)較寬的接口使其能以較低的時(shí)鐘速度運(yùn)行,從而減少功耗。

如果以數(shù)據(jù)中心規(guī)模來(lái)看,這些邏輯和 HBM 器件節(jié)省的成本十分可觀。

三、英特爾用"分解設(shè)計(jì)"策略打出差異化優(yōu)勢(shì)

和臺(tái)積電相似,英特爾也早已在封裝領(lǐng)域布局了多種維度的先進(jìn)封裝技術(shù)。

在 8 月 13 日的 2020 年英特爾架構(gòu)日上,英特爾發(fā)布一個(gè)全新的混合結(jié)合(Integrated Fan-out)技術(shù),使用這一技術(shù)的測(cè)試芯片已在 2020 年第二季度流片。

相比當(dāng)前大多數(shù)封裝技術(shù)所使用的熱壓結(jié)合(Thermocompression bonding)技術(shù),混合結(jié)合技術(shù)可將凸點(diǎn)間距降到 10 微米以下,提供更高互連密度、更高帶寬和更低功率。

▲英特爾混合結(jié)合技術(shù)

此前英特爾已推出標(biāo)準(zhǔn)封裝、2.5D 嵌入式多互連橋(EMIB)技術(shù)、3D 封裝 Foveros 技術(shù)、將 EMIB 與 Foveros 相結(jié)合的 Co-EMIB 技術(shù)、全方位互連(ODI)技術(shù)和多模 I/O(MDIO)技術(shù)等,這些封裝互連技術(shù)相互疊加后,能帶來(lái)更大的可擴(kuò)展性和靈活性。

據(jù)英特爾研究院院長(zhǎng)宋繼強(qiáng)介紹:" 封裝技術(shù)的發(fā)展就像我們蓋房子,一開(kāi)始蓋的是茅廬單間,然后蓋成四合院,最后到高樓大廈。以 Foveros 3D 來(lái)說(shuō),它所實(shí)現(xiàn)的就是在建高樓的時(shí)候,能夠讓線(xiàn)路以低功率同時(shí)高速率地進(jìn)行傳輸。"

他認(rèn)為,英特爾在封裝技術(shù)的優(yōu)勢(shì)在于,可以更早地知道未來(lái)這個(gè)房子會(huì)怎么搭,也就是說(shuō)可以更好地對(duì)未來(lái)芯片進(jìn)行設(shè)計(jì)。

面向未來(lái)的異構(gòu)計(jì)算趨勢(shì),英特爾推出 " 分解設(shè)計(jì)(Digression design)" 策略,結(jié)合新的設(shè)計(jì)方法和先進(jìn)的封裝技術(shù),將關(guān)鍵的架構(gòu)組件拆分為仍在統(tǒng)一封裝中單獨(dú)晶片。

也就是說(shuō),將原先整個(gè) SoC 芯片 " 化整為零 ",先做成如 CPU、GPU、I/O 等幾個(gè)大部分,再將 SoC 的細(xì)粒度進(jìn)一步提升,將以前按照功能性來(lái)組合的思路,轉(zhuǎn)變?yōu)榘淳?IP 來(lái)進(jìn)行組合。

這種思路的好處是,不僅能提升芯片設(shè)計(jì)效率、減少產(chǎn)品化的時(shí)間,而且能有效減少此前復(fù)雜設(shè)計(jì)所帶來(lái)的 Bug 數(shù)量。

" 原來(lái)一定要放到一個(gè)晶片上做的方案,現(xiàn)在可以轉(zhuǎn)換成多晶片來(lái)做。另外,不僅可以利用英特爾的多節(jié)點(diǎn)制程工藝,也可以利用合作伙伴的工藝。" 宋繼強(qiáng)解釋。

這些分解開(kāi)的小部件整合起來(lái)之后,速度快、帶寬足,同時(shí)還能實(shí)現(xiàn)低功耗,有很大的靈活性,將成為英特爾的一大差異性?xún)?yōu)勢(shì)。

四、三星首秀3D封裝技術(shù),可用于7nm工藝

除了臺(tái)積電和英特爾外,三星也在加速其 3D 封裝技術(shù)的部署。

8 月 13 日,三星也公布了其 3D 封裝技術(shù)為 "eXtended-Cube",簡(jiǎn)稱(chēng) "X-Cube",通過(guò) TSV 進(jìn)行互連,已能用于 7nm 乃至 5nm 工藝。

據(jù)三星介紹,目前其 X-Cube 測(cè)試芯片可以做到將 SRAM 層堆疊在邏輯層上,可將 SRAM 與邏輯部分分離,從而能騰出更多空間來(lái)堆棧更多內(nèi)存。

▲三星 X-Cube 測(cè)試芯片架構(gòu)

此外,TSV 技術(shù)能大幅縮短裸片間的信號(hào)距離,提高數(shù)據(jù)傳輸速度和降低功耗。

三星稱(chēng),該 3D 封裝技術(shù)在速度和功效方面實(shí)現(xiàn)了重大飛躍,將幫助滿(mǎn)足5G、AI、AR、VR、HPC、移動(dòng)和可穿戴設(shè)備等前沿應(yīng)用領(lǐng)域的嚴(yán)格性能要求。

結(jié)語(yǔ):三大芯片巨頭強(qiáng)攻先進(jìn)封裝

可以看到,在 2020 年,圍繞 3D 封裝技術(shù)的戰(zhàn)火繼續(xù)升級(jí),臺(tái)積電、英特爾、三星這三大先進(jìn)芯片制造商紛紛加碼,探索更廣闊的芯片創(chuàng)新空間。

盡管這些技術(shù)方法的核心細(xì)節(jié)有所不同,但殊途同歸,都是為了持續(xù)提升芯片密度、實(shí)現(xiàn)更為復(fù)雜和靈活的系統(tǒng)級(jí)芯片,以滿(mǎn)足客戶(hù)日益豐富的應(yīng)用需求。

而隨著制程工藝逼近極限,以及應(yīng)用需求的持續(xù)多元化,未來(lái)芯片制造商除了要解決散熱等技術(shù)挑戰(zhàn)外,還有望推進(jìn)來(lái)自不同廠商的先進(jìn)封裝技術(shù)的融合。


 
     

二、芯片巨頭決戰(zhàn)先進(jìn)封裝

轉(zhuǎn)自:半導(dǎo)體行業(yè)觀察


以《戰(zhàn)略緒論》一書(shū)聞名的近代法國(guó)戰(zhàn)略大師薄富爾曾說(shuō):「戰(zhàn)略的要義是『預(yù)防』而非『治療』,『未來(lái)和準(zhǔn)備』比『現(xiàn)在和執(zhí)行』更重要?!拱雽?dǎo)體業(yè)界亦同,當(dāng)摩爾定律所預(yù)言的制程微縮曲線(xiàn)開(kāi)始鈍化,將不同制程性質(zhì)的芯片,透過(guò)多芯片封裝包在一起,以最短的時(shí)程推出符合市場(chǎng)需求的產(chǎn)品,就成為重要性持續(xù)水漲船高的技術(shù)顯學(xué)。  
  而這些先進(jìn)芯片封裝也成為超級(jí)電腦和人工智能的必備[敏感詞]。別的不提,光論nVidia 和AMD 的高效能運(yùn)算專(zhuān)用GPU、Google 第二代TPU、無(wú)數(shù)「人工智能芯片」,就處處可見(jiàn)HBM 記憶體的存在。  
   
  畢竟天底下沒(méi)有面面俱到的半導(dǎo)體制程,觀察到先進(jìn)制程晶圓廠每隔4 年成本倍增的「摩爾第二定律」,也突顯了電晶體單位成本越來(lái)越高的殘酷現(xiàn)實(shí)。AMD 處理器從7 納米制程開(kāi)始全面性「Chiplet 化」,將7 納米制程的CPU 核心和12 納米制程的I/O 記憶體控制器分而治之,實(shí)乃不得不然。  
 
   


發(fā)展方興未艾的先進(jìn)封裝技術(shù)


也因此,無(wú)論臺(tái)積電還是英特爾,無(wú)不拼命加碼,相關(guān)產(chǎn)品也如雨后春筍一個(gè)個(gè)冒出頭來(lái),而AMD 更在未來(lái)產(chǎn)品計(jì)畫(huà),大剌剌寫(xiě)著「融合2.5D 與3D 的X3D 封裝」(雖然大概也是直接沿用臺(tái)積電的現(xiàn)有技術(shù)),以達(dá)成超過(guò)時(shí)下產(chǎn)品十倍的記憶體頻寬密度。  
   
  稍微替各位復(fù)習(xí)一下什么是「2.5D」封裝,臺(tái)積電擁有超過(guò)60 個(gè)實(shí)際導(dǎo)入案例的CoWos(Chip-on-Wafer-on-Substrate)算是這領(lǐng)域最為知名的技術(shù),包含近期奪下超級(jí)電腦Top500 榜首的Fujitsu A64FX。英特爾用自家EMIB(Embedded Multi-Die Interconnect Bridge)將Kaby Lake 處理器與AMD Vega 繪圖核心「送作堆」的Kaby Lake-G,也曾是轟動(dòng)一時(shí)的熱門(mén)話(huà)題。  
   
 
  有別于「2D」的SiP(System-in-Package),2.5D 封裝在SiP 基板和芯片之間,[敏感詞]了矽中介層(Silicon Interposer),透過(guò)矽穿孔(TSV,Through-Silicon Via)連接上下的金屬層,克服SiP 基板(像多層走線(xiàn)印刷電路板)難以實(shí)做高密度布線(xiàn)而限制芯片數(shù)量的困難。  
 
   
 
  「疊疊樂(lè)」的3D 封裝就不難理解了,臺(tái)積電就靠著可減少30% 的封裝厚度InFO(Integrated Fan-Out),在iPhone 7 的A10 處理器訂單爭(zhēng)奪戰(zhàn)擊敗三星,終結(jié)了消費(fèi)者購(gòu)買(mǎi)iPhone 6S 還得擔(dān)心拿到三星版A9 的尷尬處境(筆者不幸曾是受害者之一)。但3D 封裝的散熱手段與熱量管理,也是明擺在半導(dǎo)體產(chǎn)業(yè)界的艱巨挑戰(zhàn)。  
 
   
 
  英特爾相對(duì)應(yīng)的3D 封裝技術(shù)則為Foveros。最近正式發(fā)表、代號(hào)Lakefield 的「混合式x86 架構(gòu)處理器」,堆疊了「1 大4 小核心」的10 納米制程(代號(hào)P1274)運(yùn)算芯片、22 納米制程(代號(hào)P1222)系統(tǒng)I/O 芯片和PoP(Package-on-Package)封裝的記憶體,待機(jī)耗電量?jī)H2mW。  
 
   
 
  英特爾2019 年7 月公布的Co-EMIB,用2.5D 的EMIB 連接多個(gè)3D 的Foveros 封裝,「整合成具備更多功能」的單一芯片。為EMIB 概念延伸的ODI(Omni-Directional Interconnect)則用來(lái)填補(bǔ)EMIB 與Foveros 之間的鴻溝,為封裝內(nèi)眾多裸晶連接提供更高靈活性,細(xì)節(jié)在此不論。  
 
   
 
  連接封裝內(nèi)多顆裸晶之間的匯流排也是不可或缺的技術(shù)。  
  英特爾在2017 年將EMIB 連接裸晶的「矽橋」(Silicon Bridge)正式命名為「先進(jìn)介面匯流排」(AIB,Advanced Interface Bus)并公開(kāi)免費(fèi)授權(quán),2018 年將AIB 捐贈(zèng)給美國(guó)[敏感詞]先進(jìn)研究計(jì)劃署(DARPA),當(dāng)作免專(zhuān)利費(fèi)的裸晶互連標(biāo)準(zhǔn),MDIO(Multi-Die I/O)則是AIB 的下一代。臺(tái)積電相對(duì)應(yīng)技術(shù)則為L(zhǎng)IPINCON(Low-voltage-INPackage-INterCONnect),規(guī)格與英特爾互有長(zhǎng)短。  
 
   


超級(jí)電腦用的系統(tǒng)單芯片并非IBM 和Fujitsu 的專(zhuān)利


長(zhǎng)期關(guān)心ARM 指令集相容處理器與超級(jí)電腦的讀者,想必對(duì)先前采用Fujitsu A64FX 處理器打造的日本理化學(xué)研究所的「富岳」并不陌生。這顆臺(tái)積電7 納米制程并CoWoS 2.5D 封裝4 顆8GB HBM2 記憶體的產(chǎn)物,堪稱(chēng)當(dāng)代[敏感詞]代表性的「超級(jí)電腦專(zhuān)用系統(tǒng)單芯片」,讓人不得不想起十幾年前的IBM BlueGene /L。  
 
   
  曾在21 世紀(jì)初期靠著「地球模擬器」(Earth Simulator)獨(dú)領(lǐng)風(fēng)騷兩年多的NEC,其SX 向量處理器的[敏感詞]成員SX-Aurora TSUBASA,也是臺(tái)積電16 納米制程、2.5D 封裝6 顆8GB HBM2 記憶體的超級(jí)電腦心臟。  
 
   
 
  而英特爾的Xeon Phi 系列更是知名代表,透過(guò)2.5D 封裝包了8 顆2GB MCDRAM(Multi-Channel DRAM),可設(shè)定為快取記憶體、主記憶體或混合兩者之用。雖然Xeon Phi 家族兩年前慘遭腰斬,中斷自從Larrabee 以來(lái)的「超級(jí)多核心x86」路線(xiàn),英特爾決定整個(gè)砍掉重練,一步一腳印重頭打造「?jìng)鹘y(tǒng)GPU」當(dāng)作未來(lái)高效能運(yùn)算與人工智能應(yīng)用的基礎(chǔ),但異質(zhì)多芯片封裝的重要性仍不減反增,最起碼被英特爾從AMD 挖角、主導(dǎo)GPU 發(fā)展的Raja Koduri,自己是這樣講的,也沒(méi)什么懷疑的空間。  
 
   
  不過(guò)AMD 也并未缺席,并看似有后來(lái)居上的氣勢(shì),而且這并非突發(fā)奇想,早在2010 年之前,就開(kāi)始進(jìn)行長(zhǎng)期研究,至今超過(guò)十年,并「很有可能」以EHP(Exascale Heterogenous Processor)之名開(kāi)花結(jié)果,融合2.5D 與3D 封裝的X3D 則是達(dá)成EHP 的關(guān)鍵。  
 
   
 
  Exa 意指Peta 的1 千倍,也是近年來(lái)超級(jí)電腦的下一個(gè)競(jìng)爭(zhēng)指標(biāo),像預(yù)定采用AMD Zen 2 世代EPYC 處理器的美國(guó)國(guó)家核能安全管理局El Capitan 超級(jí)電腦,理論運(yùn)算效能就超過(guò)2ExaFlops。  
 
   
  AMD 自從2007 年購(gòu)并ATI 之后,整合處理器與繪圖核心的APU 之路,一直走得相當(dāng)掙扎,遲遲難以找到適合的產(chǎn)品規(guī)格與市場(chǎng)定位,不是CPU 不夠好、GPU 不夠強(qiáng)、就是兩者都不上不下,到了Zen 2 世代才算脫胎換骨。  
  這些年來(lái),AMD 在超級(jí)電腦市場(chǎng)逐漸邊緣化,今年6 月的Top500 只剩下10 臺(tái)AMD CPU 和一臺(tái)AMD GPU,更需要強(qiáng)力的新兵器,才能「突破英特爾和nVidia 的封鎖」。身為「超級(jí)電腦APU」的EHP 就成為AMD 默默進(jìn)行的新方向。  
   
  以加拿大ATI身分在2010年申請(qǐng)「藉由假矽穿孔替3D封裝進(jìn)行導(dǎo)熱」(Dummy TSV To Improve Process Uniformity and Heat Dissipation)專(zhuān)利為起點(diǎn),AMD一路累積了「記憶體運(yùn)算的快取資料一致性」 (2016年)、「3D晶粒堆疊的熱量管理」(2017年)、「擁有[敏感詞]頻寬與可延展性能耗比的GPU架構(gòu)」(2017年)、「記憶體內(nèi)運(yùn)算的陣列」(2018年) 、「回圈脫離預(yù)測(cè)(2018年)以改善閑置模式的效率」到「混合CPU與GPU的動(dòng)態(tài)記憶體管理」(2018年)等成果,確定了AMD在2015年的財(cái)務(wù)分析師大會(huì)透露的「伺服器專(zhuān)用APU」與當(dāng)年7月IEEE Micro發(fā)表的「藉由異質(zhì)運(yùn)算實(shí)現(xiàn)百億億級(jí)運(yùn)算」(Achieving Exascale Capabilities through Heterogeneous Computing)計(jì)畫(huà)并不是玩假的,更何況現(xiàn)在AMD當(dāng)家作主的還是一位以務(wù)實(shí)聞名的全球薪酬[敏感詞]女性執(zhí)行長(zhǎng)。  
   
  根據(jù)已公開(kāi)的資料,EHP 概略規(guī)格如下,但后面勢(shì)必將隨著技術(shù)演進(jìn)而有更動(dòng):  
 
  • 32 個(gè)CPU 核心(當(dāng)時(shí)是8 顆4 核心CCD)。


  • 8 顆32 個(gè)GPU CU,總計(jì)256 CU 與16,384 個(gè)串流處理器(那時(shí)預(yù)定是GCN 第五代的Vega,看來(lái)將會(huì)推進(jìn)到CDNA)。


  • 8 塊4GB HBM2 記憶體堆疊。


  • 時(shí)脈1GHz 時(shí),雙倍浮點(diǎn)精確度理論效能為16TeraFlops,如十萬(wàn)顆組成超級(jí)電腦,就是1.6ExaFlops,預(yù)估耗電量為20MW。


  • AMD 在2015 年7 月IEEE Micro 專(zhuān)文,表示32 個(gè)CPU 核心、320 個(gè)時(shí)脈1GHz 的GPU CU(20,480 個(gè)串流處理器)、3TB/s 記憶體頻寬、160W 功耗,是能耗比[敏感詞]的組態(tài),總之實(shí)際的產(chǎn)品一定會(huì)變。


  • EHP 和X3D 的技術(shù)資產(chǎn)會(huì)「推己及人」到Zen 3 世代EPYC 處理器「Milan」的可怕傳言(像10 顆CCD 湊80 核心或塞HBM2 當(dāng)L4 之類(lèi)的),一直沒(méi)有停過(guò)。



   
 
  EHP 也有配置芯片封裝以外的外部記憶體,像斷電后資料不會(huì)消失的NVRAM(Non-Volatile RAM,如英特爾/Micro 的3D Xpoint 和發(fā)展中SST-MRAM 等)和「記憶體內(nèi)運(yùn)算」的PIM (Processing-In-Memory,記憶體內(nèi)建位元運(yùn)算電路),相關(guān)的動(dòng)態(tài)記憶體管理與快取資料一致性,也是AMD 需要克服的技術(shù)門(mén)檻,至于軟體環(huán)境的完備性,更將是AMD 能否追上nVidia 的最核心因素。  
           

同場(chǎng)加映:nVidia 也沒(méi)吃飽閑著


近來(lái)因「光明的未來(lái)前瞻性」而讓公司市值一舉超越英特爾的nVidia,在高效能運(yùn)算、人工智能與自駕車(chē)等領(lǐng)域的優(yōu)勢(shì)地位幾乎是牢不可破。除了帳面硬體規(guī)格,發(fā)展了十多年的CUDA 應(yīng)用環(huán)境生態(tài)、遠(yuǎn)遠(yuǎn)超越英特爾和AMD 的GPU 虛擬化(這讓客戶(hù)使用AMD GPU 部署云端個(gè)人電腦的效益會(huì)明顯不如nVidia,云端服務(wù)業(yè)者的虛擬GPU 亦同,比較一下可負(fù)荷用戶(hù)端數(shù)量,就知道差別有多大了)和更多「不足外人道也」之處,才是支撐nVidia 股價(jià)的真正根基。  
  將話(huà)題拉回多芯片封裝這件事,就算不論以「訓(xùn)練」為主的高階GPU,nVidia 連「推論」用的芯片研究案都走向「多芯片封裝延展性」。  
   
  但各位有沒(méi)有想過(guò)一個(gè)更有趣的可能性:既然nVidia 高階GPU 都這么大顆,干么不干脆「順便」包一顆高效能的ARM(或RISC-V)指令集相容處理器,不再是英特爾、AMD 處理器的「附屬品」,讓GPU 變身成「可自行開(kāi)機(jī)的超級(jí)電腦系統(tǒng)單芯片」?  
  事實(shí)上,nVidia GPU 內(nèi)本來(lái)就有內(nèi)建好幾顆簡(jiǎn)稱(chēng)為Falcon(Fast Logic Controller)的微控制器,用來(lái)輔助GPU 運(yùn)算處理,像支援影像圖形解碼到安全性機(jī)制,或減輕CPU 執(zhí)行驅(qū)動(dòng)程式的負(fù)擔(dān),如以前因?yàn)閃indows 作業(yè)系統(tǒng)的延遲程序呼叫(DPC,Deferred Procedure Call)會(huì)逾時(shí)而不能進(jìn)行的排程等。  
  2016 年,nVidia 先采用柏克萊大學(xué)的開(kāi)源RISC-V 指令集相容處理器Rocket,開(kāi)發(fā)出[敏感詞]代Falcon 微控制器,2017 年第二代產(chǎn)品擴(kuò)展到64 位元,并自行新增自定義的新指令。前述由27 顆封裝而成的RC18 推論芯片,也是RISC-V 核心,每秒可執(zhí)行128 兆次推論,功耗僅13.5W。  
  那么未來(lái),假如nVidia 將「更多的工作」搬到GPU 內(nèi)的RISC-V 核心,特別是驅(qū)動(dòng)程式涉及大量GPU 底層機(jī)密資訊的「下面那一層」丟過(guò)去,或經(jīng)由GPU 虛擬化掩蓋起來(lái),又會(huì)發(fā)生什么事?這件牽扯到另一個(gè)少人知悉的潛在需求了:來(lái)自官方的開(kāi)源驅(qū)動(dòng)程式。  
           

弦外之音:GPU 驅(qū)動(dòng)程式開(kāi)源的沖擊



  臺(tái)面上看不到或少人著墨的議題,舉足輕重的程度往往遠(yuǎn)超乎看熱鬧外行人的想像。  
  無(wú)論超級(jí)電腦還是人工智能(尤其是人命關(guān)天的自動(dòng)駕駛),基于安全性考量,芯片廠商的客戶(hù)或多或少都希望檢視所有程式碼,理所當(dāng)然包含驅(qū)動(dòng)程式,這就是GPU 驅(qū)動(dòng)程式開(kāi)源之所以如此重要的主因。但偏偏這又是暗藏大量商業(yè)機(jī)密的黑盒子,要如何滿(mǎn)足客戶(hù)需求又不讓機(jī)密外泄,大方釋出「官方開(kāi)源驅(qū)動(dòng)程式」,就是nVidia、AMD 甚至即將「GPU 戰(zhàn)線(xiàn)復(fù)歸」的英特爾,已經(jīng)面對(duì)很久的機(jī)會(huì)與挑戰(zhàn)。  
 

技術(shù)的發(fā)展跟著應(yīng)用的需求走,這恐怕也將會(huì)注定AMD 靠著「超級(jí)電腦APU」反攻高效能運(yùn)算市場(chǎng)的企圖能否悲愿成就的鎖鑰。





免責(zé)聲明:本文轉(zhuǎn)載自“濾波器”,本文僅代表作者個(gè)人觀點(diǎn),不代表薩科微及行業(yè)觀點(diǎn),只為轉(zhuǎn)載與分享,支持保護(hù)知識(shí)產(chǎn)權(quán),轉(zhuǎn)載請(qǐng)注明原出處及作者,如有侵權(quán)請(qǐng)聯(lián)系我們刪除。

公司電話(huà):+86-0755-83044319
傳真/FAX:+86-0755-83975897
郵箱:1615456225@qq.com
QQ:3518641314 李經(jīng)理  

QQ:332496225   丘經(jīng)理

地址:深圳市龍華新區(qū)民治大道1079號(hào)展滔科技大廈C座809室

服務(wù)熱線(xiàn)

0755-83044319

霍爾元件咨詢(xún)

肖特基二極管咨詢(xún)

TVS/ESD咨詢(xún)

獲取產(chǎn)品資料

客服微信

微信服務(wù)號(hào)