3D 封裝將成為主要工藝? ！芯片巨頭決戰(zhàn)先進(jìn)封裝！

發(fā)布時(shí)間：2022-03-18作者來(lái)源：薩科微瀏覽：2700

一、3D 封裝將成為主要工藝

轉(zhuǎn)自：智東西

近日，中國(guó)臺(tái)灣工業(yè)技術(shù)研究院研究總監(jiān) Yang Rui 預(yù)測(cè)，臺(tái)積電將在芯片制造業(yè)再占主導(dǎo)地位五年，此后 3D 封裝將成為主要工藝挑戰(zhàn)。

過(guò)去十年各種計(jì)算工作負(fù)載飛速發(fā)展，而摩爾定律卻屢屢被傳將走到盡頭。面對(duì)更家多樣化的計(jì)算應(yīng)用需求，為了將更多功能 " 塞 " 到同一顆芯片里，先進(jìn)封裝技術(shù)成為持續(xù)優(yōu)化芯片性能和成本的關(guān)鍵創(chuàng)新路徑。

臺(tái)積電、英特爾、三星均在加速 3D 封裝技術(shù)的部署。今年 8 月，這三大芯片制造巨頭均亮出，使得這一戰(zhàn)場(chǎng)愈發(fā)硝煙四起。

▲英特爾封裝技術(shù)路線(xiàn)圖

通過(guò)三大芯片制造巨頭的先進(jìn)封裝布局，我們可以看到在接下來(lái)的一年，3D 封裝技術(shù)將是超越摩爾定律的重要?dú)⑹诛怠?

一、先進(jìn)封裝：將更多功能塞進(jìn)一顆芯片

此前芯片多采用 2D 平面封裝技術(shù)，但隨著異構(gòu)計(jì)算應(yīng)用需求的增加，能將不同尺寸、不同制程工藝、不同材料的芯片集成整合的 3D 封裝技術(shù)，已成為兼顧更高性能和更高靈活性的必要選擇。

從[敏感詞] 3D 封裝技術(shù)落地進(jìn)展來(lái)看，英特爾 Lakefield 采用 3D 封裝技術(shù) Foveros，臺(tái)積電的 3D 封裝技術(shù) SoIC 按原計(jì)劃將在 2021 年量產(chǎn)，三星的 3D 封裝技術(shù)已應(yīng)用于 7nm EUV 芯片。

為什么要邁向先進(jìn)封裝技術(shù)？主要原因有二點(diǎn)，一是迄今處理器的大多數(shù)性能限制來(lái)自?xún)?nèi)存帶寬，二是生產(chǎn)率提高。

一方面，存儲(chǔ)帶寬的開(kāi)發(fā)速度遠(yuǎn)遠(yuǎn)低于處理器邏輯電路的速度，因此存在 " 內(nèi)存墻 " 的問(wèn)題。

在傳統(tǒng) PCB 封裝中，走線(xiàn)密度和信號(hào)傳輸速率難以提升，因而內(nèi)存帶寬緩慢增長(zhǎng)。而先進(jìn)封裝的走線(xiàn)密度短，信號(hào)傳輸速率有很大的提升空間，同時(shí)能大大提高互連密度，因而先進(jìn)封裝技術(shù)成為解決內(nèi)存墻問(wèn)題的主要方法之一。

另一方面，高性能處理器的體系架構(gòu)越來(lái)越復(fù)雜，晶體管的數(shù)量也在增加，但先進(jìn)的半導(dǎo)體工藝仍然很昂貴，并且生產(chǎn)率也不令人滿(mǎn)意。

在半導(dǎo)體制造中，芯片面積越小，往往成品率越高。為了降低使用先進(jìn)半導(dǎo)體技術(shù)的成本并提高良率，一種有效的方法是將大芯片切分成多個(gè)小芯片，然后使用先進(jìn)的封裝技術(shù)將它們連接在一起。

在這一背景下，以臺(tái)積電、英特爾、三星為代表的三大芯片巨頭正積極探索 3D 封裝技術(shù)及其他先進(jìn)封裝技術(shù)。

二、臺(tái)積電的3D封裝組合拳

今年 8 月底，臺(tái)積電推出 3DFabric 整合技術(shù)平臺(tái)，旨在加快系統(tǒng)級(jí)方案的創(chuàng)新速度，并縮短上市時(shí)間。

臺(tái)積電 3DFabric 可將各種邏輯、存儲(chǔ)器件或?qū)Ｓ眯酒c SoC 集成在一起，為高性能計(jì)算機(jī)、智能手機(jī)、IoT 邊緣設(shè)備等應(yīng)用提供更小尺寸的芯片，并且可通過(guò)將高密度互連芯片集成到封裝模塊中，從而提高帶寬、延遲和電源效率。

3DFabric 由臺(tái)積電前端和后端封裝技術(shù)組成。

前端 3D IC 技術(shù)為臺(tái)積電 SoIC 技術(shù)，于 2018 年首次對(duì)外公布，支持 CoW（Chip on Wafer）和 WoW（Wafer on Wafer）兩種鍵合方式。

▲ a 為芯片分割前的 SoC；b、c、d 為臺(tái)積電 SoIC 服務(wù)平臺(tái)支持的多種分區(qū)小芯片和重新集成方案

通過(guò)采用硅穿孔（TSV）技術(shù)，臺(tái)積電 SoIC 技術(shù)可達(dá)到無(wú)凸起的鍵合結(jié)構(gòu)，從而可將不同尺寸、制程、材料的小芯片重新集成到一個(gè)類(lèi)似 SoC 的集成芯片中，使最終的集成芯片面積更小，并且系統(tǒng)性能優(yōu)于原來(lái)的 SoC。

臺(tái)積電后端技術(shù)包括 CoWoS（Chip on Wafer on Substrate）和 InFO（Integrated Fan-out）系列封裝技術(shù)，已經(jīng)廣泛落地。例如今年全球 TOP 500 超算榜排名[敏感詞]的日本超算 " 富岳 " 所搭載的 Fujitsu A64FX 處理器采用了臺(tái)積電 CoWoS 封裝技術(shù)，蘋(píng)果手機(jī)芯片采用了臺(tái)積電 InFO 封裝技術(shù)。

此外，臺(tái)積電擁有多個(gè)專(zhuān)門(mén)的后端晶圓廠，負(fù)責(zé)組裝和測(cè)試包括 3D 堆疊芯片在內(nèi)的硅芯片，將其加工成封裝后的設(shè)備。

這帶來(lái)的一大好處是，客戶(hù)可以在模擬 IO、射頻等不經(jīng)常更改、擴(kuò)展性不大的模塊上采用更成熟、更低成本的半導(dǎo)體技術(shù)，在核心邏輯設(shè)計(jì)上采用[敏感詞]的半導(dǎo)體技術(shù)，既節(jié)約了成本，又縮短了新產(chǎn)品的上市時(shí)間。

臺(tái)積電 3DFabric 將先進(jìn)的邏輯、高速存儲(chǔ)器件集成到封裝模塊中。在給定的帶寬下，高帶寬內(nèi)存（HBM）較寬的接口使其能以較低的時(shí)鐘速度運(yùn)行，從而減少功耗。

如果以數(shù)據(jù)中心規(guī)模來(lái)看，這些邏輯和 HBM 器件節(jié)省的成本十分可觀。

三、英特爾用"分解設(shè)計(jì)"策略打出差異化優(yōu)勢(shì)

和臺(tái)積電相似，英特爾也早已在封裝領(lǐng)域布局了多種維度的先進(jìn)封裝技術(shù)。

在 8 月 13 日的 2020 年英特爾架構(gòu)日上，英特爾發(fā)布一個(gè)全新的混合結(jié)合（Integrated Fan-out）技術(shù)，使用這一技術(shù)的測(cè)試芯片已在 2020 年第二季度流片。

相比當(dāng)前大多數(shù)封裝技術(shù)所使用的熱壓結(jié)合（Thermocompression bonding）技術(shù)，混合結(jié)合技術(shù)可將凸點(diǎn)間距降到 10 微米以下，提供更高互連密度、更高帶寬和更低功率。

▲英特爾混合結(jié)合技術(shù)

此前英特爾已推出標(biāo)準(zhǔn)封裝、2.5D 嵌入式多互連橋（EMIB）技術(shù)、3D 封裝 Foveros 技術(shù)、將 EMIB 與 Foveros 相結(jié)合的 Co-EMIB 技術(shù)、全方位互連（ODI）技術(shù)和多模 I/O（MDIO）技術(shù)等，這些封裝互連技術(shù)相互疊加后，能帶來(lái)更大的可擴(kuò)展性和靈活性。

據(jù)英特爾研究院院長(zhǎng)宋繼強(qiáng)介紹：" 封裝技術(shù)的發(fā)展就像我們蓋房子，一開(kāi)始蓋的是茅廬單間，然后蓋成四合院，最后到高樓大廈。以 Foveros 3D 來(lái)說(shuō)，它所實(shí)現(xiàn)的就是在建高樓的時(shí)候，能夠讓線(xiàn)路以低功率同時(shí)高速率地進(jìn)行傳輸。"

他認(rèn)為，英特爾在封裝技術(shù)的優(yōu)勢(shì)在于，可以更早地知道未來(lái)這個(gè)房子會(huì)怎么搭，也就是說(shuō)可以更好地對(duì)未來(lái)芯片進(jìn)行設(shè)計(jì)。

面向未來(lái)的異構(gòu)計(jì)算趨勢(shì)，英特爾推出 " 分解設(shè)計(jì)（Digression design）" 策略，結(jié)合新的設(shè)計(jì)方法和先進(jìn)的封裝技術(shù)，將關(guān)鍵的架構(gòu)組件拆分為仍在統(tǒng)一封裝中單獨(dú)晶片。

也就是說(shuō)，將原先整個(gè) SoC 芯片 " 化整為零 "，先做成如 CPU、GPU、I/O 等幾個(gè)大部分，再將 SoC 的細(xì)粒度進(jìn)一步提升，將以前按照功能性來(lái)組合的思路，轉(zhuǎn)變?yōu)榘淳?IP 來(lái)進(jìn)行組合。

這種思路的好處是，不僅能提升芯片設(shè)計(jì)效率、減少產(chǎn)品化的時(shí)間，而且能有效減少此前復(fù)雜設(shè)計(jì)所帶來(lái)的 Bug 數(shù)量。

" 原來(lái)一定要放到一個(gè)晶片上做的方案，現(xiàn)在可以轉(zhuǎn)換成多晶片來(lái)做。另外，不僅可以利用英特爾的多節(jié)點(diǎn)制程工藝，也可以利用合作伙伴的工藝。" 宋繼強(qiáng)解釋。

這些分解開(kāi)的小部件整合起來(lái)之后，速度快、帶寬足，同時(shí)還能實(shí)現(xiàn)低功耗，有很大的靈活性，將成為英特爾的一大差異性?xún)?yōu)勢(shì)。

四、三星首秀3D封裝技術(shù)，可用于7nm工藝

除了臺(tái)積電和英特爾外，三星也在加速其 3D 封裝技術(shù)的部署。

8 月 13 日，三星也公布了其 3D 封裝技術(shù)為 "eXtended-Cube"，簡(jiǎn)稱(chēng) "X-Cube"，通過(guò) TSV 進(jìn)行互連，已能用于 7nm 乃至 5nm 工藝。

據(jù)三星介紹，目前其 X-Cube 測(cè)試芯片可以做到將 SRAM 層堆疊在邏輯層上，可將 SRAM 與邏輯部分分離，從而能騰出更多空間來(lái)堆棧更多內(nèi)存。

▲三星 X-Cube 測(cè)試芯片架構(gòu)

此外，TSV 技術(shù)能大幅縮短裸片間的信號(hào)距離，提高數(shù)據(jù)傳輸速度和降低功耗。

三星稱(chēng)，該 3D 封裝技術(shù)在速度和功效方面實(shí)現(xiàn)了重大飛躍，將幫助滿(mǎn)足5G、AI、AR、VR、HPC、移動(dòng)和可穿戴設(shè)備等前沿應(yīng)用領(lǐng)域的嚴(yán)格性能要求。

結(jié)語(yǔ)：三大芯片巨頭強(qiáng)攻先進(jìn)封裝

可以看到，在 2020 年，圍繞 3D 封裝技術(shù)的戰(zhàn)火繼續(xù)升級(jí)，臺(tái)積電、英特爾、三星這三大先進(jìn)芯片制造商紛紛加碼，探索更廣闊的芯片創(chuàng)新空間。

盡管這些技術(shù)方法的核心細(xì)節(jié)有所不同，但殊途同歸，都是為了持續(xù)提升芯片密度、實(shí)現(xiàn)更為復(fù)雜和靈活的系統(tǒng)級(jí)芯片，以滿(mǎn)足客戶(hù)日益豐富的應(yīng)用需求。

而隨著制程工藝逼近極限，以及應(yīng)用需求的持續(xù)多元化，未來(lái)芯片制造商除了要解決散熱等技術(shù)挑戰(zhàn)外，還有望推進(jìn)來(lái)自不同廠商的先進(jìn)封裝技術(shù)的融合。

二、芯片巨頭決戰(zhàn)先進(jìn)封裝

轉(zhuǎn)自：半導(dǎo)體行業(yè)觀察

以《戰(zhàn)略緒論》一書(shū)聞名的近代法國(guó)戰(zhàn)略大師薄富爾曾說(shuō)：「戰(zhàn)略的要義是『預(yù)防』而非『治療』，『未來(lái)和準(zhǔn)備』比『現(xiàn)在和執(zhí)行』更重要?！拱雽?dǎo)體業(yè)界亦同，當(dāng)摩爾定律所預(yù)言的制程微縮曲線(xiàn)開(kāi)始鈍化，將不同制程性質(zhì)的芯片，透過(guò)多芯片封裝包在一起，以最短的時(shí)程推出符合市場(chǎng)需求的產(chǎn)品，就成為重要性持續(xù)水漲船高的技術(shù)顯學(xué)。
而這些先進(jìn)芯片封裝也成為超級(jí)電腦和人工智能的必備[敏感詞]。別的不提，光論nVidia 和AMD 的高效能運(yùn)算專(zhuān)用GPU、Google 第二代TPU、無(wú)數(shù)「人工智能芯片」，就處處可見(jiàn)HBM 記憶體的存在。

畢竟天底下沒(méi)有面面俱到的半導(dǎo)體制程，觀察到先進(jìn)制程晶圓廠每隔4 年成本倍增的「摩爾第二定律」，也突顯了電晶體單位成本越來(lái)越高的殘酷現(xiàn)實(shí)。AMD 處理器從7 納米制程開(kāi)始全面性「Chiplet 化」，將7 納米制程的CPU 核心和12 納米制程的I/O 記憶體控制器分而治之，實(shí)乃不得不然。

發(fā)展方興未艾的先進(jìn)封裝技術(shù)

也因此，無(wú)論臺(tái)積電還是英特爾，無(wú)不拼命加碼，相關(guān)產(chǎn)品也如雨后春筍一個(gè)個(gè)冒出頭來(lái)，而AMD 更在未來(lái)產(chǎn)品計(jì)畫(huà)，大剌剌寫(xiě)著「融合2.5D 與3D 的X3D 封裝」（雖然大概也是直接沿用臺(tái)積電的現(xiàn)有技術(shù)），以達(dá)成超過(guò)時(shí)下產(chǎn)品十倍的記憶體頻寬密度。

稍微替各位復(fù)習(xí)一下什么是「2.5D」封裝，臺(tái)積電擁有超過(guò)60 個(gè)實(shí)際導(dǎo)入案例的CoWos（Chip-on-Wafer-on-Substrate）算是這領(lǐng)域最為知名的技術(shù)，包含近期奪下超級(jí)電腦Top500 榜首的Fujitsu A64FX。英特爾用自家EMIB（Embedded Multi-Die Interconnect Bridge）將Kaby Lake 處理器與AMD Vega 繪圖核心「送作堆」的Kaby Lake-G，也曾是轟動(dòng)一時(shí)的熱門(mén)話(huà)題。

有別于「2D」的SiP（System-in-Package），2.5D 封裝在SiP 基板和芯片之間，[敏感詞]了矽中介層（Silicon Interposer），透過(guò)矽穿孔（TSV，Through-Silicon Via）連接上下的金屬層，克服SiP 基板（像多層走線(xiàn)印刷電路板）難以實(shí)做高密度布線(xiàn)而限制芯片數(shù)量的困難。

「疊疊樂(lè)」的3D 封裝就不難理解了，臺(tái)積電就靠著可減少30% 的封裝厚度InFO（Integrated Fan-Out），在iPhone 7 的A10 處理器訂單爭(zhēng)奪戰(zhàn)擊敗三星，終結(jié)了消費(fèi)者購(gòu)買(mǎi)iPhone 6S 還得擔(dān)心拿到三星版A9 的尷尬處境（筆者不幸曾是受害者之一）。但3D 封裝的散熱手段與熱量管理，也是明擺在半導(dǎo)體產(chǎn)業(yè)界的艱巨挑戰(zhàn)。

英特爾相對(duì)應(yīng)的3D 封裝技術(shù)則為Foveros。最近正式發(fā)表、代號(hào)Lakefield 的「混合式x86 架構(gòu)處理器」，堆疊了「1 大4 小核心」的10 納米制程（代號(hào)P1274）運(yùn)算芯片、22 納米制程（代號(hào)P1222）系統(tǒng)I/O 芯片和PoP（Package-on-Package）封裝的記憶體，待機(jī)耗電量?jī)H2mW。

英特爾2019 年7 月公布的Co-EMIB，用2.5D 的EMIB 連接多個(gè)3D 的Foveros 封裝，「整合成具備更多功能」的單一芯片。為EMIB 概念延伸的ODI（Omni-Directional Interconnect）則用來(lái)填補(bǔ)EMIB 與Foveros 之間的鴻溝，為封裝內(nèi)眾多裸晶連接提供更高靈活性，細(xì)節(jié)在此不論。

連接封裝內(nèi)多顆裸晶之間的匯流排也是不可或缺的技術(shù)。
英特爾在2017 年將EMIB 連接裸晶的「矽橋」（Silicon Bridge）正式命名為「先進(jìn)介面匯流排」（AIB，Advanced Interface Bus）并公開(kāi)免費(fèi)授權(quán)，2018 年將AIB 捐贈(zèng)給美國(guó)[敏感詞]先進(jìn)研究計(jì)劃署（DARPA），當(dāng)作免專(zhuān)利費(fèi)的裸晶互連標(biāo)準(zhǔn)，MDIO（Multi-Die I/O）則是AIB 的下一代。臺(tái)積電相對(duì)應(yīng)技術(shù)則為L(zhǎng)IPINCON（Low-voltage-INPackage-INterCONnect），規(guī)格與英特爾互有長(zhǎng)短。

超級(jí)電腦用的系統(tǒng)單芯片并非IBM 和Fujitsu 的專(zhuān)利

長(zhǎng)期關(guān)心ARM 指令集相容處理器與超級(jí)電腦的讀者，想必對(duì)先前采用Fujitsu A64FX 處理器打造的日本理化學(xué)研究所的「富岳」并不陌生。這顆臺(tái)積電7 納米制程并CoWoS 2.5D 封裝4 顆8GB HBM2 記憶體的產(chǎn)物，堪稱(chēng)當(dāng)代[敏感詞]代表性的「超級(jí)電腦專(zhuān)用系統(tǒng)單芯片」，讓人不得不想起十幾年前的IBM BlueGene /L。

曾在21 世紀(jì)初期靠著「地球模擬器」（Earth Simulator）獨(dú)領(lǐng)風(fēng)騷兩年多的NEC，其SX 向量處理器的[敏感詞]成員SX-Aurora TSUBASA，也是臺(tái)積電16 納米制程、2.5D 封裝6 顆8GB HBM2 記憶體的超級(jí)電腦心臟。

而英特爾的Xeon Phi 系列更是知名代表，透過(guò)2.5D 封裝包了8 顆2GB MCDRAM（Multi-Channel DRAM），可設(shè)定為快取記憶體、主記憶體或混合兩者之用。雖然Xeon Phi 家族兩年前慘遭腰斬，中斷自從Larrabee 以來(lái)的「超級(jí)多核心x86」路線(xiàn)，英特爾決定整個(gè)砍掉重練，一步一腳印重頭打造「?jìng)鹘y(tǒng)GPU」當(dāng)作未來(lái)高效能運(yùn)算與人工智能應(yīng)用的基礎(chǔ)，但異質(zhì)多芯片封裝的重要性仍不減反增，最起碼被英特爾從AMD 挖角、主導(dǎo)GPU 發(fā)展的Raja Koduri，自己是這樣講的，也沒(méi)什么懷疑的空間。

不過(guò)AMD 也并未缺席，并看似有后來(lái)居上的氣勢(shì)，而且這并非突發(fā)奇想，早在2010 年之前，就開(kāi)始進(jìn)行長(zhǎng)期研究，至今超過(guò)十年，并「很有可能」以EHP（Exascale Heterogenous Processor）之名開(kāi)花結(jié)果，融合2.5D 與3D 封裝的X3D 則是達(dá)成EHP 的關(guān)鍵。

Exa 意指Peta 的1 千倍，也是近年來(lái)超級(jí)電腦的下一個(gè)競(jìng)爭(zhēng)指標(biāo)，像預(yù)定采用AMD Zen 2 世代EPYC 處理器的美國(guó)國(guó)家核能安全管理局El Capitan 超級(jí)電腦，理論運(yùn)算效能就超過(guò)2ExaFlops。

AMD 自從2007 年購(gòu)并ATI 之后，整合處理器與繪圖核心的APU 之路，一直走得相當(dāng)掙扎，遲遲難以找到適合的產(chǎn)品規(guī)格與市場(chǎng)定位，不是CPU 不夠好、GPU 不夠強(qiáng)、就是兩者都不上不下，到了Zen 2 世代才算脫胎換骨。
這些年來(lái)，AMD 在超級(jí)電腦市場(chǎng)逐漸邊緣化，今年6 月的Top500 只剩下10 臺(tái)AMD CPU 和一臺(tái)AMD GPU，更需要強(qiáng)力的新兵器，才能「突破英特爾和nVidia 的封鎖」。身為「超級(jí)電腦APU」的EHP 就成為AMD 默默進(jìn)行的新方向。

以加拿大ATI身分在2010年申請(qǐng)「藉由假矽穿孔替3D封裝進(jìn)行導(dǎo)熱」（Dummy TSV To Improve Process Uniformity and Heat Dissipation）專(zhuān)利為起點(diǎn)，AMD一路累積了「記憶體運(yùn)算的快取資料一致性」（2016年）、「3D晶粒堆疊的熱量管理」（2017年）、「擁有[敏感詞]頻寬與可延展性能耗比的GPU架構(gòu)」（2017年）、「記憶體內(nèi)運(yùn)算的陣列」（2018年）、「回圈脫離預(yù)測(cè)（2018年）以改善閑置模式的效率」到「混合CPU與GPU的動(dòng)態(tài)記憶體管理」（2018年）等成果，確定了AMD在2015年的財(cái)務(wù)分析師大會(huì)透露的「伺服器專(zhuān)用APU」與當(dāng)年7月IEEE Micro發(fā)表的「藉由異質(zhì)運(yùn)算實(shí)現(xiàn)百億億級(jí)運(yùn)算」（Achieving Exascale Capabilities through Heterogeneous Computing）計(jì)畫(huà)并不是玩假的，更何況現(xiàn)在AMD當(dāng)家作主的還是一位以務(wù)實(shí)聞名的全球薪酬[敏感詞]女性執(zhí)行長(zhǎng)。

根據(jù)已公開(kāi)的資料，EHP 概略規(guī)格如下，但后面勢(shì)必將隨著技術(shù)演進(jìn)而有更動(dòng)：

32 個(gè)CPU 核心（當(dāng)時(shí)是8 顆4 核心CCD）。
8 顆32 個(gè)GPU CU，總計(jì)256 CU 與16,384 個(gè)串流處理器（那時(shí)預(yù)定是GCN 第五代的Vega，看來(lái)將會(huì)推進(jìn)到CDNA）。
8 塊4GB HBM2 記憶體堆疊。
時(shí)脈1GHz 時(shí)，雙倍浮點(diǎn)精確度理論效能為16TeraFlops，如十萬(wàn)顆組成超級(jí)電腦，就是1.6ExaFlops，預(yù)估耗電量為20MW。
AMD 在2015 年7 月IEEE Micro 專(zhuān)文，表示32 個(gè)CPU 核心、320 個(gè)時(shí)脈1GHz 的GPU CU（20,480 個(gè)串流處理器）、3TB/s 記憶體頻寬、160W 功耗，是能耗比[敏感詞]的組態(tài)，總之實(shí)際的產(chǎn)品一定會(huì)變。
EHP 和X3D 的技術(shù)資產(chǎn)會(huì)「推己及人」到Zen 3 世代EPYC 處理器「Milan」的可怕傳言（像10 顆CCD 湊80 核心或塞HBM2 當(dāng)L4 之類(lèi)的），一直沒(méi)有停過(guò)。

EHP 也有配置芯片封裝以外的外部記憶體，像斷電后資料不會(huì)消失的NVRAM（Non-Volatile RAM，如英特爾／Micro 的3D Xpoint 和發(fā)展中SST-MRAM 等）和「記憶體內(nèi)運(yùn)算」的PIM （Processing-In-Memory，記憶體內(nèi)建位元運(yùn)算電路），相關(guān)的動(dòng)態(tài)記憶體管理與快取資料一致性，也是AMD 需要克服的技術(shù)門(mén)檻，至于軟體環(huán)境的完備性，更將是AMD 能否追上nVidia 的最核心因素。

同場(chǎng)加映：nVidia 也沒(méi)吃飽閑著

近來(lái)因「光明的未來(lái)前瞻性」而讓公司市值一舉超越英特爾的nVidia，在高效能運(yùn)算、人工智能與自駕車(chē)等領(lǐng)域的優(yōu)勢(shì)地位幾乎是牢不可破。除了帳面硬體規(guī)格，發(fā)展了十多年的CUDA 應(yīng)用環(huán)境生態(tài)、遠(yuǎn)遠(yuǎn)超越英特爾和AMD 的GPU 虛擬化（這讓客戶(hù)使用AMD GPU 部署云端個(gè)人電腦的效益會(huì)明顯不如nVidia，云端服務(wù)業(yè)者的虛擬GPU 亦同，比較一下可負(fù)荷用戶(hù)端數(shù)量，就知道差別有多大了）和更多「不足外人道也」之處，才是支撐nVidia 股價(jià)的真正根基。
將話(huà)題拉回多芯片封裝這件事，就算不論以「訓(xùn)練」為主的高階GPU，nVidia 連「推論」用的芯片研究案都走向「多芯片封裝延展性」。

但各位有沒(méi)有想過(guò)一個(gè)更有趣的可能性：既然nVidia 高階GPU 都這么大顆，干么不干脆「順便」包一顆高效能的ARM（或RISC-V）指令集相容處理器，不再是英特爾、AMD 處理器的「附屬品」，讓GPU 變身成「可自行開(kāi)機(jī)的超級(jí)電腦系統(tǒng)單芯片」？
事實(shí)上，nVidia GPU 內(nèi)本來(lái)就有內(nèi)建好幾顆簡(jiǎn)稱(chēng)為Falcon（Fast Logic Controller）的微控制器，用來(lái)輔助GPU 運(yùn)算處理，像支援影像圖形解碼到安全性機(jī)制，或減輕CPU 執(zhí)行驅(qū)動(dòng)程式的負(fù)擔(dān)，如以前因?yàn)閃indows 作業(yè)系統(tǒng)的延遲程序呼叫（DPC，Deferred Procedure Call）會(huì)逾時(shí)而不能進(jìn)行的排程等。
2016 年，nVidia 先采用柏克萊大學(xué)的開(kāi)源RISC-V 指令集相容處理器Rocket，開(kāi)發(fā)出[敏感詞]代Falcon 微控制器，2017 年第二代產(chǎn)品擴(kuò)展到64 位元，并自行新增自定義的新指令。前述由27 顆封裝而成的RC18 推論芯片，也是RISC-V 核心，每秒可執(zhí)行128 兆次推論，功耗僅13.5W。
那么未來(lái)，假如nVidia 將「更多的工作」搬到GPU 內(nèi)的RISC-V 核心，特別是驅(qū)動(dòng)程式涉及大量GPU 底層機(jī)密資訊的「下面那一層」丟過(guò)去，或經(jīng)由GPU 虛擬化掩蓋起來(lái)，又會(huì)發(fā)生什么事？這件牽扯到另一個(gè)少人知悉的潛在需求了：來(lái)自官方的開(kāi)源驅(qū)動(dòng)程式。

弦外之音：GPU 驅(qū)動(dòng)程式開(kāi)源的沖擊

臺(tái)面上看不到或少人著墨的議題，舉足輕重的程度往往遠(yuǎn)超乎看熱鬧外行人的想像。
無(wú)論超級(jí)電腦還是人工智能（尤其是人命關(guān)天的自動(dòng)駕駛），基于安全性考量，芯片廠商的客戶(hù)或多或少都希望檢視所有程式碼，理所當(dāng)然包含驅(qū)動(dòng)程式，這就是GPU 驅(qū)動(dòng)程式開(kāi)源之所以如此重要的主因。但偏偏這又是暗藏大量商業(yè)機(jī)密的黑盒子，要如何滿(mǎn)足客戶(hù)需求又不讓機(jī)密外泄，大方釋出「官方開(kāi)源驅(qū)動(dòng)程式」，就是nVidia、AMD 甚至即將「GPU 戰(zhàn)線(xiàn)復(fù)歸」的英特爾，已經(jīng)面對(duì)很久的機(jī)會(huì)與挑戰(zhàn)。

技術(shù)的發(fā)展跟著應(yīng)用的需求走，這恐怕也將會(huì)注定AMD 靠著「超級(jí)電腦APU」反攻高效能運(yùn)算市場(chǎng)的企圖能否悲愿成就的鎖鑰。

免責(zé)聲明：本文轉(zhuǎn)載自“濾波器”，本文僅代表作者個(gè)人觀點(diǎn)，不代表薩科微及行業(yè)觀點(diǎn)，只為轉(zhuǎn)載與分享，支持保護(hù)知識(shí)產(chǎn)權(quán)，轉(zhuǎn)載請(qǐng)注明原出處及作者，如有侵權(quán)請(qǐng)聯(lián)系我們刪除。

公司電話(huà)：+86-0755-83044319
傳真/FAX：+86-0755-83975897
郵箱：1615456225@qq.com
QQ：3518641314 李經(jīng)理

QQ：332496225 丘經(jīng)理

地址：深圳市龍華新區(qū)民治大道1079號(hào)展滔科技大廈C座809室

上一條：霍爾效應(yīng)（HALL）是什么？霍爾效應(yīng)傳感器工作原理解析
下一條：功率mos管為何會(huì)被燒毀？都進(jìn)來(lái)看看！