免费观看黄a一级视频_一级毛片看看_亚洲AⅤ无码日韩AV无码网站_国产未成满18禁止_亚洲无码免费网站_午夜影院播放版_97亚洲精品国偷自产在_国产毛片一区二区三区va在线_久久www免费人成人片_成人网欧美在线视频

/ EN
13922884048

技術(shù)交流

Technology Exchange
/
/

Chiplet助力AI芯片實現(xiàn)算力跨越

發(fā)布時間:2024-05-30作者來源:薩科微瀏覽:1625

圖片


芯粒英文是Chiplet,是指預(yù)先制造好、具有特定功能、可組合集成的晶片(Die),Chiplet也有翻譯為“小芯片”,中科院計算所韓銀和等2020年時建議將Chiplet翻譯為“芯?!?/span>



2010年,蔣尚義先生提出通過半導(dǎo)體公司連接兩顆芯片的方法,區(qū)別于傳統(tǒng)封裝,定義為先進(jìn)封裝。2015年Marvell創(chuàng)始人之一周秀文(Sehat Sutardja)博士曾提出Mochi (Modular Chip,模塊化芯片)架構(gòu)的概念,這是芯粒早期雛形。AMD率先將芯粒技術(shù)大規(guī)模應(yīng)用于商業(yè)產(chǎn)品。2019年,國內(nèi)華為等公司也在產(chǎn)品中使用芯粒技術(shù)。2022年基金委雙清論壇上,孫凝暉院士、劉明院士、蔣尚義先生等討論提出了“集成芯片”概念,也是對芯粒集成芯片的概括和定義。

關(guān)于芯粒技術(shù),網(wǎng)上有多篇寫的比較全面的介紹。如54所的許居衍院士的報告,ARM的邵博士寫的文章《多Die封裝:Chiplet小芯片的研究報告》,華為的夏博士的文章,成都電子科大的黃樂天的文章,清華大學(xué)研究組提出的芯粒設(shè)計成本估算模型。不過,網(wǎng)上也有一些值得關(guān)注的觀點。清華大學(xué)少軍教授指出,Chiplet處理器芯片是先進(jìn)造工藝的“補充”,而不是替代?!捌淠繕?biāo)還是在成本可控情況下的異質(zhì)集成。”


圖片

隨著AI、HPC等高算力需求日新月異,作為算力載體的高性能芯片的需求也隨之水漲船高。先進(jìn)封裝因能提升芯片的集成密度與互聯(lián)速度、降低芯片設(shè)計門檻,并增強功能搭配的靈活性,故而已成為超越摩爾定律、提升芯片系統(tǒng)性能的關(guān)鍵途徑。Chiplet既是先進(jìn)封裝技術(shù)的重要應(yīng)用,亦是后道制程提升AI芯片算力的[敏感詞]途徑之一。

01

AI芯片技術(shù)架構(gòu)不斷演進(jìn)


隨著人工智能技術(shù)的飛速發(fā)展,AI芯片的技術(shù)架構(gòu)也在不斷演進(jìn)和升級??萍夹韭勆缃榻B,中央處理器(CPU,Central Processing Unit)是計算機的核心,現(xiàn)代計算機發(fā)展所遵循的基本結(jié)構(gòu)形式始終是馮·諾依曼機結(jié)構(gòu),需要CPU從存儲器取出指令和數(shù)據(jù)進(jìn)行相應(yīng)的計算,CPU負(fù)責(zé)承擔(dān)運算器和控制器這兩個核心功能。CPU通常由運算器、控制器、時鐘、寄存器等多個模塊構(gòu)成。


圖片

AI芯片按照技術(shù)架構(gòu)主要可以分為圖形處理器(GPU)、現(xiàn)場可編程門陣列(FPGA)、專用集成電路(ASIC)與類腦芯片

圖形處理器(GPU,Graphics Processing Unit)是顯卡的核心。CPU的定位是通用計算芯片,而GPU的定位是并行計算芯片,主要是將其中非常復(fù)雜的數(shù)學(xué)和幾何計算抽出,變成一個超高密度、能夠并行計算的方式。

目前,GPU已經(jīng)發(fā)展到較為成熟的階段,谷歌、FACEBOOK、微軟、Twtter和百度等公司都在使用GPU分析圖片、視頻和音頻文件,以改進(jìn)搜索和圖像標(biāo)簽等應(yīng)用功能。

現(xiàn)場可編程門陣列(FPGA,F(xiàn)ield Programmable Gate Array)是在PAL(可編程陣列邏輯)、GAL(通用陣列邏輯)等可編程器件的基礎(chǔ)上進(jìn)一步發(fā)展的產(chǎn)物。它是作為專用集成電路(ASIC)領(lǐng)域中的一種半定制電路而出現(xiàn)的,既解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點。

由于FPGA具有可編程靈活性高、開發(fā)周期短以及并行計算效率高等特點,F(xiàn)PGA的應(yīng)用場景非常廣泛,遍布航空航天、汽車、醫(yī)療、廣播、測試測量、消費電子、工業(yè)控制等熱門領(lǐng)域。

專用集成電路(ASIC ,Application Specific Integrated Circuit )是針對用戶對特定電子系統(tǒng)的需求,從根級設(shè)計、制造的專有應(yīng)用程序芯片,其計算能力和計算效率可根據(jù)算法需要進(jìn)行定制,是固定算法最優(yōu)化設(shè)計的產(chǎn)物。

目前,ASIC在通信領(lǐng)域、圖像與視頻處理、汽車電子、醫(yī)療設(shè)備、人工智能等領(lǐng)域都有廣泛應(yīng)用。


類腦計算芯片(Neuro-inspired computing chips)就是用電路模擬人腦神經(jīng)網(wǎng)絡(luò)架構(gòu)的芯片,它結(jié)合微電子技術(shù)和新型神經(jīng)形態(tài)器件,模仿人腦神經(jīng)系統(tǒng)計算原理進(jìn)行設(shè)計,實現(xiàn)類似人腦的超低功耗和并行信息處理能力。

作為新一代的人工智能處理器,類腦芯片具有并行計算、低功耗設(shè)計和自適應(yīng)學(xué)習(xí)等特點,為人工智能領(lǐng)域帶來了許多新的機遇。目前,在模式識別與圖像處理、自動機器人、大數(shù)據(jù)分析、醫(yī)學(xué)與生物科學(xué)研究等領(lǐng)域,類腦芯片具有巨大的潛力,將推動人工智能技術(shù)的更大突破和進(jìn)步。

華福證券認(rèn)為,隨著AI、HPC等高算力需求日新月異,作為算力載體的高性能芯片的需求也隨之水漲船高。然而,先進(jìn)制程的進(jìn)階之路已困難重重,一方面,摩爾定律迭代進(jìn)度的放緩使芯片性能增長的邊際成本急劇上升;另一方面,受限于光刻機瓶頸,前段制程的微縮也愈發(fā)困難。在此背景下,先進(jìn)封裝因能提升芯片的集成密度與互聯(lián)速度、降低芯片設(shè)計門檻,并增強功能搭配的靈活性,故而已成為超越摩爾定律、提升芯片系統(tǒng)性能的關(guān)鍵途徑。

02

Chiplet面臨機遇與挑戰(zhàn)


隨著摩爾定律走到極限,Chiplet被行業(yè)普遍認(rèn)為是未來5年算力的主要提升技術(shù)。

半導(dǎo)體產(chǎn)業(yè)縱橫介紹,Chiplet俗稱芯粒,也叫小芯片,它是將一類滿足特定功能的die(裸片),通過die-to-die內(nèi)部互聯(lián)技術(shù)實現(xiàn)多個模塊芯片與底層基礎(chǔ)芯片封裝在一起,形成一個系統(tǒng)芯片,以實現(xiàn)一種新形式的IP復(fù)用。簡單來說,可以理解為將每個小的芯片用“膠水”縫合在一起,形成一個性能更強的大芯片。

去年,大部分廠商或許還沉浸在Chiplet技術(shù)的未來應(yīng)用上,如今Chiplet已經(jīng)成為各大廠商的產(chǎn)品中的必選角色。英特爾、AMD、英偉達(dá)都在自家的CPU、GPU上使用了Chiplet技術(shù),這將Chiplet推入了一個全新的商業(yè)化階段。

圖片


總體來看,Chiplet有四大優(yōu)點

[敏感詞],通過將功能塊劃分為小芯片,那么不需要芯片尺寸的持續(xù)增加。這就提高了良率并簡化了設(shè)計和驗證的流程。

第二,每個小芯片是獨立的,那就可以選擇[敏感詞]工藝。邏輯部分可以采用[敏感詞]工藝制造,大容量SRAM可以使用7nm左右的工藝制造,I/O和外圍電路可以使用12nm或28nm左右的工藝制造,這就大大降低了制造的成本。

第三,組合多樣,適合定制化,輕松制造衍生類型。比如說采用相同的邏輯電路但是不一樣的外圍電路,或相同外圍電路但不同的邏輯電路。

第四,不同制造商的小芯片可以混合使用,而不僅僅是局限在單個制造商內(nèi)。

這些特點都非常適合用在大算力芯片上。相較于傳統(tǒng)消費級芯片,算力芯片面積更大,存儲容量更大,對互連速度要求更高。采用Chiplet既可以降低成本提升良率,又可以允許更多計算核心的“堆料”,還能便于引入HBM存儲。

不過,目前的Chiplet仍存在一些門檻問題。電子發(fā)燒友網(wǎng)指出,Chiplet在成本、開放生態(tài)等方面仍面臨挑戰(zhàn)。目前基本只有大公司才用到這一先進(jìn)技術(shù),且主要集中在通信、大規(guī)模數(shù)據(jù)處理等領(lǐng)域,反倒是設(shè)計周期長的汽車、成本敏感的消費電子和可靠性要求高的工業(yè)領(lǐng)域,比較缺乏Chiplet設(shè)計的參與。

如今的Chiplet并沒有大規(guī)模普及,尤其是在某些基于成熟工藝的芯片設(shè)計上,還是因為門檻問題。先進(jìn)封裝的成本還沒有降低到設(shè)計公司可以考慮Chiplet方案的程度,這些較高的門檻阻止了Chiplet的普及。在設(shè)計公司看來,行業(yè)需要像現(xiàn)在的云服務(wù)一樣,打造一個多供應(yīng)商、多選擇和開放的生態(tài),這樣才能徹底發(fā)揮Chiplet用于降低設(shè)計成本、提高綜合性能的優(yōu)勢。

03

高性能多模態(tài)AI大模型

NPU+CPU異構(gòu)解決方案


當(dāng)前,大模型的應(yīng)用如日中天,其使用場景正在從云端迅速向邊緣端延伸。不論是在云端還是邊緣端,CPU與NPU之間更加緊密的互聯(lián)集成,已成為新一代AI計算硬件發(fā)展的顯著趨勢。AI PC等新穎概念和產(chǎn)品的涌現(xiàn),正是這一趨勢的生動體現(xiàn)。得益于Chiplet技術(shù)和先進(jìn)封裝技術(shù)的快速發(fā)展,CPU與NPU的集成得以實現(xiàn)更高的帶寬、更出色的靈活性,同時降低了研發(fā)成本,縮短了研發(fā)周期。

近日,原粒半導(dǎo)體與超摩科技攜手宣布達(dá)成戰(zhàn)略合作,雙方將圍繞原粒半導(dǎo)體領(lǐng)先的高性能NPU Chiplet產(chǎn)品與超摩科技的高性能CPU Chiplet產(chǎn)品,共同致力于開發(fā)集高性能與高集成度于一身的多模態(tài)AI大模型解決方案。

超摩科技成立于2021年,是高性能Chiplet設(shè)計的先行者與領(lǐng)導(dǎo)者,專注于通用Chiplet CPU及高性能Chiplet互聯(lián)解決方案。超摩科技提供基于從智算中心、數(shù)據(jù)中心、邊緣計算、數(shù)據(jù)網(wǎng)絡(luò)通信、自動駕駛等領(lǐng)域的系列高性能Chiplet解決方案。

歷經(jīng)三年產(chǎn)品打磨,超摩科技已成為國內(nèi)高性能Chiplet互聯(lián)解決方案的主力方案商,產(chǎn)品得到客戶認(rèn)可,已有眾多客戶導(dǎo)入量產(chǎn)并形成規(guī)模營收,商業(yè)已達(dá)成落地閉環(huán)。下一步,超摩科技將推動高性能CPU Chiplet產(chǎn)品持續(xù)商業(yè)落地,助力產(chǎn)業(yè)新的價值成長。

目前,原粒半導(dǎo)體與超摩科技已經(jīng)對雙方的AI Chiplet和CPU Chiplet產(chǎn)品的互聯(lián)適應(yīng)性進(jìn)行了驗證,雙方將聯(lián)合開發(fā)推出高性能、高靈活性、高性價比的AI大模型解決方案,市場前景廣闊,眾多行業(yè)客戶對此方案表現(xiàn)出濃厚的興趣。

超摩科技創(chuàng)始人兼CEO范靖認(rèn)為,AI大模型當(dāng)前的形勢十分活躍且富有潛力。在政策、技術(shù)和市場的三重驅(qū)動下,AI大模型產(chǎn)業(yè)得到了快速發(fā)展。原粒半導(dǎo)體的AI Chiplet憑借領(lǐng)先的技術(shù)實力和獨特的產(chǎn)品定位,能夠為廣大客戶提供卓越的高性能通用AI Chiplet解決方案。雙方的合作將推動AI大模型CPU+NPU的高性能異構(gòu)解決方案邁向新的高峰,為行業(yè)帶來更多的價值創(chuàng)新與突破。


04 
—————— 大算力芯片,正在擁抱Chiplet ——————


首先來看AMD,AMD是選擇Chiplet最積極的廠商之一


在2019年的時候,AMD就初次嘗試了Chiplet封裝,將不同工藝節(jié)點的CPU內(nèi)核且I/O規(guī)格不同的芯片封裝在一起,顯著提高了能效和功能。
之后,AMD又發(fā)布了實驗性產(chǎn)品,即基于3D Chiplet技術(shù)的3D V-Cache。使用的處理器芯片是Ryzen 5000,采用臺積電3D Fabric先進(jìn)封裝技術(shù),成功地將包含有64MB L3 Cache的Chiplet以3D堆疊的形式與處理器封裝在了一起。
從數(shù)據(jù)性能來看,采用3D Chiplet的原型芯片將性能平均提高了12%。從這一點上,也能看到3D Chiplet對實際工作負(fù)載的提升有實質(zhì)性的貢獻(xiàn)。

不止在CPU,AMD在GPU方面也選擇了Chiplet技術(shù)。目前,AMD發(fā)布的[敏感詞]MI300系列芯片時,同樣采用Chiplet技術(shù),8個GPU Chiplet加4個I/O內(nèi)存Chiplet的設(shè)計,總共12個5nm Chiplet封裝在一起,使其集成的晶體管數(shù)量達(dá)到了1530億,高于英偉達(dá)H100的800億晶體管。這款芯片在推出時,也是打出了對標(biāo)英偉達(dá)H100的口號。

此外,AMD含Chiplet技術(shù)的CPU銷量占比也在不斷提高。根據(jù)德國電腦零售商Mindfactory數(shù)據(jù),2021年10月至2022年12月間AMD CPU的銷量中,含Chiplet技術(shù)的CPU銷量占比不斷提高,從約80%上升至約97%。

圖片 

再來看英特爾。英特爾的首次推出基于Chiplet設(shè)計的處理器是Sapphire Rapids,時間在2023年1月。
具體來看,通過兩組鏡像對稱的相同架構(gòu)的building blocks,組合4個Chiplets,獲得4倍的性能和互聯(lián)帶寬。每個基本模塊包含計算部分(CHA & LLC & Cores mesh, Accelerators)、memory interface部分(controller, Ch0/1)、I/O部分(UPI,PCIe)。通過將上述高性能組件組成基本的building block,再通過EMIB技術(shù)進(jìn)行Chiplet互聯(lián),可以獲得線性性能提升和成本收益。
最后,來看英偉達(dá)。英偉達(dá)坐穩(wěn)GPU領(lǐng)域霸主這一點毋庸置疑,而霸主英偉達(dá)在今年推出的“最強”GPU B200也同樣采用Chiplet技術(shù)。GB200超級芯片是由2顆B200 GPU和1顆Arm架構(gòu)的Grace CPU(中央處理器)組合而來。
由此可見,英特爾、AMD、英偉達(dá)都在自家的CPU、GPU上使用了Chiplet技術(shù)。這將Chiplet推入了一個全新的商業(yè)化階段。
Chiplet這一錘,算是重重砸下了。

Chiplet從CPU到GPU

在之前傳統(tǒng)的GPU也是由一個中央工作負(fù)載處理器,將渲染任務(wù)發(fā)送到芯片內(nèi)的多個著色器塊之一。每個單元都被賦予一塊幾何體來處理、轉(zhuǎn)換為像素,然后對它們進(jìn)行著色。

后來AMD發(fā)現(xiàn),Chiplet 用在CPU上效果很好,并且降低了制造成本。于是在GPU上也選擇了放棄中央處理器,用多個小芯片取代單個硅塊,每個小芯片處理自己的任務(wù)。渲染指令以稱為命令列表的長序列發(fā)送到 GPU,其中所有內(nèi)容都稱為繪制調(diào)用。

圖片AMD 2019年Chiplet專利

該文件于 2019 年 6 月發(fā)布,即提交近兩年后,該功能已在 RDNA 2 中實現(xiàn)。AMD 于 2020 年開始推廣該架構(gòu),并于同年 11 月推出了[敏感詞]配備全新 RT-texture 處理器的產(chǎn)品。

圖片不同制程及封裝技術(shù)下的芯片良率、成本、面積的關(guān)系 注:D為缺陷密度,c為負(fù)二項分布中的集群參數(shù)或Seed’s model中臨界值數(shù)量

摩爾定律沒死,但確實是老了,在14nm之后成本曲線就變了。5nm工藝的成本相比7nm工藝增長了近1倍,3nm工藝相比5nm工藝預(yù)計將增長近1倍。在半導(dǎo)體工藝、規(guī)模限制越來越大的情況下,傳統(tǒng)大芯片的策略確實是寸步難行。

圖片

免責(zé)聲明:本文采摘自“大印藍(lán)??萍肌惫娞?,本文僅代表作者個人觀點,不代表薩科微及行業(yè)觀點,只為轉(zhuǎn)載與分享,支持保護(hù)知識產(chǎn)權(quán),轉(zhuǎn)載請注明原出處及作者,如有侵權(quán)請聯(lián)系我們刪除。

服務(wù)熱線

0755-83044319

霍爾元件咨詢

肖特基二極管咨詢

TVS/ESD咨詢

獲取產(chǎn)品資料

客服微信

微信服務(wù)號