服務(wù)熱線
0755-83044319
發(fā)布時(shí)間:2024-05-07作者來源:薩科微瀏覽:1018
IT之家 5 月 4 日消息,上周召開的臺(tái)積電(TSMC)北美技術(shù)研討會(huì)上,特斯拉表示專門用于訓(xùn)練 AI 的晶圓級 Dojo 處理器已經(jīng)投入量產(chǎn),距離部署已經(jīng)不遠(yuǎn)了。
特斯拉的 Dojo 晶圓上系統(tǒng)(system-on-wafer)處理器(特斯拉官方稱其為 Dojo Training Tile)采用 5*5 陣列共計(jì) 25 顆芯片,這些芯片放置在載體晶圓上,然后使用臺(tái)積電的集成扇出(InFO)技術(shù)進(jìn)行晶圓級互連(InFO_SoW)互連。
據(jù) IEEE Spectrum 報(bào)道,InFO_SoW 技術(shù)旨在實(shí)現(xiàn)高性能連接,讓特斯拉 Dojo 的 25 個(gè)芯片可以像 1 個(gè)處理器一樣工作;同時(shí)為了讓晶圓級處理器保持一致,臺(tái)積電用虛擬芯片填充了芯片之間的空白點(diǎn)。
特斯拉晶圓級 Dojo 處理器實(shí)際上包含了 25 個(gè)超高性能處理器,耗電量非常高,因此需要復(fù)雜的冷卻系統(tǒng)。
特斯拉為了滿足 Dojo 處理器的供電需求,使用復(fù)雜的電壓調(diào)節(jié)模塊,為計(jì)算平面提供 18000 安培的電力,散發(fā)的熱量高達(dá) 15000W,因此需要水冷散熱。
特斯拉尚未透露其 Dojo 晶圓系統(tǒng)的性能 —— 不過,考慮到其開發(fā)過程中面臨的所有挑戰(zhàn),它似乎有望成為人工智能訓(xùn)練的一個(gè)非常強(qiáng)大的解決方案。IT之家附上相關(guān)圖片如下:
晶圓級處理器,例如 Tesla 的 Dojo 和 Cerebras 的晶圓級引擎 (WSE),比多處理器機(jī)器的性能效率要高得多。它們的主要優(yōu)點(diǎn)包括內(nèi)核之間的高帶寬和低延遲通信、降低的電力傳輸網(wǎng)絡(luò)阻抗以及卓越的能源效率。此外,這些處理器可以受益于擁有冗余的“額外”核心 —— 或者,對于特斯拉來說,擁有已知良好的處理器核心。
特斯拉的Dojo處理器是專門為人工智能訓(xùn)練設(shè)計(jì)的晶圓級處理器,具有以下顯著特點(diǎn):
1. 高集成度:Dojo處理器采用5x5陣列,共計(jì)25顆芯片,這些芯片放置在載體晶圓上,并使用臺(tái)積電的集成扇出(InFO)技術(shù)進(jìn)行晶圓級互連(InFO_SoW)。
2. 高性能連接:InFO_SoW技術(shù)旨在實(shí)現(xiàn)高性能連接,讓25個(gè)芯片可以像1個(gè)處理器一樣協(xié)同工作。
3. 高耗電與冷卻需求:由于Dojo處理器耗電量非常高,因此需要復(fù)雜的冷卻系統(tǒng),特斯拉為此設(shè)計(jì)了專門的電壓調(diào)節(jié)模塊和水冷散熱系統(tǒng)。
4. 專用于AI計(jì)算:Dojo核心具有類似CPU的風(fēng)格,比GPU更能適應(yīng)不同的算法和分支代碼,并且具有專注于加速AI計(jì)算的自定義向量指令。
5. 存算一體架構(gòu):D1芯片采用存算一體架構(gòu),運(yùn)行在2GHz,擁有巨大的440MB SRAM,提供近存計(jì)算的優(yōu)勢。
6. RISC-V架構(gòu)參:D1處理器的指令集參考了RISC-V架構(gòu),并自定義了一些指令,特別是矢量計(jì)算相關(guān)的指令。
7. 高算力密度:Dojo核心提供了1.024TFLOPS的算力,且?guī)缀跛械乃懔Χ加删仃囉?jì)算單元提供。
8. 數(shù)據(jù)流近存計(jì)算架構(gòu):D1處理器擁有分布式SRAM,通過大量更快更近的片上存儲(chǔ)減少對內(nèi)存的訪問頻度,提升系統(tǒng)性能。
9. 高帶寬和低延遲:Dojo處理器的NoC網(wǎng)絡(luò)可以處理跨節(jié)點(diǎn)邊界的數(shù)據(jù)同步,提供高帶寬和低延遲的通信。
10. 定制化架構(gòu):Dojo是一套完全可定制的架構(gòu),全面涵蓋計(jì)算、網(wǎng)絡(luò)、輸入/輸出(I/O)芯片。
11. 潛力巨大:據(jù)分析,Dojo有潛力為特斯拉增加巨額市值,特別是在移動(dòng)和網(wǎng)絡(luò)服務(wù)方面的應(yīng)用。
12. 先進(jìn)封裝技術(shù):Dojo訓(xùn)練模塊采用先進(jìn)的InFO_SoW封裝技術(shù),提高芯片間的互連密度。
13. 高性能計(jì)算:Dojo處理器由臺(tái)積電制造,采用7納米工藝,擁有500億個(gè)晶體管,芯片面積為645mm2,小于業(yè)界同類產(chǎn)品。
這些特點(diǎn)使得特斯拉的Dojo處理器在人工智能訓(xùn)練領(lǐng)域具有潛在的高性能和高效率,有望成為AI計(jì)算的強(qiáng)大解決方案。
免責(zé)聲明:本文原創(chuàng)作者張國斌,本文僅代表作者個(gè)人觀點(diǎn),不代表薩科微及行業(yè)觀點(diǎn),只為轉(zhuǎn)載與分享,支持保護(hù)知識產(chǎn)權(quán),轉(zhuǎn)載請注明原出處及作者,如有侵權(quán)請聯(lián)系我們刪除。
友情鏈接:站點(diǎn)地圖 薩科微官方微博 立創(chuàng)商城-薩科微專賣 金航標(biāo)官網(wǎng) 金航標(biāo)英文站
Copyright ?2015-2024 深圳薩科微半導(dǎo)體有限公司 版權(quán)所有 粵ICP備20017602號-1