人工智能十問(wèn)：越來(lái)越卷的AI，未來(lái)路在何方

發(fā)布時(shí)間：2022-07-16作者來(lái)源：芯智訊瀏覽：1960

最近幾年，人工智能經(jīng)歷了爆火、發(fā)展、再到最近的熱度逐漸下降，似乎人工智能已經(jīng)成了大廠才能玩的游戲。

究其原因，就是人工智能的「門檻」越來(lái)越高了。

前不久，谷歌AI的代表人物Jeff Dean發(fā)表了一個(gè)新的工作，但在行業(yè)內(nèi)卻引發(fā)了一陣不小的風(fēng)波。究其原因，并不是工作本身有多么出色。這個(gè)研究只比[敏感詞]結(jié)果提升了0.03%，但卻花費(fèi)了價(jià)值57000多美元的TPU算力，這一下就炸鍋了。

很多人說(shuō)，現(xiàn)在的AI研究已經(jīng)變成了拼算力、拼資源的代表，普通學(xué)者卷不動(dòng)了。

還有很多人有這樣的疑惑：人工智能究竟給我們帶來(lái)了哪些改變？它除了下圍棋之外還會(huì)做什么，它的未來(lái)還會(huì)如何發(fā)展？

帶著這些問(wèn)題，我們和馮霽博士進(jìn)行了深入溝通。他是創(chuàng)新工場(chǎng)南京AI研究院的執(zhí)行院長(zhǎng)、倍漾量化創(chuàng)始人，在AI領(lǐng)域有著多年的研究經(jīng)驗(yàn)。通過(guò)這次對(duì)談，讓我們對(duì)AI未來(lái)的發(fā)展和落地有了新的認(rèn)識(shí)。

下面的小視頻提煉了對(duì)話的亮點(diǎn)，文章是對(duì)于對(duì)話的整理和采編：

注：以下的“我”，指的都是馮霽博士。

1、人工智能創(chuàng)新，遇到天花板？

谷歌最近這個(gè)問(wèn)題的確受到了挺多關(guān)注，我覺(jué)得有三個(gè)問(wèn)題值得思考：

[敏感詞]，大廠開始逐漸地走向「暴力美學(xué)」，也就是用「超大規(guī)模的數(shù)據(jù)」+「超大規(guī)模的算力」，暴力探索深度神經(jīng)網(wǎng)絡(luò)的天花板。不過(guò)，這種方法的邊界和極限在哪？

第二，從學(xué)術(shù)和科研的角度，這種方法是否是AI[敏感詞]的出路？事實(shí)上，目前已經(jīng)有大量研究在探索其他的技術(shù)路線，比如怎樣做到從感知智能往認(rèn)知智能去做轉(zhuǎn)變、怎樣利用比較小的數(shù)據(jù)量解決人工智能遇到的問(wèn)題，等等。

第三，對(duì)于工業(yè)界的實(shí)際應(yīng)用，是否真的需要如此大的算力？工業(yè)界有大量任務(wù)是非語(yǔ)音圖像文本相關(guān)的，這也是在倒逼著學(xué)術(shù)界去做一些比較高效的算法。

2、人工智能算法，只有深度神經(jīng)網(wǎng)絡(luò)？

90年代之前，「人工智能」的代表技術(shù)還是以「符號(hào)主義」為主，也就是基于邏輯推理，去做Planning、Searching這樣的技術(shù)。

2010年之后，迎來(lái)了人工智能的一次重要的轉(zhuǎn)變，那就是用神經(jīng)網(wǎng)絡(luò)技術(shù)去更好地表示這些感知類的任務(wù)。但是，目前還有大量的人工智能的「圣杯」問(wèn)題沒(méi)有得到解決，比如怎樣做邏輯推理、怎樣做常識(shí)、怎樣更好地對(duì)記憶進(jìn)行建模等等。

為了解決這些問(wèn)題，是不是用深度神經(jīng)網(wǎng)絡(luò)就夠？這可能是目前學(xué)術(shù)界和工業(yè)界更關(guān)心的下一個(gè)重要的方向。

3、人工智能的未來(lái)：感知 vs 認(rèn)知？

所謂的「感知人工智能」，其實(shí)就是最近幾年人工智能成功落地的代表性例子，比如圖像識(shí)別、語(yǔ)音轉(zhuǎn)文字，以及一些文本生成的任務(wù)等。

但更重要的是，怎么從這種感知類的任務(wù)，轉(zhuǎn)向具有認(rèn)知能力的任務(wù)，尤其是怎么用人工智能的方式來(lái)實(shí)現(xiàn)邏輯推理、實(shí)現(xiàn)常識(shí)，從而真正實(shí)現(xiàn)通用人工智能？

針對(duì)這個(gè)問(wèn)題，據(jù)我所知，學(xué)術(shù)界主要有三條技術(shù)路線。

[敏感詞]，仍然沿著神經(jīng)網(wǎng)絡(luò)這條路，通過(guò)不斷地堆數(shù)據(jù)和算力嘗試解決問(wèn)題。

第二，嘗試導(dǎo)入符號(hào)主義的技術(shù)，也就是連接主義+符號(hào)主義的結(jié)合。

第三，繼續(xù)提升傳統(tǒng)的邏輯推理技術(shù)，而這條路線也是最難的。

4、數(shù)據(jù)：數(shù)字時(shí)代的石油怎么采？

數(shù)據(jù)對(duì)于人工智能工程來(lái)說(shuō)，重要性已經(jīng)越來(lái)越高了。工業(yè)界提出了一個(gè)新的概念，叫「以數(shù)據(jù)為中心」的開發(fā)模式。相比之下，之前叫做「以模型為中心」。

傳統(tǒng)情況下，工程師更多的時(shí)間會(huì)花在如何搭建一個(gè)模型、如何通過(guò)調(diào)參來(lái)讓這個(gè)系統(tǒng)的性能更好。但現(xiàn)如今，大家80%的注意力都放在如何讓數(shù)據(jù)集變得更好、如何讓訓(xùn)練集變得更好、如何讓訓(xùn)練集更平衡，然后讓這個(gè)模型在好的數(shù)據(jù)集上訓(xùn)練，并得到比較好的結(jié)果。

隨著我們對(duì)數(shù)據(jù)隱私需求的逐漸增長(zhǎng)，數(shù)據(jù)帶來(lái)的一些負(fù)作用以及非技術(shù)要求也越來(lái)越多了。比如當(dāng)幾家機(jī)構(gòu)做聯(lián)合建模的時(shí)候，出于對(duì)數(shù)據(jù)隱私的保護(hù)，數(shù)據(jù)不能夠在機(jī)構(gòu)之間分享。所以像聯(lián)邦學(xué)習(xí)這樣的技術(shù)，就是為了在保護(hù)數(shù)據(jù)隱私的前提下，實(shí)現(xiàn)聯(lián)合建模。

現(xiàn)在大家已經(jīng)逐漸地意識(shí)到，在具體的工業(yè)開發(fā)中每家機(jī)構(gòu)不一樣的地方就是他們的數(shù)據(jù)。現(xiàn)在有了非常便利的軟件開源框架，也有了非常高效的硬件實(shí)現(xiàn)，工程師就都轉(zhuǎn)而去關(guān)注數(shù)據(jù)了——這是一個(gè)Paradigm Shift，也就是范式級(jí)別的轉(zhuǎn)變。

我自己孵化的倍漾量化，是以AI技術(shù)為核心的對(duì)沖基金。在公司內(nèi)部，每天需要存儲(chǔ)的數(shù)據(jù)量大概有25-30TB。因此我們就遭遇到了“內(nèi)存墻”的問(wèn)題。

為了應(yīng)對(duì)海量數(shù)據(jù)對(duì)內(nèi)存帶來(lái)的壓力，我們把數(shù)據(jù)分成了冷數(shù)據(jù)、溫?cái)?shù)據(jù)和熱數(shù)據(jù)。

“冷數(shù)據(jù)”指的是，數(shù)據(jù)訪問(wèn)的頻率不是很高，落庫(kù)就好。“熱數(shù)據(jù)”是指，我們要做大量的讀寫任務(wù)，而數(shù)據(jù)一般都比較散，每次讀寫的量又非常得大。那么如何把熱數(shù)據(jù)很好的進(jìn)行分布式存儲(chǔ)？

和純SSD方案相比，現(xiàn)在會(huì)有更好的解決方案，比如傲騰持久內(nèi)存：它介于內(nèi)存跟SSD之間，可以將熱數(shù)據(jù)做分布式存儲(chǔ)，就能一定程度地減緩“內(nèi)存墻”的問(wèn)題。

5、「AI-原生」的IT基礎(chǔ)設(shè)施，是否會(huì)出現(xiàn)？

現(xiàn)在有個(gè)很火的概念叫「云原生」，它促進(jìn)了云計(jì)算基礎(chǔ)設(shè)施的重構(gòu)。而針對(duì)人工智能而生的「AI-原生」，也已經(jīng)實(shí)實(shí)在在地發(fā)生了。尤其在過(guò)去的10年，計(jì)算機(jī)的硬件創(chuàng)新其實(shí)都是在圍繞著人工智能應(yīng)用而發(fā)展的。

舉個(gè)例子，當(dāng)前我們對(duì)于云端可信計(jì)算的需求越來(lái)越多了。比如AI模型的計(jì)算過(guò)程是一個(gè)公司的核心知識(shí)產(chǎn)權(quán)，如果把它放到云端或者公有平臺(tái)上，自然會(huì)擔(dān)心計(jì)算過(guò)程有被竊取的風(fēng)險(xiǎn)。

在這種情況下，有沒(méi)有基于硬件的解決方案？答案是肯定的，比如我們就在使用英特爾芯片上的SGX隱私沙盒，它能夠以硬件的方式來(lái)保障我們的計(jì)算，這個(gè)其實(shí)是跨機(jī)構(gòu)之間合作的一個(gè)非常重要的基礎(chǔ)。

這就是一個(gè)非常典型的例子，也就是從需求出發(fā)，推動(dòng)芯片或硬件廠商提供相應(yīng)的解決方案。

6、人工智能硬件，就等于GPU？

這個(gè)觀點(diǎn)確實(shí)就比較片面了。以倍漾量化每天的工作來(lái)舉例，當(dāng)我們?cè)谧隽炕灰椎臅r(shí)候，如果把數(shù)據(jù)從CPU拷貝到GPU，再拷貝回來(lái)，對(duì)于很多量化交易的任務(wù)就已經(jīng)來(lái)不及了。也就是說(shuō)，我們需要有一個(gè)非常高性能的、CPU版本的人工智能模型的實(shí)現(xiàn)。

再比如，我們有很多任務(wù)需要在網(wǎng)卡上直接對(duì)數(shù)據(jù)做分析和處理，而網(wǎng)卡上一般帶的是FPGA芯片，它處理的數(shù)據(jù)如果要傳到GPU上就更來(lái)不及了。對(duì)于這種低時(shí)延、又需要人工智能技術(shù)幫助的場(chǎng)景，我們需要一個(gè)異構(gòu)的架構(gòu)。

也就是說(shuō)，不管是FPGA、ASIC，還是CPU、GPU，在不同的場(chǎng)景下，它們都有不同的用武之地。

關(guān)于異構(gòu)平臺(tái)的編程，我看到工業(yè)界已經(jīng)有了一些嘗試。比如英特爾的oneAPI，我覺(jué)得是蠻重要的一個(gè)工具。也就是說(shuō)，oneAPI能讓同樣一套代碼能夠自動(dòng)地適配CPU、FPGA或者其他類型的芯片。這樣將會(huì)大大地減少工程師的編程難度，也能夠讓他們專注在算法創(chuàng)新上。

我覺(jué)得，這對(duì)于推動(dòng)異構(gòu)應(yīng)用非常重要。

7、未來(lái)人工智能發(fā)展的方向，還有哪些？

我覺(jué)得，可能需要一個(gè)更好的端到端的解決方案?，F(xiàn)在其實(shí)已經(jīng)從「軟件1.0」升級(jí)到了「軟件2.0」時(shí)代。也就是說(shuō)，從傳統(tǒng)規(guī)則驅(qū)動(dòng)的復(fù)雜軟件工程的構(gòu)建，變成了數(shù)據(jù)驅(qū)動(dòng)的軟件工程構(gòu)建方法。

之前，我們要靠很高的聰明才智寫一系列精妙的系統(tǒng)，才能讓整個(gè)程序能夠跑起來(lái)。這就類似于機(jī)械手表，[敏感詞]的程序員們都把精力放在構(gòu)建“齒輪”的運(yùn)轉(zhuǎn)、以及如何讓這個(gè)“手表”能夠跑起來(lái)。

現(xiàn)在，如果這一套運(yùn)行的規(guī)則我不知道該怎么定，那就直接把它撂給大量的數(shù)據(jù)或者機(jī)器學(xué)習(xí)算法，這個(gè)算法會(huì)生成一個(gè)新的算法，而這個(gè)新的算法是我們想去得到的東西。這種方式，有點(diǎn)像去造一個(gè)造機(jī)器人的機(jī)器人。

在軟件2.0時(shí)代，整個(gè)軟件工程的開發(fā)范式將有一個(gè)很大的轉(zhuǎn)變，我們很希望得到一套端到端的解決方案，核心就是怎樣更方便地實(shí)現(xiàn)「以數(shù)據(jù)為中心」的軟件工程開發(fā)。

8、人工智能，未來(lái)如何落地？

我覺(jué)得大概有兩方面。[敏感詞]，從工業(yè)界來(lái)看，還是要從[敏感詞]性原理出發(fā)，也就是基于自己的需求，并綜合考慮到很多的非技術(shù)因素。比如我看到有一個(gè)公司想做小區(qū)安防的人臉識(shí)別系統(tǒng)，但每個(gè)出入口后面要配4個(gè)非常昂貴的GPU，這就是典型的沒(méi)有從需求和成本出發(fā)。

第二，學(xué)術(shù)研究未必要跟風(fēng)。就像我們?cè)趧傞_始時(shí)說(shuō)到的那樣，對(duì)于模型的規(guī)模，并不需要相互攀比：你有一個(gè)千億的，我就要搞個(gè)萬(wàn)億的，你有個(gè)萬(wàn)億的我就要搞一個(gè)十萬(wàn)億的。

其實(shí)有大量的任務(wù)都需要小規(guī)模的參數(shù)，或者由于成本等限制，只能提供少量的樣本。在這種條件下，怎樣做創(chuàng)新和突破？這個(gè)是學(xué)術(shù)界應(yīng)該主動(dòng)擔(dān)起的責(zé)任。

9、人工智能創(chuàng)業(yè)，還是風(fēng)口嗎？

我們可以想想看，90年代末期，建個(gè)網(wǎng)站都要花2-3萬(wàn)元，因?yàn)楫?dāng)時(shí)會(huì)網(wǎng)絡(luò)編程技術(shù)的人鳳毛麟角。但是在今天，可能任何一個(gè)高中生，鼠標(biāo)點(diǎn)一點(diǎn)就能建站。

也就是說(shuō)，網(wǎng)絡(luò)知識(shí)已經(jīng)在每一個(gè)普通程序員的工具包里了。

其實(shí)，人工智能技術(shù)也是一樣。在2015年左右時(shí)，搭一套深度學(xué)習(xí)框架、還要在GPU上能跑起來(lái)，全球可能不超過(guò)1000個(gè)人。而現(xiàn)在經(jīng)歷了指數(shù)級(jí)別的增長(zhǎng)，很多人都會(huì)了。我們有理由相信，大概在五年之后，隨便一個(gè)程序員的工具包里就有更為豐富的人工智能解決方案，它的實(shí)現(xiàn)的門檻肯定是在不斷降低的。也只有這樣，人工智能技術(shù)才能更為普遍地應(yīng)用在每一個(gè)公司。

所以，大廠里的AI Lab是必然會(huì)消失的。就像2000年前后，很多公司都有一個(gè)Internet Lab，就是把公司所有跟網(wǎng)絡(luò)有關(guān)的事情專門搞一個(gè)實(shí)驗(yàn)室，由這個(gè)實(shí)驗(yàn)室向其他的業(yè)務(wù)部門做技術(shù)輸出。這是因?yàn)闀?huì)這項(xiàng)技術(shù)的人特別少，他們才要做這件事情。

AI Lab也是一樣的，當(dāng)AI技術(shù)落地的門檻逐漸降低時(shí)，大量業(yè)務(wù)部門的人也擁有類似的技術(shù)，那這種AI Lab就必然會(huì)消失。我覺(jué)得這就是在技術(shù)發(fā)展過(guò)程中一個(gè)臨時(shí)產(chǎn)品，這是個(gè)好事情。當(dāng)大廠沒(méi)有AI Lab的時(shí)候，大概就是人工智能真正遍地開花的年代。

10、人工智能，如何普惠大眾？

[敏感詞]，我們還需要摩爾定律的加持。現(xiàn)在還有大量的任務(wù)對(duì)算力的要求很大，我們必須不斷進(jìn)行硬件的迭代和算法的更新。只有當(dāng)需要在集群上跑的事情能在手機(jī)上跑，AI才可能有大量的落地。

第二，人工智能創(chuàng)新的重點(diǎn)，要從互聯(lián)網(wǎng)的業(yè)務(wù)轉(zhuǎn)向一些傳統(tǒng)的行業(yè)。之前大家的精力都在怎樣用人工智能做更好的視覺(jué)解決方案，或者更好的推薦系統(tǒng)，或者更好的P圖軟件。但在實(shí)體經(jīng)濟(jì)中，其實(shí)也有大量產(chǎn)生數(shù)據(jù)的部門和業(yè)務(wù)。當(dāng)這些實(shí)體經(jīng)濟(jì)數(shù)據(jù)能夠更好地信息化之后，它們所帶來(lái)的價(jià)值才可能遠(yuǎn)超于目前的虛擬經(jīng)濟(jì)。

免責(zé)聲明：本文采摘自網(wǎng)絡(luò)，本文僅代表作者個(gè)人觀點(diǎn)，不代表薩科微及行業(yè)觀點(diǎn)，只為轉(zhuǎn)載與分享，支持保護(hù)知識(shí)產(chǎn)權(quán)，轉(zhuǎn)載請(qǐng)注明原出處及作者，如有侵權(quán)請(qǐng)聯(lián)系我們刪除。

上一條：芯片行業(yè)將迎來(lái)超級(jí)大蕭條？
下一條：半導(dǎo)體風(fēng)暴來(lái)襲！蘋果砍單10%，AMD砍單2萬(wàn)片晶圓，美光減產(chǎn)！通用MCU也現(xiàn)砍單降價(jià)潮！