本文來(lái)自 微信公眾號(hào)“DoNews”作者:maomaobear。
日前,英特爾(INTC.US)發(fā)布了最新的酷睿11代處理器,處理器性能大幅提升。有意思的是,英特爾還同時(shí)發(fā)布了新款的GPU,性能已經(jīng)超過(guò)了MX350,而未來(lái)英特爾的獨(dú)立顯卡也即將發(fā)布。
無(wú)獨(dú)有偶,蘋果(AAPL.US)也在正在研發(fā)自己的GPU,準(zhǔn)備放到MAC上面替代AMD的GPU。
很長(zhǎng)一段時(shí)間,在GPU市場(chǎng),只有AMD(AMD.US)和NVIDIA(NVDA.US)競(jìng)爭(zhēng),眾多玩家都早早出局。而如今巨頭紛紛入場(chǎng),這體現(xiàn)了一種趨勢(shì),未來(lái)的計(jì)算模式將與今天大不相同。
GPU的作用
GPU的起源可以追溯到80年代初,最初計(jì)算機(jī)是不存在GPU概念的。但是計(jì)算機(jī)游戲的出現(xiàn),讓人們認(rèn)識(shí)到只靠CPU計(jì)算圖形,速度難以接受。
于是有了最早的2D顯示芯片,2D顯示芯片經(jīng)過(guò)多年的發(fā)展,到了90年代開(kāi)始有了3D顯示的概念。而3D顯示同樣需要大量的運(yùn)算。
最初,人們用2D顯示,用CPU做3D運(yùn)算,但是計(jì)算很慢效果很差,于是有了獨(dú)立的3D加速卡,譬如Voodoo,3D加速卡和2D加速分別計(jì)算圖形輸出。
幾年后,人們就把2D和3D做到一起,同時(shí)發(fā)現(xiàn)3D加速的計(jì)算能力非常強(qiáng)大,而且除了計(jì)算3D的坐標(biāo)與光照計(jì)算,還可以干點(diǎn)別的。這就是NVIDIA提出的通用計(jì)算概念。
由于3D游戲的加速依靠暴力計(jì)算比較多,所以3D顯示芯片的速度比CPU進(jìn)步快得多。
1997年到2000年,CPU性能進(jìn)步大約5-6倍(2010年到2017年,CPU性能只進(jìn)步了30%),而GPU性能提升了26倍。
這讓GPU的運(yùn)算能力超過(guò)了CPU,人們希望讓GPU在跑游戲,做設(shè)計(jì)之外多做一些計(jì)算的事情。
一開(kāi)始,人們單獨(dú)編程,用GPU做一些視頻壓縮的工作。后來(lái)NVIDIA提出CUDA,同時(shí)讓GPU支持了科學(xué)計(jì)算常用的雙精度浮點(diǎn),讓GPU做科學(xué)計(jì)算。
這樣一來(lái),GPU開(kāi)始變成重要的計(jì)算力,在前幾年比特幣興起的時(shí)候,GPU挖礦變得非常重要。
而2012年后,伴隨著人工智能的興起,GPU的大規(guī)模計(jì)算能力有了用武之地。NVIDIA股價(jià)上天。
到了2020年,GPU反而成了運(yùn)算的主力,單純依靠CPU的計(jì)算能力已經(jīng)很難登上最強(qiáng)超級(jí)計(jì)算機(jī)的寶座了。
GPU有玩游戲的顯卡,變成了科學(xué)計(jì)算和人工智能計(jì)算的主力。
英特爾和蘋果的意圖
多年以來(lái),英特爾都在高性能計(jì)算領(lǐng)域獲得豐厚的利潤(rùn),英特爾很早也認(rèn)識(shí)到了NVIDIA通用計(jì)算對(duì)英特爾的挑戰(zhàn)。
但是英特爾的應(yīng)對(duì)是攢了一大堆P54C核心搞出來(lái)一張專用的計(jì)算卡。但是成本很高,競(jìng)爭(zhēng)不過(guò)NVIDIA。
于是,英特爾開(kāi)始考慮把GPU發(fā)展起來(lái),一方面GPU可以用在PC之中,壓低成本,另外一方面這個(gè)GPU就是科學(xué)計(jì)算與人工智能計(jì)算的工具,這樣就能與NVIDIA競(jìng)爭(zhēng)了,避免英特爾的CPU在高性能計(jì)算領(lǐng)域的邊緣化。
蘋果的想法簡(jiǎn)單一些,蘋果在移動(dòng)領(lǐng)域已經(jīng)實(shí)現(xiàn)了GPU自主和CPU自主。
而移動(dòng)領(lǐng)域的性能已經(jīng)非常接近桌面,蘋果在CPU上棄用英特爾,在GPU上用自己研發(fā)的高性能GPU替代AMD也是常理。
因?yàn)樘O果自己軟硬一體,生態(tài)系統(tǒng)只有幾家軟件廠商重要,整體轉(zhuǎn)換比較容易,蘋果傾向于自己掌控,獲得更高的性能與商業(yè)利潤(rùn)。
英特爾和蘋果都是為了賺錢,但是英特爾做GPU是對(duì)高性能計(jì)算市場(chǎng)的防守策略,而蘋果是替代的進(jìn)攻策略。
未來(lái)的計(jì)算或?qū)⒋笠唤y(tǒng)
2020年,世界排名第一的計(jì)算機(jī)是日本的富岳,它采用的架構(gòu)與中國(guó)的神威高度類似。
在一個(gè)處理器單元里面,有一個(gè)CPU主控,然后有12個(gè)計(jì)算核心負(fù)責(zé)暴力計(jì)算。
中國(guó)的神威是一個(gè)單元里面有一個(gè)CPU主控,有64個(gè)計(jì)算核心負(fù)責(zé)暴力計(jì)算。
在NVIDIA發(fā)布的計(jì)算單元里面,一個(gè)計(jì)算盒子里面有兩塊最新的AMD處理器負(fù)責(zé)主控,有8塊計(jì)算卡負(fù)責(zé)計(jì)算。
我們看到這些計(jì)算架構(gòu)都是類似的。
CPU適合邏輯計(jì)算,GPU或者計(jì)算核心適合暴力計(jì)算。只是超級(jí)計(jì)算機(jī)把它們做到一塊芯片上面,而NVIDIA自己不生產(chǎn)CPU,把它們分開(kāi)了。
未來(lái),可能出現(xiàn)CPU與GPU合一,類似于超級(jí)計(jì)算機(jī)架構(gòu)的PC。
PC就是一個(gè)融合CPU和GPU的計(jì)算單元,這個(gè)計(jì)算單元自帶高速顯存。邏輯任務(wù)讓CPU計(jì)算,游戲和暴力計(jì)算任務(wù)交給GPU。
高性能PC,是這種計(jì)算單元的聯(lián)合,需要更強(qiáng)的性能,就增加單元數(shù)量。
辦公用一個(gè),普通游戲用兩個(gè),高性能游戲用四個(gè),人工智能工作站用八個(gè)。而超級(jí)計(jì)算機(jī)是把八個(gè)單元組成的工作站再用高速網(wǎng)絡(luò)連接起來(lái)。
從最簡(jiǎn)單的辦公PC到最高性能需求的超級(jí)計(jì)算機(jī)都是一個(gè)架構(gòu),實(shí)現(xiàn)大一統(tǒng)。
這樣,每個(gè)單元都高度一致,成本會(huì)控制到最低。消費(fèi)者也會(huì)獲得更廉價(jià)的算力。
(編輯:曾盈穎)