本文來(lái)自“雷鋒網(wǎng)”,作者包永剛、王剛。
11月7日,在AMD在美國(guó)舊金山舉辦的“Next Horizon”新品發(fā)布會(huì)上正式宣布,繼全球首款7nm手機(jī)處理器之后,同樣基于臺(tái)積電7nm制程的CPU和GPU產(chǎn)品也正式發(fā)布。AMD推出了全球第一款7nm 代號(hào)“Rome”(羅馬)的第二代EPYC霄龍CPU處理器以及Radeon Instinct MI60/MI50的GPU計(jì)算卡。
此外,AMD宣布,AWS成為了公司服務(wù)器芯片的新合作伙伴,并將會(huì)采用霄龍(EPYC)服務(wù)器芯片。
受上述消息影響,AMD股價(jià)最高上漲8.8%。
7nm Rome(羅馬)第二代EPYC霄龍?zhí)幚砥?/p>
首發(fā)7nm CPU和GPU
AMD代號(hào)為Rome的第二代EPYC霄龍?zhí)幚砥骰赯en2架構(gòu),Rome EPYC采用特殊設(shè)計(jì)的架構(gòu),每顆處理器有8個(gè)CPU
裸片,每個(gè)裸片內(nèi)集成8個(gè)物理核心,共64個(gè)。同時(shí)為了更好地協(xié)調(diào)如此眾多CPU核心的協(xié)同工作,還專(zhuān)門(mén)設(shè)計(jì)了一個(gè)I/O裸片,放置在中央位置,專(zhuān)門(mén)負(fù)責(zé)輸入輸出控制,不過(guò)I/O裸片用14nm工藝制造。Rome處理器有8通道DDR4內(nèi)存控制器,每個(gè)插槽支持最高4TB
DRAM。
Rome EPYC也是第一個(gè)支持PCIE 4.0技術(shù)的服務(wù)器級(jí)CPU,支持128個(gè)PCIe 4.0,帶寬通道數(shù)翻番,可提升加速器性能,搭配同樣支持PCIE 4.0技術(shù)的全新加速卡Radeon Instinct MI60,AMD表示可以帶來(lái)前所未有的加速性能。當(dāng)然,Rome EPYC也是全球第一款采用7nm工藝的數(shù)據(jù)中心處理器。目前Rome EPYC更詳細(xì)的參數(shù)暫未公布,AMD預(yù)測(cè)Rome EPYC性能將因核心數(shù)量的增加而翻倍,浮點(diǎn)性能也將因?yàn)镮PC架構(gòu)的改進(jìn)和核心數(shù)量的增加兩倍。
兼容性方面,Rome EPYC與現(xiàn)有的Naples,以及下一代的Milan都將保持兼容,這可以簡(jiǎn)化基于AMD處理器的服務(wù)器開(kāi)發(fā),也能讓服務(wù)器公司把現(xiàn)有的設(shè)計(jì)用在未來(lái)的服務(wù)器當(dāng)中。進(jìn)度方面,AMD正在向服務(wù)器制造商提供Rome EPYC樣品,計(jì)劃在2019年推出產(chǎn)品,但具體時(shí)間尚未公布。亞馬遜AWS計(jì)算副總裁Matt Garman表示,基于AMD霄龍芯片的R5和M5實(shí)例產(chǎn)品今天就可使用,T3實(shí)例將在未來(lái)幾周上線,并重點(diǎn)強(qiáng)調(diào)了幫助客戶運(yùn)行最常見(jiàn)應(yīng)用程序時(shí)節(jié)省成本的特點(diǎn)。
GPU方面,AMD在今年Computex 2018上公布了7nm Radeon Vega GPU,雷鋒網(wǎng)《AMD搶先推全球首款7nm GPU,但能否按時(shí)出貨?》有詳細(xì)介紹,不過(guò)第一款正式發(fā)布的7nm GPU產(chǎn)品并不是Radeon RX游戲顯卡,而是Radeon Instinct計(jì)算卡。AMD同時(shí)發(fā)布了Radeon Instinct MI60/MI50,均基于7nm工藝的Vega架構(gòu),得益于7nm工藝,Radeon Instinct計(jì)算卡集成132億個(gè)晶體管,比目前14nm Vega 的125億個(gè)晶體管增加了6.4%,核心面積為331平方毫米,比現(xiàn)在的484平方毫米縮小了31.6%。據(jù)稱(chēng),在同等功耗下,新核心性能提升超過(guò)25%,同等頻率下新核心功耗降低50%。
Radeon Instinct顯存搭配最多32GB HBM2,帶寬達(dá)1TB/s,內(nèi)建ECC糾錯(cuò)。同樣,7nm Vega也是世界首個(gè)支持PCIE 4.0技術(shù)的GPU,雙向帶寬64GB/s,借助帶寬高達(dá)100GB/s的Infinity Fabric系統(tǒng)總線,支持4路GPU并行,雙路性能提升99%,4路比單路提升298%,8路比單路提升664%。
AMD 7nm Radeon Instinct 計(jì)算卡
在加速功能上,7nm Vega計(jì)算卡在幾個(gè)關(guān)鍵領(lǐng)域與Vega10有所不同,7nm Vega支持半速率雙精度,同時(shí)支持新的低精度數(shù)據(jù)類(lèi)型。具體看,MI60
FP64雙精度浮點(diǎn)最高為7.4TFlops,F(xiàn)P32單精度最高為14.7TFlops,INT整數(shù)最高為118Tops,相比于同樣Vega
10核心的MI25專(zhuān)業(yè)性能提升8.8倍。
還有值得注意的是,新的GPU還包括一對(duì)片外Infinity Fabric鏈路,允許Radeon Instinct卡通過(guò)相干鏈路直接相互連接。由于每個(gè)GPU只有2個(gè)鏈接,因此AMD的拓?fù)溥x項(xiàng)僅限于環(huán)上的變化,這意味著4路配置的GPU不能全部直接相互通信。另外,AMD仍堅(jiān)持使用PCIe卡,沒(méi)有像NVIDIA一樣的定制夾層式卡,所以這些卡需要通過(guò)頂部的橋接器連接。
為彌補(bǔ)AMD在軟件方面的不足,AMD宣布了開(kāi)源計(jì)算平臺(tái)ROCm 2.0,并繼續(xù)承諾完全開(kāi)源。進(jìn)度上,Radeon Instinct MI50將于今年第四季度上市,MI60將在明年一季度上市。
AMD宣布芯片新買(mǎi)家,AWS的第68次降價(jià)順勢(shì)到來(lái)
此次發(fā)布會(huì)上,AMD還宣布AWS成為了公司服務(wù)器芯片的新合作伙伴。競(jìng)爭(zhēng)對(duì)手英特爾短線跌逾1.1%,收跌0.88%,報(bào)47.25美元,接近五日新低。
CNBC分析稱(chēng),多年來(lái)英特爾一直是AWS的數(shù)據(jù)中心處理器供應(yīng)商,現(xiàn)在不得不與AMD“二分天下”,自然影響股價(jià)表現(xiàn)。
雷鋒網(wǎng)也了解到,目前AMD的霄龍?zhí)幚砥饕呀?jīng)用來(lái)支持全球前兩大公共云基建供應(yīng)商:亞馬遜AWS和微軟Azure的計(jì)算實(shí)例。
消息公布后,AWS隨即發(fā)布公告稱(chēng),新的EC2虛擬云服務(wù)器將為第三方客戶提供AMD霄龍?zhí)幚砥餍酒⒛転橥ㄓ脤?shí)例(M5和T3)和內(nèi)存優(yōu)化實(shí)例(R5)節(jié)約10%的計(jì)算成本。
AWS副總裁Matt Garman表示,基于AMD霄龍芯片的R5和M5實(shí)例產(chǎn)品今天就可使用,T3實(shí)例將在未來(lái)幾周上線。
雷鋒網(wǎng)在AWS官網(wǎng)上查詢(xún)一圈后發(fā)現(xiàn),一篇由AWS的首席布道師Jeff Barr寫(xiě)的博客《New Lower-Cost, AMD-Powered M5a and R5a EC2 Instances》非常值得關(guān)注,暫且將其翻譯為《新的低成本,AMD支持的M5a和R5a EC2實(shí)例》。
博客里的重點(diǎn)信息是:
目前為止,AWS已經(jīng)靈活調(diào)整了價(jià)格多達(dá)67次(這個(gè)數(shù)字此前雷鋒網(wǎng)在亞馬遜財(cái)報(bào)中亦有露出)。隨著與AMD合作的展開(kāi),將提供更加經(jīng)濟(jì)的EC2實(shí)例選擇。注:EC2實(shí)際上是亞馬遜提出來(lái)的概念,叫“彈性計(jì)算云”,Elastic Compute Cloud。它是一個(gè)讓使用者可以租用云端電腦運(yùn)行所需應(yīng)用的系統(tǒng)。簡(jiǎn)而言之就是EC2縮短了用戶獲取和啟動(dòng)新的服務(wù)器實(shí)例時(shí)間縮短到幾分鐘,用戶只需為實(shí)際使用的計(jì)算進(jìn)行支付。Amazon在2006年8月25日發(fā)布EC2受限公眾Beta版本。
最新的EC2實(shí)例由運(yùn)行速度為2.5 GHz的定制AMD EPYC處理器提供支持,價(jià)格比同類(lèi)產(chǎn)品低10%。雷鋒網(wǎng):這或許是AWS的“第68次降價(jià)行為”。
專(zhuān)門(mén)對(duì)M5a實(shí)例(通用型)和R5a實(shí)例(內(nèi)存優(yōu)化)做了負(fù)載說(shuō)明。M5a實(shí)例有6種尺寸可供選擇;R5a實(shí)例有6種尺寸,與R5實(shí)例相比,每GiB內(nèi)存價(jià)格較低。
新的EC2實(shí)例使用范圍。目前在美國(guó)弗吉尼亞北部、俄亥俄州、俄勒岡州、歐洲的愛(ài)爾蘭、亞洲新加坡等地可以使用最新EC2實(shí)例。當(dāng)然,價(jià)格會(huì)優(yōu)惠10%。
搶先推出7nm,AMD這次終于翻身了?
當(dāng)下,7nm無(wú)疑是業(yè)界關(guān)注的焦點(diǎn),不過(guò)AMD總裁兼首席執(zhí)行官蘇姿豐博士(Lisa Su)此前已經(jīng)多次談到AMD的7nm進(jìn)展。在此次Next
Horizon會(huì)議上,AMD CTO Mark
Papermaster表示,AMD在7nm上豪賭了一把,首先是相信能把7nm做出來(lái),其次是認(rèn)為7nm將成為產(chǎn)業(yè)關(guān)鍵節(jié)點(diǎn),并持續(xù)很長(zhǎng)一段時(shí)間。AMD最初的目標(biāo)是用自己的7nm和英特爾10nm競(jìng)爭(zhēng),至少打成平手,但沒(méi)想到AMD先做出了7nm,并將成為在新節(jié)點(diǎn)上最先推出產(chǎn)品的公司。
除了已經(jīng)公布7nm架構(gòu)和產(chǎn)品,AMD還表示明年銳龍、霄龍將全線轉(zhuǎn)向7nm工藝的Zen2架構(gòu),接下來(lái)將是7nm+升級(jí)版工藝的新架構(gòu)Zen3。不止于此,AMD還首次披露Zen4架構(gòu)正在設(shè)計(jì)中。Papermaster也強(qiáng)調(diào)了AMD路線圖的重要性以及實(shí)現(xiàn)路線圖的能力和決心,他表示Zen2架構(gòu)芯片正在流片,Zen3預(yù)計(jì)在2020年使用7nm+制程,Zen4開(kāi)發(fā)已接近尾聲。
在Next Horizon會(huì)議上發(fā)布7nm EPYC的時(shí)候,AMD用一顆Rome EPYC(64核心)與兩顆Skylake Xeon 8180M(56核心)同時(shí)渲染1080p/QuadHD/4K圖像對(duì)比,結(jié)果成績(jī)分別是28.1秒和30.2秒,AMD更勝一籌。GPU方面,AMD擁有GPU最快配置的1TB/S全內(nèi)存帶寬,甚至超過(guò)NVIDIA旗艦產(chǎn)品GV100 GPU。這是否意味著AMD憑借著7nm一舉超越了英特爾和英偉達(dá)?
雷鋒網(wǎng)在《AMD的7nm處理器樣品出鍋了,不過(guò)似乎對(duì)Intel威脅不大》一文中已經(jīng)提到,國(guó)外論壇HardOCP上的一位壇友mockingbird爆料稱(chēng)RTG(Radeon Technology Group)已經(jīng)收到首款Zen 2架構(gòu)7nm處理器的樣品,但測(cè)試樣品的基礎(chǔ)/睿頻頻率是4.0/4.5GHz,要比目前Ryzen 7 2700X(3.7/4.1GHz)高一些,但與英特爾8700K 4.7GHz的睿頻頻率有差距,更不及未來(lái)9800K/9900K的5GHz。雖然AMD未來(lái)還有繼續(xù)打磨提高頻率的空間,但從初代Ryzen測(cè)試樣品與正式發(fā)售產(chǎn)品的頻率對(duì)比來(lái)看,提升空間應(yīng)該不大。
另外,硬件以及7nm并不就意味著處理器的成功,指令集也十分關(guān)鍵。據(jù)了解,AMD先有了SSE5指令集,然后英特爾推出了AVX指令集,接著AMD又效仿AVX,但保留SSE5中的FMA4、CVT16和XOP指令;然后英特爾效仿AMD加入CVT16,但改名為F16C,隨后又加入FMA4簡(jiǎn)化后的FMA3和AVX2.0指令;AMD只得跟風(fēng),加入FMA3,承認(rèn)F16C,將來(lái)還要加入AVX2.0??梢钥吹紸MD在指令集方面的競(jìng)爭(zhēng)非常激烈。
至于GPU領(lǐng)域,從AMD首發(fā)的7nm計(jì)算卡可以看出其非常重視服務(wù)器市場(chǎng),不過(guò)在這一市場(chǎng)英偉達(dá)GPU擁有絕對(duì)的優(yōu)勢(shì),與在CPU領(lǐng)域與英特爾的競(jìng)爭(zhēng)一樣,英偉達(dá)的領(lǐng)先使其有能力從架構(gòu)以及指令集等方面占據(jù)優(yōu)勢(shì),一旦使用了7nm工藝,AMD在部分性能方面的優(yōu)勢(shì)能保持多久就不得而知。我們也可以從架構(gòu)上看,英偉達(dá)在今年八月放出了號(hào)稱(chēng)12年來(lái)的最大招圖靈(Turing)架構(gòu),但圖靈架構(gòu)的RTX2080 GPU也繼承了很多Fermi架構(gòu)的東西,這意味著AMD也不太可能完全放棄GCN架構(gòu)設(shè)計(jì)新的架構(gòu),并且此前AMD的研發(fā)中心都放在Zen架構(gòu)上,GPU的改進(jìn)乏力,基于目前的情況看,AMD能夠憑借新的工藝就實(shí)現(xiàn)對(duì)英偉達(dá)的反超?
雷鋒網(wǎng)認(rèn)為,AMD作為在高性能計(jì)算領(lǐng)域同時(shí)具有CPU和GPU產(chǎn)品的公司十分難得,不過(guò)可惜的是在CPU領(lǐng)域難以超越英特爾,在GPU領(lǐng)域難以超越英偉達(dá),這其中有技術(shù)的因素,也有商業(yè)方面的原因。當(dāng)然對(duì)于消費(fèi)者和云廠商而言,只有競(jìng)爭(zhēng)才會(huì)帶來(lái)更好的產(chǎn)品,因此對(duì)于AMD的7nm CPU和GPU我們依舊保持期待。