本文來(lái)源微信公眾號(hào)“雷鋒網(wǎng)”,作者Tinc V,原文標(biāo)題《百度 Intel 聯(lián)手打造新一代 Nervana NNP 芯片,性能提升 3 到 4 倍》。
未來(lái)幾年,人工智能模型的復(fù)雜性將會(huì)激增,對(duì)大規(guī)模深度學(xué)習(xí)計(jì)算的需求也會(huì)激增。
雷鋒網(wǎng)消息,在 7 月 3 日舉行的百度(BIDU.US) AI 開(kāi)發(fā)者大會(huì)上,百度發(fā)布了鴻鵠芯片以及多個(gè)智能音箱新品,宣布與華為麒麟合作,智能小程序也進(jìn)入新連接。
英特爾(INTC.US)副總裁兼人工智能產(chǎn)品事業(yè)部總經(jīng)理 Naveen Rao 也出席現(xiàn)場(chǎng)為百度打 Call,并宣布了與百度在 AI 方面的重磅合作——結(jié)合自家的專(zhuān)業(yè)知識(shí),共同打造用于訓(xùn)練 AI 的 Nervana 神經(jīng)網(wǎng)絡(luò)處理器(NNP,Neural Network Processor)。
聯(lián)手開(kāi)發(fā)強(qiáng)大的 AI 加速
英特爾表示,這款與百度合作開(kāi)發(fā)的處理器簡(jiǎn)稱 NNP-T,代號(hào)為“Spring Crest”;它的開(kāi)發(fā)意味著 AI 模型硬件的發(fā)展進(jìn)入“新階段”,因?yàn)樗梢约铀俅笠?guī)模分布式訓(xùn)練;它還對(duì)圖像識(shí)別進(jìn)行了優(yōu)化,刪去了標(biāo)準(zhǔn)的快取階層(cache hierarchy),片上存儲(chǔ)器(on-chip memeory)直接由軟件管理。
據(jù) VentureBeat 報(bào)道,NNP-T 有 24 個(gè)計(jì)算集群,32GB 的高頻寬存儲(chǔ)器(HBM2)和本地 SRAM,因此,這款即將推出的處理器在 AI 訓(xùn)練方面比同類(lèi)產(chǎn)品要強(qiáng)上最多 10 倍,比英特爾推出的首款 Nervana NNP 芯片 NNP-L 1000(代號(hào) Lake Crest)的性能強(qiáng) 3-4 倍。(雷鋒網(wǎng)按:2016 年,英特爾收購(gòu)人工智能公司 Nervana,2017 年,英特爾推出專(zhuān)為機(jī)器學(xué)習(xí)設(shè)計(jì)的 Nervana NNP 系列芯片)
不過(guò),英特爾也發(fā)表了聲明,AI 并非單一的工作負(fù)載,而是一種廣泛的、能夠強(qiáng)化所有手機(jī)上或者是大數(shù)據(jù)中心內(nèi)的應(yīng)用性能的強(qiáng)大能力;然而,不同的應(yīng)用對(duì)性能和功耗有著不同的要求,因此單一的 AI 硬件無(wú)法滿足一切需求。
在 AI 方面,英特爾認(rèn)為不僅要提供優(yōu)越的硬件選擇,還要通過(guò)軟件來(lái)最大化釋放硬件的性能,從而幫助客戶自如地運(yùn)行 AI 應(yīng)用,無(wú)論數(shù)據(jù)多么復(fù)雜。而英特爾選擇與百度密切合作,則能夠確保英特爾開(kāi)發(fā)部門(mén)始終緊跟客戶對(duì)訓(xùn)練硬件的最新需求。
Naveen Rao 表示,
未來(lái)幾年,人工智能模型的復(fù)雜性將會(huì)激增,對(duì)大規(guī)模深度學(xué)習(xí)計(jì)算的需求也會(huì)激增。英特爾和百度正專(zhuān)注于自己長(zhǎng)達(dá)十年的合作,建立全新的硬件,支持軟件協(xié)同設(shè)計(jì),這將隨著不斷變幻的現(xiàn)實(shí)情況而發(fā)展。我們稱之為 AI 2.0。
英特爾與百度是長(zhǎng)期好伙伴
雷鋒網(wǎng)了解到,近年來(lái),英特爾與百度已經(jīng)共同創(chuàng)建了許多基于 AI 應(yīng)用的解決方案。
自 2016 年以來(lái),英特爾就一直為百度 PaddlePaddle 深度學(xué)習(xí)框架而優(yōu)化 Xeon Scalable processor,今后,NNP-T 的優(yōu)化也將專(zhuān)注于 PaddlePaddle 的應(yīng)用,專(zhuān)注于神經(jīng)網(wǎng)絡(luò)的分布式訓(xùn)練,以完成其他類(lèi)型的 AI 應(yīng)用。
Constellation 研究公司的首席分析師兼副總裁 Holger Mueller 表示,
處理器架構(gòu)和平臺(tái)需要針對(duì)進(jìn)行優(yōu)化才能發(fā)揮作用,無(wú)論是目前的還是即將推出的處理器,這就解釋了英特爾與百度本次合作的重要性。
兩家公司探討了集成百度 PaddlePaddle 和英特爾 nGraph DNN(Deep Nerual Network)編譯器,有了 nGraph 的助力,數(shù)據(jù)科學(xué)家只用編寫(xiě)一次代碼就可以讓自己的 DNN 模型在各個(gè)平臺(tái)上有效地運(yùn)行,無(wú)需做額外的調(diào)整。
百度也借助英特爾傲騰數(shù)據(jù)中心級(jí)持久內(nèi)存的高性能,向數(shù)百萬(wàn)用戶提供個(gè)性化移動(dòng)內(nèi)容,并通過(guò)百度 AI 推薦引擎獲得更高效的客戶體驗(yàn)。
在數(shù)據(jù)安全方面,百度和英特爾在去年推出了 MesaTEE,一個(gè)基于英特爾 SGX (Software Guard Extension,軟件保護(hù)擴(kuò)展技術(shù))的 FaaS 計(jì)算框架;MesaTEE 使金融、自動(dòng)駕駛和醫(yī)療等安全敏感服務(wù)能夠安全地在遠(yuǎn)程平臺(tái)上處理數(shù)據(jù)。
今年早些時(shí)候,百度和英特爾還推出了全新硬件產(chǎn)品 BIE-AI-BOX。這款產(chǎn)品融合了百度智能邊緣技術(shù),連接攝像頭進(jìn)行車(chē)內(nèi)視頻監(jiān)控和分析。
雷鋒網(wǎng)小結(jié)
盡管百度與英特爾長(zhǎng)期以來(lái)都保持著緊密的合作關(guān)系,但本次兩家公司聯(lián)手打造 AI 加速處理器也顯得十分重要,因?yàn)榧幢阌布男阅茉購(gòu)?qiáng)大,也需要軟件的不斷磨合才能最大化地發(fā)揮 AI 的優(yōu)勢(shì)。
總而言之,百度與英特爾各取所長(zhǎng),開(kāi)發(fā)和優(yōu)化這款加速處理器,不僅能將大規(guī)模神經(jīng)網(wǎng)絡(luò)訓(xùn)練的步驟化繁為簡(jiǎn),還能在一定程度上,加速 Naveen Rao 所說(shuō)的 AI 2.0 的到來(lái)。