本文轉(zhuǎn)自微信公號(hào)“美股研究社”,作者:陳思
AI 前線導(dǎo)讀:12 月 18 日,英偉達(dá)(NVDA.US) GTC China 2019 在蘇州金雞湖畔正式拉開(kāi)序幕,英偉達(dá)創(chuàng)始人黃仁勛身披那件熟悉的黑色皮夾克,對(duì)這一年公司取得的各項(xiàng)成果進(jìn)行匯報(bào)。
一年前,同樣是在這個(gè)場(chǎng)地,GTC China 2018 開(kāi)幕的前一天,英偉達(dá)股價(jià)“腰斬”,市值蒸發(fā)超 200 億美元。此后的一年里,英偉達(dá)一改往日高調(diào)“囂張”的態(tài)度,斂起鋒芒,低調(diào)發(fā)展,以至于幾乎一年多的時(shí)間里都沒(méi)有聽(tīng)到英偉達(dá)的“豪言壯語(yǔ)”。
面對(duì)英偉達(dá)如此巨大的態(tài)度轉(zhuǎn)變,人們不禁想問(wèn):英偉達(dá)這一年怎么了?
重磅技術(shù)發(fā)布回顧 新品帶來(lái)“小驚喜”
“The more you buy,the more money you save!”
沒(méi)錯(cuò),當(dāng)你看到這句話(huà)的時(shí)候,就應(yīng)該知道:黃仁勛回來(lái)了,熟悉的皮夾克,熟悉的“塑料中文”。
今天,老黃在四個(gè)領(lǐng)域帶來(lái)了幾項(xiàng)重大發(fā)布和新品:
圖形技術(shù)
圖形技術(shù)方面,RTX 已經(jīng)支持更多游戲的光影效果優(yōu)化,微軟的《我的世界》也在其中。另外,英偉達(dá)與騰訊 START 達(dá)成合作,為玩家提供云端游戲服務(wù),即使終端性能不足,也無(wú)損游戲體驗(yàn)。
作為英偉達(dá)圖形技術(shù)的王牌,RTX 已經(jīng)被頂尖渲染平臺(tái)采用,RTX Studio 更是包含 40 多個(gè)面向內(nèi)容工作者打造的產(chǎn)品。此外,黃仁勛在現(xiàn)場(chǎng)發(fā)布了面向建筑行業(yè)的大型 3D 圖形設(shè)計(jì)平臺(tái) OMNIVERSE,以前需要 485 個(gè)小時(shí)才能完成的渲染場(chǎng)景,現(xiàn)在只需要 40 小時(shí)。
HPC
黃仁勛稱(chēng),加速計(jì)算需要完整的堆棧工具,而出色的芯片只是起點(diǎn)。每個(gè)應(yīng)用程序領(lǐng)域都需要特殊的數(shù)學(xué)內(nèi)核、算法庫(kù)和應(yīng)用程序軟件優(yōu)化。英偉達(dá) CUDA 平臺(tái)具有豐富的庫(kù)、工具和應(yīng)用程序。僅在去年,英偉達(dá)就發(fā)布了 500 多個(gè) SDK 和庫(kù),其中既有全新內(nèi)容,也有更新版本。在不斷改進(jìn)軟件棧的基礎(chǔ)上,用戶(hù)已有 GPU 的性能也得到了提高,深度學(xué)習(xí)訓(xùn)練在 3 年內(nèi)提高了 4 倍,深度學(xué)習(xí)推理在 1 年內(nèi)提高 2 倍。
黃仁勛重點(diǎn)提到,英偉達(dá)為 CUDA 增加了兩個(gè)新的主流應(yīng)用:5G vRAN 和基因組處理。并且發(fā)布了一款基因組分析工具包 Parabricks。這是一個(gè) CUDA 加速的基因組處理工具包,可與用于發(fā)現(xiàn)變異并能產(chǎn)生與行業(yè)標(biāo)準(zhǔn) GATK 最近實(shí)踐流程一致的結(jié)果。
注:基因組處理流程在行業(yè)標(biāo)準(zhǔn)中被稱(chēng)為 GATk。這一過(guò)程可根據(jù)參考繪制 DNA 短鏈,以重建基因組并找出變異,因此屬于計(jì)算密集型任務(wù)。
PARABRICKS 的主要特征:
能實(shí)現(xiàn) 30~50 倍的加速;
能提供 DeepVariant 工具,利用深度學(xué)習(xí)技術(shù)進(jìn)行基因變異檢測(cè)。基于以上幾種優(yōu)勢(shì),目前已有基因技術(shù)公司采用了 PARABRICKS,借助若干 GUP 服務(wù)器,可以按照其測(cè)序儀生成數(shù)據(jù)的速率來(lái)處理基因組。
AI
在今天的發(fā)布會(huì)上,英偉達(dá)推出了 TensorRT 的最新版本 TensorRT 7。由于僅支持 CNN,去年發(fā)布的 TensorRT 5 飽受開(kāi)發(fā)者詬病。相比之下,最新版 TensorRT 7 可支持各種類(lèi)型的 RNN、transformer、CNN,能夠融合水平與垂直方向的運(yùn)算,為開(kāi)發(fā)者設(shè)計(jì)大量 RNN 配置自動(dòng)生成代碼,逐點(diǎn)融合 LSTM 單元,甚至可以跨多個(gè)時(shí)間步長(zhǎng)進(jìn)行融合,并盡可能做到自動(dòng)低精度處理。此外,TensorRT 7 可支持 1000 多種不同的計(jì)算變換和優(yōu)化。黃仁勛舉例說(shuō),有了 TensorRT 7 的支持,在 GPU 上編譯會(huì)話(huà)模型只需要 0.3 秒。
最新發(fā)布的機(jī)器人平臺(tái)芯片 Orin 能夠處理更高精度的傳感器與感知數(shù)據(jù),且擁有更強(qiáng)大的安全和防范能力。
Orin 芯片
該芯片由 170 億個(gè)晶體管組成,集成了 NVIDIA 新一代 GPU 架構(gòu)和 Arm Hercules CPU 內(nèi)核以及全新深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)加速器,每秒可運(yùn)行 200 萬(wàn)億次計(jì)算,幾乎是 NVIDIA 上一代 Xavier 系統(tǒng)級(jí)芯片性能的 7 倍。
Orin 可處理在自動(dòng)駕駛汽車(chē)和機(jī)器人中同時(shí)運(yùn)行的大量應(yīng)用和深度神經(jīng)網(wǎng)絡(luò),并且達(dá)到了 ISO 26262 ASIL-D 等系統(tǒng)安全標(biāo)準(zhǔn)。
作為一個(gè)軟件定義平臺(tái),DRIVE AGX Orin 能夠賦力從 L2 級(jí)到 L5 級(jí)完全自動(dòng)駕駛汽車(chē)開(kāi)發(fā)的兼容架構(gòu)平臺(tái),助力 OEM 開(kāi)發(fā)大型復(fù)雜的軟件產(chǎn)品系列。由于 Orin 和 Xavier 均可通過(guò)開(kāi)放的 CUDA、TensorRT API 及各類(lèi)庫(kù)進(jìn)行編程,因此開(kāi)發(fā)者能夠在一次性投資后使用跨多代的產(chǎn)品。
機(jī)器人
在智能機(jī)器人領(lǐng)域,英偉達(dá)發(fā)布發(fā)布 ISAAC SDK,提供模擬仿真和訓(xùn)練平臺(tái),包含多種預(yù)訓(xùn)練模型以及多種參考應(yīng)用樣例。
左:模擬場(chǎng)景;右:機(jī)器人學(xué)習(xí)后應(yīng)用在真實(shí)場(chǎng)景里
通過(guò)仿真,開(kāi)發(fā)人員可以在極端情況下(即困難或異常情況下)對(duì)機(jī)器人進(jìn)行測(cè)試,以進(jìn)一步加強(qiáng)對(duì)它的訓(xùn)練。將這些結(jié)果輸入訓(xùn)練管道,使神經(jīng)網(wǎng)絡(luò)可以基于真實(shí)和模擬數(shù)據(jù)來(lái)提高準(zhǔn)確性。
Isaac SDK 包括 Isaac Robotics Engine(提供應(yīng)用程序框架),Isaac GEM(預(yù)先構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)模型、算法、庫(kù)、驅(qū)動(dòng)程序和 API),用于室內(nèi)物流的參考應(yīng)用程序以及 Isaac Sim 的第一個(gè)版本(提供導(dǎo)航功能)。
使用 Isaac Sim 訓(xùn)練機(jī)器人,并將所生成的軟件部署到在現(xiàn)實(shí)世界中運(yùn)行的真實(shí)機(jī)器人中。這有望大大加快機(jī)器人的開(kāi)發(fā)速度,從而實(shí)現(xiàn)綜合數(shù)據(jù)的訓(xùn)練。
在最后,一款 one more thing 的發(fā)布讓人眼前一亮:
這個(gè)名叫 Leonardo 的機(jī)器人是 Isaac Sim 訓(xùn)練成果的最佳體現(xiàn),可以通過(guò)模擬學(xué)習(xí)物體抓取,黃仁勛表示:這就是未來(lái)機(jī)器人的雛形。
看過(guò)了英偉達(dá)這一年的技術(shù)積累,下面要談一談這一年來(lái)英偉達(dá)的種種遭遇。
GPU 需求放緩,股價(jià)三次暴跌,英偉達(dá)曾陷入低谷
看到今天在臺(tái)上依舊亢奮的黃老板,很難想象這是在一年內(nèi)經(jīng)歷了三次低谷打擊的人。
一年前,GTC China 2018 前一天,英偉達(dá)股價(jià) 暴跌約 18%,股價(jià)下滑至 164.43 美元 / 股,隨后幾天更一度跌到 145 美元。雖然當(dāng)時(shí)的發(fā)布會(huì)上的黃仁勛盡力在炒熱現(xiàn)場(chǎng)氣氛,但是會(huì)后取消采訪環(huán)節(jié)這一舉動(dòng)還是能夠感受到一絲無(wú)奈。
彼時(shí),黃仁勛曾表示:股價(jià)下跌與加密貨幣熱潮退散有直接關(guān)系。2017-2018 年,加密貨幣陷入狂熱,對(duì)算力的需求也暴增,英偉達(dá) GPU 的價(jià)格也因此被炒高,這使得一些買(mǎi)家望而卻步。隨著熱潮消退,游戲卡的價(jià)格回落至正常水平,英偉達(dá)自然希望那些被價(jià)格擋在門(mén)外的買(mǎi)家能再次回來(lái),推動(dòng)銷(xiāo)量增長(zhǎng)。
然而,一切并沒(méi)有想象的那么順利。很長(zhǎng)一段時(shí)間里,英偉達(dá)芯片的庫(kù)存都處于積壓狀態(tài),英偉達(dá) CFO Colette Kress 接受采訪時(shí)表示:要完全解決 GPU 過(guò)剩問(wèn)題,可能還需要 1~2 個(gè)季度。
出于謹(jǐn)慎的考慮,1 月 28 日,英偉達(dá)發(fā)布業(yè)績(jī)預(yù)警,將第四季度營(yíng)收預(yù)估下調(diào) 5 億美元,直接導(dǎo)致股市開(kāi)盤(pán)后英偉達(dá)股價(jià)一度 暴跌 17% 以上,最終收盤(pán)股價(jià)為 138.01 美元,下跌 13.82%,第二天則以 131.6 美元的價(jià)格收盤(pán)。
有分析師認(rèn)為:市場(chǎng)對(duì)于芯片的需求放緩依舊是困擾英偉達(dá)發(fā)展的一大問(wèn)題?;蛟S正是出于這樣的考慮,英偉達(dá)在 3 月以創(chuàng)紀(jì)錄的 69 億美元收購(gòu)以色列芯片設(shè)計(jì)公司 Mellanox,成英偉達(dá)史上最大收購(gòu)案。業(yè)內(nèi)人士認(rèn)為:英偉達(dá)此舉是希望擺脫對(duì)加密貨幣以及游戲市場(chǎng)的依賴(lài),從而專(zhuān)心將業(yè)務(wù)中心放在芯片技術(shù)上。
錢(qián)花出去了,但是見(jiàn)效仍然需要等待。今年 5 月,英偉達(dá)發(fā)布了第一季度的財(cái)報(bào)。財(cái)報(bào)顯示:英偉達(dá) 2019 年一季度營(yíng)收達(dá)到 22.2 億美元,但相比去年同期的 30.07 億美元,下降超過(guò) 30%;凈利潤(rùn)則更是引發(fā)擔(dān)憂(yōu):3.94 億美元的凈利潤(rùn)與去年同期的 12.44 億美元相比,下降甚至達(dá)到 68%。
一波未平一波又起,當(dāng)英偉達(dá)還沒(méi)來(lái)得及為下一季度的營(yíng)收擔(dān)憂(yōu)時(shí),6 月 18 日,美國(guó)政府又將 5 家以開(kāi)發(fā)芯片和超級(jí)計(jì)算機(jī)為主的中國(guó)企業(yè)和機(jī)構(gòu)拉進(jìn)“黑名單”,隨之而來(lái)的是美國(guó)芯片企業(yè)的股價(jià)集體暴跌,其中英偉達(dá)以 151.76 美元 的價(jià)格收盤(pán)。
8 月,英偉達(dá)第二季度財(cái)報(bào)發(fā)布,財(cái)報(bào)顯示:英偉達(dá)這一季度的營(yíng)收為 25.79 億美元,同比減少 30%,較上一財(cái)季的 22.2 億美元環(huán)比增長(zhǎng)了 16%;凈利潤(rùn)為 5.52 億美元,去年同期為 11.01 億美元,同比下滑 50%。
連續(xù)兩個(gè)季度的利潤(rùn)下滑,同時(shí)伴隨著三次嚴(yán)重的股價(jià)下跌,英偉達(dá)的 2019 上半年收獲了一份不太好看的成績(jī)單。
低調(diào)發(fā)布新品 轉(zhuǎn)身?yè)肀С?,能否絕處逢生?
經(jīng)歷了幾番重挫,英偉達(dá)變得收斂且低調(diào)了,同時(shí)也調(diào)轉(zhuǎn)船頭,向著芯片、超算為主的業(yè)務(wù)發(fā)展。
英偉達(dá)在 3 月收購(gòu)的 Mellanox 以其 InfiniBand 互連技術(shù)而聞名,該技術(shù)與高速以太網(wǎng)產(chǎn)品配合使用,可以快速地通過(guò)系統(tǒng)傳輸數(shù)據(jù),簡(jiǎn)單來(lái)說(shuō),就是可以將許多小型計(jì)算機(jī)連接成大型計(jì)算機(jī)。黃仁勛曾表示:對(duì) Mellanox 的收購(gòu)旨在解決通過(guò)智能網(wǎng)絡(luò)結(jié)構(gòu)連接大量快速計(jì)算節(jié)點(diǎn),以形成巨大的數(shù)據(jù)中心規(guī)模計(jì)算引擎的整體架構(gòu)。
借助 Mellanox,英偉達(dá)能夠?yàn)榭蛻?hù)提供更高的性能,更高的利用率和更低的運(yùn)營(yíng)成本。不難看出,芯片業(yè)務(wù)發(fā)展滯緩的情況下,英偉達(dá)將目標(biāo)瞄準(zhǔn)了超算。
6 月,英偉達(dá)宣布與 Arm 合作開(kāi)發(fā)超級(jí)計(jì)算機(jī),更是坐實(shí)了這一猜測(cè)。英偉達(dá)加速計(jì)算部門(mén)副總裁伊恩·巴克表示:Arm 技術(shù)能夠?yàn)槌?jí)計(jì)算提供一個(gè)開(kāi)放的架構(gòu)。
同樣在 6 月,英偉達(dá)推出了全球排名第 22 的超級(jí)計(jì)算機(jī):DGX SuperPOD。據(jù)英偉達(dá)官方介紹:它僅用三周時(shí)間就內(nèi)置了 96 臺(tái) NVIDIA DGX-2H 超級(jí)計(jì)算機(jī)和 Mellanox 互連技術(shù),具有 9.4 petaflops 的處理能力,可以訓(xùn)練安全自動(dòng)駕駛車(chē)輛所需的大量深度神經(jīng)網(wǎng)絡(luò)。
11 月,SC19 超算大會(huì)上,英偉達(dá)正式宣布:Arm 處理器可以使用來(lái)自英偉達(dá)的 GPU 加速技術(shù),比如 CUDA。此外,一款 GPU 新品也低調(diào)亮相——Tesla V100s,但是據(jù)參加活動(dòng)的媒體報(bào)道:黃仁勛在當(dāng)天的演講中并沒(méi)有提到這款產(chǎn)品。
低調(diào)的新品、擁抱超算的決心,英偉達(dá)在絕境中尋找生機(jī)。11 月 15 日,英偉達(dá)發(fā)布了第三季度的財(cái)報(bào),報(bào)告顯示,英偉達(dá)第三季度營(yíng)收為 30.14 億美元,與上年同期的 31.81 億美元相比下降 5%;凈利潤(rùn)為 8.99 億美元,與上年同期的 12.30 億美元相比下降 27%。
雖然各項(xiàng)數(shù)據(jù)與去年同期相比仍然較低,但是能明顯看到差距在縮小——英偉達(dá)正在努力恢復(fù)元?dú)狻?/p>
結(jié)語(yǔ)
身穿黑色皮夾克的黃仁勛甩掉了一身的疲憊,站在舞臺(tái)中央時(shí)又是精神抖擻,英偉達(dá)在 2019 年遭遇的種種也終會(huì)隨著時(shí)間的流逝而過(guò)去。雖然如芯片業(yè)務(wù)等諸多問(wèn)題仍然有待解決,但是一切都在向好的方向發(fā)展,或許就在不久之后,“核彈廠”又能爆發(fā)出新的威力。