隨著自動(dòng)駕駛等級(jí)提升,對(duì)處理器的算力需求也水漲船高
隨著自動(dòng)駕駛等級(jí)提升,對(duì)處理器的算力也提出了更高的要求。
由于自動(dòng)駕駛需要在不同天氣、光線條件下對(duì)周圍環(huán)境進(jìn)行實(shí)時(shí)的感知,識(shí)別、跟蹤各種動(dòng)態(tài)或靜態(tài)的物體并對(duì)其可能的行為進(jìn)行預(yù)判,隨著自動(dòng)駕駛等級(jí)的提升,相應(yīng)的感知需求也在大幅增加。根據(jù)地平線的數(shù)據(jù),實(shí)現(xiàn)L2級(jí)別需要5個(gè)攝像頭+5個(gè)毫米波雷達(dá)的方案,而要實(shí)現(xiàn)L3高速公路自動(dòng)駕駛,需要的傳感器方案則需要大幅增加為13個(gè)攝像頭+9個(gè)毫米波雷達(dá)+1個(gè)激光雷達(dá)(各主機(jī)廠采用的方案不同,但傳感器數(shù)量的大幅增加的趨勢(shì)是顯而易見(jiàn)的)。
傳感器數(shù)量的增加意味著需要處理的數(shù)據(jù)量也在快速增長(zhǎng)。仍根據(jù)地平線的數(shù)據(jù),L4自動(dòng)駕駛的典型像素?cái)?shù)據(jù)高達(dá)112MP,約為L(zhǎng)2自動(dòng)駕駛的16倍;需要處理的數(shù)據(jù)量為40.8億字節(jié)/秒,約為L(zhǎng)2自動(dòng)駕駛的30倍。
英偉達(dá)(NVDA.US)領(lǐng)跑自動(dòng)駕駛芯片,幾家巨頭各有所長(zhǎng)
目前自動(dòng)駕駛芯片主要玩家可以大致分成三類。
第一類是能夠提供高算力的開(kāi)放性平臺(tái),主要是高通(QCOM.US)和英偉達(dá),這類玩家具有極為豐富的軟件生態(tài),此外還包括處于半通用狀態(tài),軟件生態(tài)弱于高通和英偉達(dá)的華為、賽靈思(XLNX.US)等。
第二類玩家主要是傳統(tǒng)汽車半導(dǎo)體巨頭,主要包括瑞薩、英飛凌、恩智浦(NXPI.US)、德州儀器(TXN.US)、意法半導(dǎo)體(STM.US)等。在英偉達(dá)、華為等廠商入局之后,這類玩家受到了一定的沖擊,但它們并沒(méi)有完全放棄自動(dòng)駕駛。比如瑞薩是這類玩家中在自動(dòng)駕駛芯片方面走的比較快的,它推出的針對(duì)ADAS和AD的ASIL-D級(jí)片上系統(tǒng)R-Car V3U算力已經(jīng)能夠達(dá)到60Tops,和高通的Ride平臺(tái)是持平的,但量產(chǎn)時(shí)間節(jié)點(diǎn)可能會(huì)更晚一些。
第三類玩家自研人工智能的ASIC芯片,主要包括特斯拉、Mobileye以及國(guó)內(nèi)的地平線、黑芝麻等,除特斯拉的自研芯片用在自己的FSD系統(tǒng)中之外,其他廠商往往對(duì)外提供軟硬件耦合的全棧解決方案。
英偉達(dá)目前是自動(dòng)駕駛芯片的領(lǐng)先者。目前,很多車企都選擇了英偉達(dá)的芯片,背后的原因有很多:
英偉達(dá)圍繞著車端、桌面端、云端構(gòu)建了GPU硬件統(tǒng)一架構(gòu)和CUDA軟件架構(gòu),在人工智能高性能計(jì)算方面擁有強(qiáng)大算力。英偉達(dá)是業(yè)界唯一有能力提供桌面端、云端和車端三端的統(tǒng)一架構(gòu)、統(tǒng)一軟件開(kāi)發(fā)環(huán)境的公司。在車端,英偉達(dá)構(gòu)建了端到端的平臺(tái),可以提供給涵蓋傳感器、域控制器、數(shù)據(jù)采集軟件的解決方案;在桌面端,做自動(dòng)駕駛的公司往往購(gòu)買(mǎi)的是英特爾的CPU和英偉達(dá)的游戲卡;在云端,CUDA和一系列的人工智能SDK都繞不過(guò)英偉達(dá),且圖像處理等方面的優(yōu)勢(shì)可以幫助英偉達(dá)的仿真平臺(tái)保持競(jìng)爭(zhēng)力。全棧能力保障了英偉達(dá)強(qiáng)大的生態(tài),因?yàn)樵谲嚩?、桌面端、云端的所有產(chǎn)品的軟件平臺(tái)都是一樣的,在云端開(kāi)發(fā)好的自動(dòng)駕駛軟件可以不用修改地在桌面端和車端來(lái)跑,節(jié)省了代碼的修改量。同時(shí),英偉達(dá)走的是GPU路線,開(kāi)發(fā)環(huán)節(jié)比較容易,不需要跟硬件去做額外的調(diào)配;而主要對(duì)手都是以ASIC方案居多,整個(gè)工具鏈不是很成熟,對(duì)于開(kāi)發(fā)者并不是特別友好。
英偉達(dá)進(jìn)入自動(dòng)駕駛市場(chǎng)更早,進(jìn)度上領(lǐng)先主要競(jìng)爭(zhēng)對(duì)手。2021年4月,英偉達(dá)發(fā)布了新一代SoC——Atlan,單SoC算力能夠達(dá)到1000TOPS,預(yù)計(jì)2023年向開(kāi)發(fā)者提供樣品,2025年大量裝車。目前英偉達(dá)自動(dòng)駕駛芯片領(lǐng)先主要競(jìng)爭(zhēng)對(duì)手2個(gè)代際,也就是差了差不多2年的周期。先發(fā)優(yōu)勢(shì)是英偉達(dá)的重要優(yōu)勢(shì),因?yàn)閷?duì)于主機(jī)廠來(lái)說(shuō),一旦選擇了一家的平臺(tái),后續(xù)的遷移成本是相對(duì)比較高的。神經(jīng)網(wǎng)絡(luò)本身需要很多的調(diào)優(yōu),它和硬件的耦合度比較高,可能在某個(gè)硬件上好不容易調(diào)到了比較好的效果,再換一套硬件有的重新來(lái),又需要重新調(diào);而且現(xiàn)在工具鏈并不是很成熟,調(diào)的過(guò)程可能會(huì)比較痛苦。
我們預(yù)計(jì)高通也會(huì)是最終牌桌上的玩家之一。目前來(lái)看,高通的優(yōu)勢(shì)至少有幾點(diǎn):
性價(jià)比的優(yōu)勢(shì)。從成本上看,高通在消費(fèi)級(jí)芯片和座艙芯片上居于領(lǐng)導(dǎo)者地位,消費(fèi)級(jí)芯片和座艙芯片向自動(dòng)駕駛芯片的遷移能夠?yàn)楦咄ü?jié)約掉一定的成本。比如高通的第一代Ride平臺(tái)就是用了兩顆座艙芯片加上一個(gè)ASIL-D的車規(guī)級(jí)自動(dòng)駕駛芯片去做冗余。而從功耗上來(lái)看,高通的重要對(duì)手英偉達(dá)芯片中并行計(jì)算的主角是GPU,在做一些常見(jiàn)的神經(jīng)網(wǎng)絡(luò)模型的時(shí)候效率上是不如ASIC的,所以英偉達(dá)的自動(dòng)駕駛芯片能效比要弱一些(當(dāng)然,英偉達(dá)目前也意識(shí)到了GPU的弱點(diǎn),芯片上也有ASIC架構(gòu)實(shí)現(xiàn)的深度學(xué)習(xí)加速引擎)。
高通是座艙域的絕對(duì)領(lǐng)導(dǎo)者,有助于自動(dòng)駕駛方案的推廣。根據(jù)高通的數(shù)據(jù),截至2020年底,25家頂級(jí)汽車制造商中已有20家選擇高通驍龍汽車數(shù)字座艙平臺(tái),搭載8155平臺(tái)的車型2021年陸續(xù)量產(chǎn),到2022年高通可能能占據(jù)70%-80%的份額,雖然未來(lái)市占率再進(jìn)一步攀升的空間不太大(主機(jī)廠一般會(huì)選兩個(gè)平臺(tái)做back up),但毫無(wú)疑問(wèn)目前高通在座艙域的地位已經(jīng)確立;而英偉達(dá)在座艙領(lǐng)域只有奔馳、奧迪、韓國(guó)現(xiàn)代等少量客戶。由于座艙域的滲透是比駕駛域要快的,高通通過(guò)座艙域和眾多主機(jī)廠形成了合作關(guān)系,通過(guò)座艙方案切入,再向主機(jī)廠推自己的自動(dòng)駕駛方案。而對(duì)于主機(jī)廠來(lái)說(shuō),在座艙和自動(dòng)駕駛上選同一家供應(yīng)商是更為有利的,因?yàn)檫@樣就不同同時(shí)維護(hù)兩個(gè)團(tuán)隊(duì)去學(xué)習(xí)兩家芯片廠商的軟件知識(shí)。
特斯拉(TSLA.US)是一個(gè)比較封閉的生態(tài),在先后和Mobileye、英偉達(dá)分道揚(yáng)鑣之后,特斯拉在2019年4月推出了自研的FSD芯片。FSD芯片的研發(fā)開(kāi)始于2017年,從設(shè)計(jì)到量產(chǎn)共歷經(jīng)18個(gè)月, 在2019年4月開(kāi)始正式在Model 3上應(yīng)用。同一塊板卡上有2顆芯片,每顆芯片的算力72TOPS,在行車過(guò)程中,兩顆芯片同時(shí)對(duì)相同數(shù)據(jù)進(jìn)行分析,并對(duì)比分析結(jié)果,互為驗(yàn)證,提高自動(dòng)駕駛的安全性。
特斯拉FSD芯片的特點(diǎn)主要體現(xiàn)在高速圖像處理、NPU、SRAM等三個(gè)方面。
以NPU為主:Mobileye EQ5芯片由4個(gè)模塊組成,分別是CPU、CVP、DLA和MA,以CPU和CVP為主;英偉達(dá)Xavier芯片主要由GPU、CPU、DLA、PVA以及兩個(gè)ASIC構(gòu)成,以GPU、CPU為主。而特斯拉FSD芯片主要由三個(gè)模塊構(gòu)成(CPU、GPU、NPU),以NPU為主,由于特斯拉未采用雷達(dá)視覺(jué)方案,并未包含CVP模塊。
高速圖像處理:1)在數(shù)據(jù)傳輸方面,F(xiàn)SD系統(tǒng)的圖像處理器SIP的數(shù)據(jù)傳輸速度達(dá)到25億像素/秒,這個(gè)傳輸速度遠(yuǎn)遠(yuǎn)大于8顆攝像頭所采集的數(shù)據(jù)量;2)在數(shù)據(jù)處理方面,F(xiàn)SD 芯片內(nèi)置的圖像處理器ISP的最高處理速度為10億像素/秒,已經(jīng)達(dá)到了最快的消費(fèi)級(jí)視頻傳輸DP1.4標(biāo)準(zhǔn),而通常意義上講,車載芯片是會(huì)落后于消費(fèi)級(jí)芯片的;
SRAM:ISP主要的作用是把攝像頭產(chǎn)生的原始三原色數(shù)據(jù)轉(zhuǎn)化成復(fù)雜的圖像信息,而在這些信息在進(jìn)入NPU被進(jìn)一步處理之前就會(huì)被存儲(chǔ)在SRAM中。根據(jù)特斯拉芯片總工程師Pete Bannon的說(shuō)法,處理全自動(dòng)駕駛的緩存帶寬至少要達(dá)到 1TB/秒,而FSD芯片SRAM的帶寬達(dá)到了2TB/秒。
華為有望成為自動(dòng)駕駛領(lǐng)域非常重要的力量。華為自研越影操作系統(tǒng),既能兼容LINUX,又能做到QNX的微內(nèi)核、低延時(shí),這樣的話其實(shí)能降低很多原來(lái)在LINUX框架下開(kāi)發(fā)的算法移植到這種車規(guī)級(jí)量產(chǎn)操作系統(tǒng)上的軟件移植的難度。同時(shí),華為也是芯片巨頭里唯一一家做傳感器的廠商,激光雷達(dá)和毫米波雷達(dá)都是自研的。
Mobileye提供黑盒方案,面臨一定的競(jìng)爭(zhēng)壓力。Mobileye提供的是一個(gè)黑盒解決方案,這也是目前業(yè)內(nèi)不太看好它的重要原因,因?yàn)镺TA是大的趨勢(shì),對(duì)于主機(jī)廠來(lái)說(shuō),黑盒方案已經(jīng)越來(lái)越無(wú)法滿足其需求。
本文選編自微信公眾號(hào)“計(jì)算機(jī)文藝復(fù)興”,作者:齊佳宏;智通財(cái)經(jīng)編輯:盧梭