智通財經APP獲悉,華泰證券發(fā)布研究報告稱,DriveGPT將在今年新摩卡DHT-PHEV車型首發(fā)落地,提升HPilot高速/城市NOH安全性和流暢性。華泰證券認為,GPT大模型范式有望賦能垂直領域智能駕駛感知標注、決策推理等核心環(huán)節(jié),加速智駕落地,同時大模型研發(fā)或推動駕駛數(shù)據和算力需求快速增長。建議關注L2級自動駕駛/AI算力產業(yè)鏈。
華泰證券主要觀點如下:
4月11日,毫末舉行第8屆AI DAY,發(fā)布了純視覺為主的DriveGPT大模型,該模型現(xiàn)階段主要用于解決自動駕駛認知決策問題,可以通過輸入駕駛場景數(shù)據進行多場景預測并規(guī)劃最佳行徑路途。目前DriveGPT已經包含4000萬公里的量產車駕駛數(shù)據、1200億參數(shù),擁有19.6億個30萬類場景標簽。
DriveGPT:大模型賦能場景生成、軌跡預測、推理決策
毫末智行發(fā)布了其DriveGPT自動駕駛生成式大模型,具體邏輯:(1)感知環(huán)境離散化后作為token設計drive language;(2)輸入大量駕駛場景數(shù)據,利用transformer模型生成系列決策結果;(3)RLHF:將人工挑選困難場景Clips(數(shù)據組)輸入訓練模型,對生成結果進行最優(yōu)解排序;(4)Reward Model強化學習。DriveGPT目前可以根據歷史一段時間駕駛場景序列數(shù)據,不斷生成未來可能發(fā)生的多種駕駛環(huán)境并預測每種情況下車輛行駛軌跡。此外公司目前正設計利用prompt提示優(yōu)化輸出結果,并給DriveGPT加入思考鏈,使駕駛策略具備邏輯可解釋性,解決transformer黑盒模式潛在問題。
機會:大模型有望解決行業(yè)數(shù)據標注準確率及成本困境
視覺識別是開發(fā)大模型的基礎能力之一,識別傳感器輸入圖像中的車道線、車輛、行人、交通燈等要素并進行數(shù)據標注才能獲得大量的可用訓練數(shù)據集。我們看到DriveGPT等大模型可以很好地自動識別圖像以替代人工標注,據毫末會上表示,DriveGPT可以將交通場景圖像的標注費用從行業(yè)平均約5元/張降至約0.5元/張,計劃逐步向合作伙伴開放該服務。同時,我們認為近期Meta的CV模型SAM有望賦能自動駕駛行業(yè),SAM無需額外訓練即可自動完成分割,提升機器視覺,有利于自動駕駛可用訓練集快速積累。
挑戰(zhàn):國內AI智能駕駛大模型應用普及仍面臨數(shù)據需求和算力等挑戰(zhàn)
(1)數(shù)據:DriveGPT目前參數(shù)量約1200億,擁有約4,000萬公里的量產車駕駛數(shù)據。參考行業(yè)龍頭特斯拉2020年已有超48億公里數(shù)據,大模型賦能下我們認為國內公司或將加快智能駕駛系統(tǒng)量產上車步伐,加快數(shù)據搜集回饋模型訓練。(2)算力:特斯拉FSD背后擁有1.4W個GPU訓練集群;毫末建設MANA OASIS中心給DriveGPT提供67億次/秒的高性能浮點運算,2T/秒存儲帶寬,以及800G/秒通信帶寬支持;小鵬計算中心“扶搖”提供算力達600PFLOPS。大模型、大數(shù)據驅動的智能駕駛對算力提出了更高要求,有望驅動算力基礎設施需求。建議關注L2級自動駕駛/算力產業(yè)鏈。