華泰證券：從DriveGPT看大模型如何賦能智能駕駛

作者：智通財經徐文強 2023-04-13 07:22:38

華泰證券建議關注L2級自動駕駛/AI算力產業(yè)鏈。

智通財經APP獲悉，華泰證券發(fā)布研究報告稱，DriveGPT將在今年新摩卡DHT-PHEV車型首發(fā)落地，提升HPilot高速/城市NOH安全性和流暢性。華泰證券認為，GPT大模型范式有望賦能垂直領域智能駕駛感知標注、決策推理等核心環(huán)節(jié)，加速智駕落地，同時大模型研發(fā)或推動駕駛數(shù)據和算力需求快速增長。建議關注L2級自動駕駛/AI算力產業(yè)鏈。

華泰證券主要觀點如下：

4月11日，毫末舉行第8屆AI DAY，發(fā)布了純視覺為主的DriveGPT大模型，該模型現(xiàn)階段主要用于解決自動駕駛認知決策問題，可以通過輸入駕駛場景數(shù)據進行多場景預測并規(guī)劃最佳行徑路途。目前DriveGPT已經包含4000萬公里的量產車駕駛數(shù)據、1200億參數(shù)，擁有19.6億個30萬類場景標簽。

DriveGPT：大模型賦能場景生成、軌跡預測、推理決策

毫末智行發(fā)布了其DriveGPT自動駕駛生成式大模型，具體邏輯：(1)感知環(huán)境離散化后作為token設計drive language；(2)輸入大量駕駛場景數(shù)據，利用transformer模型生成系列決策結果；(3)RLHF:將人工挑選困難場景Clips(數(shù)據組)輸入訓練模型，對生成結果進行最優(yōu)解排序；(4)Reward Model強化學習。DriveGPT目前可以根據歷史一段時間駕駛場景序列數(shù)據，不斷生成未來可能發(fā)生的多種駕駛環(huán)境并預測每種情況下車輛行駛軌跡。此外公司目前正設計利用prompt提示優(yōu)化輸出結果，并給DriveGPT加入思考鏈，使駕駛策略具備邏輯可解釋性，解決transformer黑盒模式潛在問題。

機會：大模型有望解決行業(yè)數(shù)據標注準確率及成本困境

視覺識別是開發(fā)大模型的基礎能力之一，識別傳感器輸入圖像中的車道線、車輛、行人、交通燈等要素并進行數(shù)據標注才能獲得大量的可用訓練數(shù)據集。我們看到DriveGPT等大模型可以很好地自動識別圖像以替代人工標注，據毫末會上表示，DriveGPT可以將交通場景圖像的標注費用從行業(yè)平均約5元/張降至約0.5元/張，計劃逐步向合作伙伴開放該服務。同時，我們認為近期Meta的CV模型SAM有望賦能自動駕駛行業(yè)，SAM無需額外訓練即可自動完成分割，提升機器視覺，有利于自動駕駛可用訓練集快速積累。

挑戰(zhàn)：國內AI智能駕駛大模型應用普及仍面臨數(shù)據需求和算力等挑戰(zhàn)

(1)數(shù)據：DriveGPT目前參數(shù)量約1200億，擁有約4,000萬公里的量產車駕駛數(shù)據。參考行業(yè)龍頭特斯拉2020年已有超48億公里數(shù)據，大模型賦能下我們認為國內公司或將加快智能駕駛系統(tǒng)量產上車步伐，加快數(shù)據搜集回饋模型訓練。(2)算力：特斯拉FSD背后擁有1.4W個GPU訓練集群；毫末建設MANA OASIS中心給DriveGPT提供67億次/秒的高性能浮點運算，2T/秒存儲帶寬，以及800G/秒通信帶寬支持；小鵬計算中心“扶搖”提供算力達600PFLOPS。大模型、大數(shù)據驅動的智能駕駛對算力提出了更高要求，有望驅動算力基礎設施需求。建議關注L2級自動駕駛/算力產業(yè)鏈。

智通聲明：本內容為作者獨立觀點，不代表智通財經立場。未經允許不得轉載，文中內容僅供參考，不作為實際操作建議，交易風險自擔。更多最新最全港美股資訊，請點擊下載智通財經App