華金證券:云端計算進入高性能計算時代 大模型訓練仍以GPU為主

云端計算進入高性能計算時代,大模型訓練仍以GPU為主。

智通財經(jīng)APP獲悉,華金證券發(fā)布研究報告稱,云端計算進入高性能計算時代,大模型訓練仍以GPU為主。該行判斷GPU仍將是訓練模型的主流硬件:1)Transformer架構是最近幾年的主流,該架構最大的特點之一就是能夠利用分布式GPU進行并行訓練,提升模型訓練效率;2)ASIC的算力與功耗雖然看似有優(yōu)勢,但考慮到AI算法還是處于一個不斷發(fā)展演進的過程,用專用芯片部署會面臨著未來算法更迭導致芯片不適配的巨大風險;3)英偉達強大的芯片支撐、生態(tài)、算法開源支持。

建議關注:瑞芯微(603893.SH)、晶晨股份(688099.SH)、星宸科技(待上市)、全志科技(300458.SZ)、北京君正(300223.SZ)、中科藍訊(688332.SH)、富瀚微(300613.SZ)、恒玄科技(688608.SH)。

華金證券主要觀點如下:

在芯片算力快速提升、日趨龐大的數(shù)據(jù)量共同支撐下,AI算法迭代升級加速。

AI的發(fā)展經(jīng)歷了很長時間的積累,其能不斷跨越科學與應用之間的鴻溝主要得益于技術突破、行業(yè)落地、產(chǎn)業(yè)協(xié)作等多方面的推動,而技術突破是其中最為關鍵的要素。從起步階段發(fā)展到當下深度學習階段,算法、數(shù)據(jù)和算力構成了AI三大基本要素,并共同推動AI向更高層次的感知和認知發(fā)展。算法方面,目前深度學習仍然是AI技術發(fā)展的主導路線,但是早期所使用的有監(jiān)督學習方式由于受限于對大量標注數(shù)據(jù)依賴與理解能力缺乏,而且模型通用性較差,正逐步被新的技術所取代,在芯片算力的快速提升、日益龐大的數(shù)據(jù)量這兩者的支撐下,新算法正處于加速迭代升級過程中。

自監(jiān)督學習的算法模型快速發(fā)展,“預訓練+精調(diào)”的開發(fā)范式邁向成熟,新一輪AI技術產(chǎn)業(yè)化之路開啟。

谷歌、臉書等多家企業(yè)先后發(fā)布使用自監(jiān)督學習的算法模型,通過挖掘無標注數(shù)據(jù)的監(jiān)督信息,減少人為干預?,F(xiàn)階段自監(jiān)督學習本質(zhì)上仍依賴規(guī)范化、標簽化的數(shù)據(jù),主要借助預訓練模型構筑并學習數(shù)據(jù)特征?!邦A訓練”的做法一般是將大量低成本收集的訓練數(shù)據(jù)放在一起,經(jīng)過某種預訓方法去學習其中的共性,然后將其中的共性“移植”到特定任務的模型中,再使用相關特定領域的少量標注數(shù)據(jù)進行“微調(diào)”,這樣的話,模型只需要從“共性”出發(fā),去“學習”該特定任務的“特殊”部分即可。

預訓練模型成功的關鍵是自監(jiān)督學習與Transformer的結(jié)合。預訓練大模型在海量數(shù)據(jù)的學習訓練后具有良好的通用性和泛化性,用戶基于大模型通過零樣本、小樣本學習即可獲得領先的效果,同時“預訓練+精調(diào)”等開發(fā)范式,讓研發(fā)過程更加標準化,顯著降低了人工智能應用門檻。整體上來看,關于本輪AI技術突破所帶來的產(chǎn)業(yè)化變局,該行有三個核心觀點:1、基于GPT為代表的大模型AI的通用能力,未來幾年大模型AI的滲透廣度、深度和速度有可能會超預期;2、ChatGPT采用的是閉源模型,其加速的產(chǎn)業(yè)落地會刺激更多的廠商加大大模型AI的研發(fā)投入,進而推動AI產(chǎn)業(yè)化發(fā)展;3、大模型AI通用能力的提升,帶動的將不僅僅是云計算市場的增長,伴隨著多種技術與商業(yè)化路徑的逐步成熟,云、邊緣、端的增量市場空間均有望漸次打開。

云端計算進入高性能計算時代,大模型訓練仍以GPU為主。

雖然AI芯片目前看有GPU、ASIC、CPU、FPGA等幾大類,但是基于幾點原因,該行判斷GPU仍將是訓練模型的主流硬件:1、Transformer架構是最近幾年的主流,該架構最大的特點之一就是能夠利用分布式GPU進行并行訓練,提升模型訓練效率;2、ASIC的算力與功耗雖然看似有優(yōu)勢,但考慮到AI算法還是處于一個不斷發(fā)展演進的過程,用專用芯片部署會面臨著未來算法更迭導致芯片不適配的巨大風險;3、英偉達強大的芯片支撐、生態(tài)、算法開源支持。

模型小型化技術逐步成熟,從訓練走向推理,云、邊、端全維度發(fā)展。

該行認為至少有四大投資主線應持續(xù)關注:1、GPU方面,在英偉達的推動下,其從最初的顯卡發(fā)展到如今的高性能并行計算,海外大廠已經(jīng)具備了超過20年的技術、資本、生態(tài)、人才等儲備,形成了大量的核心技術專利,而且也能充分享有全球半導體產(chǎn)業(yè)鏈的支撐,這都或是目前國內(nèi)廠商所缺失的。近幾年在資本的推動下,國內(nèi)涌現(xiàn)出數(shù)十家GPU廠商,各自或都具備一定的發(fā)展基礎,但整體經(jīng)營時間較短,無論從技術積淀、產(chǎn)品料號布局、高端料號性能來說,與國外大廠仍具備較大差距。

但國產(chǎn)化勢在必行,國內(nèi)相關產(chǎn)業(yè)鏈重點環(huán)節(jié)也積極對上游芯片原廠進行扶持,國產(chǎn)算力芯片需要不斷迭代以實現(xiàn)性能的向上提升,后續(xù)持續(xù)關注相關廠商料號升級、生態(tài)建設和客戶突破;2、AI在端側(cè)設備應用普及是大勢所趨,目前,知識蒸餾、剪枝、量化等模型小型化技術在逐步成熟,AI在云、邊、端全方位發(fā)展的時代已至。除了更加廣泛的應用帶來需求量的提升外,更復雜算法帶來更大算力的需求也將從另一個維度推動市場擴容;3、數(shù)據(jù)的高吞吐量需要大帶寬的傳輸支持,光通信技術作為算力產(chǎn)業(yè)發(fā)展的支撐底座,具備長期投資價值;4、Chiplet技術可以突破單一芯片的性能和良率等瓶頸,降低芯片設計的復雜度和成本?;谙駽hiplet模式的設計轉(zhuǎn)型,已經(jīng)是大型芯片廠商的共識,相關產(chǎn)業(yè)鏈具備長期投資價值。

風險提示:技術創(chuàng)新風險、宏觀經(jīng)濟和行業(yè)波動風險、國際貿(mào)易摩擦風險。

智通聲明:本內(nèi)容為作者獨立觀點,不代表智通財經(jīng)立場。未經(jīng)允許不得轉(zhuǎn)載,文中內(nèi)容僅供參考,不作為實際操作建議,交易風險自擔。更多最新最全港美股資訊,請點擊下載智通財經(jīng)App
分享
微信
分享
QQ
分享
微博
收藏