智通財經(jīng)APP獲悉,國金證券發(fā)布研究報告稱,AI已在金融、醫(yī)療、交通、安防等多個垂直場景深度落地,且應(yīng)用場景拓展勢能強勁,伴生數(shù)據(jù)海量增長。據(jù)信通院,自O(shè)penAI于2020年推出GPT-3以來,超大預(yù)訓練模型參數(shù)數(shù)量、訓練數(shù)據(jù)規(guī)模按照300倍/年的趨勢增長,客觀推動高質(zhì)量數(shù)據(jù)需求指數(shù)級擴張。AI大模型催生高要求和新需求,專業(yè)化數(shù)據(jù)集及AI訓練師需求利好海天瑞聲(688787.SH)等優(yōu)質(zhì)專業(yè)數(shù)據(jù)解決方案提供商。
▍國金證券主要觀點如下:
AI基礎(chǔ)數(shù)據(jù)服務(wù)商脫胎于專業(yè)數(shù)據(jù)采標分工需求。
國內(nèi)AI基礎(chǔ)數(shù)據(jù)服務(wù)產(chǎn)業(yè)主要包括上游-數(shù)據(jù)產(chǎn)生及產(chǎn)能資源、中游-訓練數(shù)據(jù)生產(chǎn)、下游-AI算法研發(fā)三大產(chǎn)業(yè)環(huán)節(jié)。數(shù)據(jù)工程是AI工程基礎(chǔ)環(huán)節(jié),目前正處于市場格局漸趨清晰,新老技術(shù)迭代、下游需求加速釋放的關(guān)鍵節(jié)點。
AI快速落地疊加數(shù)據(jù)量指數(shù)級躍升,2025年國內(nèi)百億規(guī)??善凇?/strong>
場景側(cè),AI已在金融、醫(yī)療、交通、安防等多個垂直場景深度落地,且應(yīng)用場景拓展勢能強勁,伴生數(shù)據(jù)海量增長;
產(chǎn)品側(cè),據(jù)信通院,自O(shè)penAI于2020年推出GPT-3以來,超大預(yù)訓練模型參數(shù)數(shù)量、訓練數(shù)據(jù)規(guī)模按照300倍/年的趨勢增長,客觀推動高質(zhì)量數(shù)據(jù)需求指數(shù)級擴張。
據(jù)艾瑞咨詢,2025年我國AI基礎(chǔ)數(shù)據(jù)服務(wù)市場或達101億元,相較2022年翻倍。
AI大模型催生高要求和新需求,專業(yè)化數(shù)據(jù)集及AI訓練師需求利好海天瑞聲等優(yōu)質(zhì)專業(yè)數(shù)據(jù)解決方案提供商。
AI大模型時代無監(jiān)督/半監(jiān)督訓練重回主流,“基礎(chǔ)模型+微調(diào)”成為AI開發(fā)新范式,RLHF微調(diào)技術(shù)催生兩大新興需求。
一是預(yù)訓練階段催生AI廠商對標注完善、清洗完備的各類專業(yè)化場景數(shù)據(jù)集的需求;二是交互獎勵階段催生AI廠商對于具備專業(yè)事實判斷與規(guī)范價值判斷的人工智能訓練師的需求。
目前兩類新興需求尚未得到充分有效的市場供給。伴隨超大規(guī)模預(yù)訓練模型推動訓練數(shù)據(jù)指數(shù)級躍升,市場藍海亟待填補。
自動駕駛訓練數(shù)據(jù)需求方興未艾,海天瑞聲發(fā)力布局。
自動駕駛約占我國AI基礎(chǔ)數(shù)據(jù)服務(wù)市場規(guī)模的35%,系第一大下游場景,2025年市場規(guī)?;蜻_25億元。自動駕駛領(lǐng)域的業(yè)務(wù)類型可分為車載攝像頭采集的2D圖像數(shù)據(jù)標注與激光雷達采集的3D點云數(shù)據(jù)標注。目前業(yè)內(nèi)客戶對于全棧式閉環(huán)數(shù)據(jù)解決方案需求較高。
國內(nèi)市場集中度趨勢性收斂,海天瑞聲具備領(lǐng)先優(yōu)勢。
伴隨需求側(cè)AI垂直場景及專業(yè)化需求凸顯,數(shù)據(jù)需求量提升但數(shù)據(jù)采標業(yè)務(wù)門檻提高;供給端國內(nèi)數(shù)據(jù)安全標準及相關(guān)資質(zhì)要求提升,相關(guān)解決能力向頭部廠商聚集。
以海天瑞聲、Appen為代表的品牌數(shù)據(jù)服務(wù)商未來將替代中小型供應(yīng)商成為市場主要供應(yīng)力量。據(jù)IDC,2021年海天瑞聲在國內(nèi)AI基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)市占率高達12.9%,位居第一。Appen在覆蓋區(qū)域、語種/方言覆蓋能力等方面更具優(yōu)勢。
海外對標:Appen,全球AI基礎(chǔ)數(shù)據(jù)服務(wù)龍頭。
公司近五年營收CAGR達27.2%,主營業(yè)務(wù)包括數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理與模型評價三大類,業(yè)務(wù)類型齊全。主要客戶包括Google、Amazon、Microsoft等知名IT巨頭,客戶質(zhì)量較高。全球范圍看,Appen位居全球AI基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)收入體量首位,員工量能及標注技術(shù)均領(lǐng)先同業(yè)。
他山之石可以攻玉,對于國內(nèi)廠商而言,積極卡位全球AI頭部客戶將有助獲得大模型預(yù)訓練的業(yè)務(wù)紅利;持續(xù)拓寬業(yè)務(wù)矩陣,開辟模型評價模塊主動挖掘客戶數(shù)據(jù)需求將有助于縱向做深客戶價值;夯實數(shù)據(jù)采標技術(shù),緊跟行業(yè)趨勢發(fā)展包括機器標注在內(nèi)的先進數(shù)據(jù)采標技術(shù)將有助于筑牢自身業(yè)務(wù)護城河。