智通財(cái)經(jīng)APP獲悉,中信證券發(fā)布研究報(bào)告稱,OpenAI通過(guò)開放API接口,以LLMaaS對(duì)外提供服務(wù),同時(shí)通過(guò)“蒸餾”方式實(shí)現(xiàn)模型推理成本降低等方式&舉措,有望在未來(lái)成為各大AI公司在提供AI服務(wù)時(shí)的主流商業(yè)化范式,推動(dòng)更多AI產(chǎn)品在中短期的商業(yè)化落地,在全球范圍內(nèi)加速AI產(chǎn)業(yè)化進(jìn)程。該行持續(xù)看好ChatGPT及AI領(lǐng)域的產(chǎn)業(yè)投資機(jī)會(huì),并建議持續(xù)聚焦芯片、算力設(shè)施、模型架構(gòu)&工程實(shí)踐、應(yīng)用場(chǎng)景等核心環(huán)節(jié)。
事件:北京時(shí)間2023年3月2日凌晨,OpenAI發(fā)布了Beta版本的ChatGPT API,并以收費(fèi)形式提供給用戶使用。根據(jù)OpenAI官網(wǎng)介紹,本次開放的API背后模型被命名為GPT-3.5 turbo,使用了與ChatGPT相同的模型。此外,與ChatGPT API一同開放的模型還有聲音轉(zhuǎn)文字模型Whispe的API。根據(jù)OpenAI官網(wǎng),截至北京時(shí)間3月3日,目前已經(jīng)有五家公司宣布接入了ChatGPT API,分別為即時(shí)通訊軟件Snapchat、學(xué)習(xí)平臺(tái)Quizlet、購(gòu)物網(wǎng)站Instacart、購(gòu)物軟件 shop以及教育軟件speak。
中信證券主要觀點(diǎn)如下:
OpenAI商業(yè)模式:以LLMaaS(Large Language Model as a Service)提供云端推理服務(wù),通過(guò)用戶訂閱以及用量計(jì)費(fèi)。
根據(jù)openAI CEO Sam Altman在2022年12月底的采訪,目前OpenAI2022年的總收入約為1億美元,并預(yù)計(jì)在2024年達(dá)到10億美元。目前OpenAI的主要收入來(lái)源包括訂閱費(fèi)、API許可費(fèi)、與微軟深度合作所產(chǎn)生的商業(yè)化收入等。在API許可費(fèi)方面,OpenAI將GPT-3等模型開放給別的商業(yè)公司使用,根據(jù)用量收取費(fèi)用(文字類模型按照文字生成量、圖片類模型按照?qǐng)D片生成張數(shù))。在調(diào)用過(guò)程中,其他公司并不會(huì)接觸模型的細(xì)節(jié)與源代碼,而是通過(guò)OpenAI提供的API接口進(jìn)行調(diào)試以及使用。本次公布的ChatGPT API接口被OpenAI定價(jià)為0.2美分每1000tokens(約合500-600單詞),相比于前一代的Davinci模型成本下降了90%。
ChatGPT成本優(yōu)化:主要通過(guò)“蒸餾”提取小模型方式實(shí)現(xiàn)模型參數(shù)減少、計(jì)算復(fù)雜度降低等。
從本次OpenAI對(duì)ChatGPT API的定價(jià)出發(fā),結(jié)合該行之前對(duì)ChatGPT模型成本的測(cè)算,0.2美分每1000tokens的定價(jià)對(duì)應(yīng)為百億參數(shù)級(jí)別的模型。而ChatGPT在訓(xùn)練過(guò)程中所使用得Reward Model(獎(jiǎng)勵(lì)模型,記錄了人類偏好)應(yīng)為千億參數(shù)級(jí)別的模型,這也意味著OpenAI將其在千億參數(shù)模型中所學(xué)習(xí)到的能力通過(guò)類似于蒸餾(distillation)的方式濃縮進(jìn)了百億參數(shù)的模型中。根據(jù)截至目前ChatGPT API用戶在推特等社交媒體的反饋結(jié)果看,這個(gè)百億參數(shù)模型的能力以及追平甚至超越了先前的大尺寸模型。通過(guò)這種蒸餾提煉的方法,OpenAI有效降低了模型在推理端的成本,找到可以盈利的商業(yè)化途徑。
未來(lái)大模型商業(yè)化范式展望:先預(yù)訓(xùn)練完整大模型,而后通過(guò)蒸餾提取小模型等手段降低推理成本,并服務(wù)各類細(xì)分場(chǎng)景需求。
OpenAI團(tuán)隊(duì)本次通過(guò)開放ChatGPT API商用所展現(xiàn)出更加成熟的對(duì)模型成本優(yōu)化的流程:即先訓(xùn)練千億參數(shù)級(jí)別甚至更大的大語(yǔ)言模型,再通過(guò)蒸餾等技術(shù)手段將大模型學(xué)習(xí)到的能力濃縮到小模型中開放給客戶商用。根據(jù)小模型所服務(wù)的垂直領(lǐng)域不同,也會(huì)在小模型之上再進(jìn)行微調(diào)(Fine tune)。根據(jù)該行之前報(bào)告的測(cè)算,大語(yǔ)言模型在訓(xùn)練端的成本消耗遠(yuǎn)遠(yuǎn)不及推理時(shí)的消耗,訓(xùn)練一個(gè)千億參數(shù)級(jí)別的大模型僅需要耗費(fèi)約一個(gè)月的時(shí)間以及150萬(wàn)美元。通過(guò)這一流程OpenAI避免了超大語(yǔ)言模型在推理時(shí)成本過(guò)高的問(wèn)題,該行認(rèn)為這一流程也將在未來(lái)成為各大AI公司在提供AI服務(wù)時(shí)的商業(yè)化范式,模型蒸餾過(guò)程中所損失的精度對(duì)于大多數(shù)用戶來(lái)說(shuō)并不那么敏感。OpenAI本次在模型技術(shù)流程上的改良在中短期維度加速更多AI產(chǎn)品在商業(yè)化落地,并加速刺激除聊天外更多領(lǐng)域的AI需求。
風(fēng)險(xiǎn)因素:AI核心技術(shù)發(fā)展不及預(yù)期風(fēng)險(xiǎn);科技領(lǐng)域政策監(jiān)管持續(xù)收緊風(fēng)險(xiǎn);全球宏觀經(jīng)濟(jì)復(fù)蘇不及預(yù)期風(fēng)險(xiǎn);宏觀經(jīng)濟(jì)波動(dòng)導(dǎo)致歐美企業(yè)IT支出不及預(yù)期風(fēng)險(xiǎn);全球云計(jì)算市場(chǎng)發(fā)展不及預(yù)期風(fēng)險(xiǎn);企業(yè)數(shù)據(jù)泄露、信息安全風(fēng)險(xiǎn);行業(yè)競(jìng)爭(zhēng)持續(xù)加劇風(fēng)險(xiǎn)等。