中信證券:Chat-GPT對(duì)人工智能AI產(chǎn)業(yè)意味著什么?

Chat-GPT的成功證明了Transformer模型并非陷入困境,AI技術(shù)方法上不斷的新突破正驅(qū)動(dòng)全球AI產(chǎn)業(yè)進(jìn)入加速發(fā)展階段。

智通財(cái)經(jīng)APP獲悉,中信證券發(fā)布研究報(bào)告稱,Chat-GPT的成功證明了Transformer模型并非陷入困境,AI技術(shù)方法上不斷的新突破正驅(qū)動(dòng)全球AI產(chǎn)業(yè)進(jìn)入加速發(fā)展階段,疊加AI產(chǎn)業(yè)集群效應(yīng)的不斷凸顯,AI產(chǎn)業(yè)有望成為全球科技領(lǐng)域中期最具投資價(jià)值的產(chǎn)業(yè)賽道之一。AI產(chǎn)業(yè)有望繼續(xù)保持“芯片+算力基礎(chǔ)設(shè)施+AI框架&算法庫(kù)+應(yīng)用場(chǎng)景”的穩(wěn)定產(chǎn)業(yè)價(jià)值鏈結(jié)構(gòu),擁有完整數(shù)據(jù)閉環(huán)結(jié)構(gòu)、良好數(shù)據(jù)自處理能力的企業(yè)有望持續(xù)成為產(chǎn)業(yè)受益者。重點(diǎn)推薦:特斯拉(TSLA.US)、英偉達(dá)(NVDA.US)、AMD(AMD.US)、高通(QCOM.US)等。

事件:Chat-GPT模型獲得市場(chǎng)廣泛關(guān)注,對(duì)話類AI效果遠(yuǎn)超大眾預(yù)期。

中信證券主要觀點(diǎn)如下:

由人工智能實(shí)驗(yàn)室OpenAI發(fā)布的對(duì)話式大型語(yǔ)言模型Chat-GPT獲得市場(chǎng)廣泛關(guān)注。

測(cè)試反饋的結(jié)果顯示,相比于前一代的GPT-3,Chat-GPT給出的答案完成度很高,并能在專業(yè)領(lǐng)域內(nèi)形成具有一定創(chuàng)作性的回答。技術(shù)背景上,OpenAI團(tuán)隊(duì)從GPT-3.5系列中的一個(gè)模型進(jìn)行微調(diào),使用人類反饋強(qiáng)化學(xué)習(xí)(RLHF)訓(xùn)練該模型。這種技術(shù)使用人類偏好作為獎(jiǎng)勵(lì)信號(hào)來(lái)微調(diào)模型,在此前的Transformer算法的基礎(chǔ)上又優(yōu)化了數(shù)據(jù)來(lái)源。與GPT-3相比,Chat-GPT測(cè)試所取得的進(jìn)步是明顯的,但這些進(jìn)步主要來(lái)自于數(shù)學(xué)層面上優(yōu)化帶來(lái)的匹配精準(zhǔn)度提高,而并非算法真正為AI帶來(lái)了邏輯性。更直觀的理解是,Chat-GPT“解鎖”了GPT-3已經(jīng)具備的能力,原先模型中真正使用到的計(jì)算和數(shù)據(jù)不到2%,這讓Chat-GPT成為一個(gè)AI技術(shù)應(yīng)用的成功范例。

對(duì)產(chǎn)業(yè)界而言,Chat-GPT的成功意味著產(chǎn)業(yè)端算力與數(shù)據(jù)質(zhì)量重要性進(jìn)一步提升,人類反饋強(qiáng)化學(xué)習(xí)(RLHF)更強(qiáng)調(diào)數(shù)據(jù)質(zhì)量與算力,在未來(lái)Transformer發(fā)展的過(guò)程中將越來(lái)越重要,一味堆疊數(shù)據(jù)量的時(shí)代可能已經(jīng)過(guò)去。能夠完成數(shù)據(jù)閉環(huán)以及有著優(yōu)秀的數(shù)據(jù)自處理能力的企業(yè)預(yù)計(jì)將在未來(lái)AI模型發(fā)展的過(guò)程中更加受到青睞。場(chǎng)景落地端,根據(jù)模型現(xiàn)有的完成度,在垂直行業(yè)針對(duì)性地做人工反饋訓(xùn)練,就可以落地智能客服、問(wèn)答產(chǎn)品,在toC場(chǎng)景中料將率先得到應(yīng)用。Chat-GPT的成功證明了Transformer模型并非陷入困境,AI模型&技術(shù)上持續(xù)的新突破,正驅(qū)動(dòng)全球AI產(chǎn)業(yè)進(jìn)入加速發(fā)展階段,疊加AI產(chǎn)業(yè)集群效應(yīng)的不斷凸顯,擁有完整數(shù)據(jù)閉環(huán)結(jié)構(gòu)、良好數(shù)據(jù)自處理能力的企業(yè)有望持續(xù)成為產(chǎn)業(yè)受益者。

Chat-GPT模型:在GPT-3.5的基礎(chǔ)上基于人類反饋學(xué)習(xí)進(jìn)行額外訓(xùn)練,給出了Transformer模型未來(lái)發(fā)展的一個(gè)可能解法。

OpenAI團(tuán)隊(duì)從GPT-3.5系列中的一個(gè)模型進(jìn)行微調(diào),使用與InstructGPT相同的方法,使用人類反饋強(qiáng)化學(xué)習(xí)(RLHF)訓(xùn)練該模型,并對(duì)數(shù)據(jù)收集設(shè)置相對(duì)做了優(yōu)化。人類反饋強(qiáng)化模型這一技術(shù),是OpenAI從2017開(kāi)始發(fā)表論文的新領(lǐng)域。這種技術(shù)使用人類偏好作為獎(jiǎng)勵(lì)信號(hào)來(lái)微調(diào)模型,首先收集人工編寫(xiě)演示數(shù)據(jù)集(包含兩種不同輸出類型的比較),然后在這個(gè)數(shù)據(jù)集上訓(xùn)練一個(gè)獎(jiǎng)勵(lì)模型(RM)來(lái)預(yù)測(cè)標(biāo)簽者更喜歡哪個(gè)輸出。最后,使用此RM作為獎(jiǎng)勵(lì)函數(shù)并微調(diào)這個(gè)GPT-3策略以使用PPO算法最大化此獎(jiǎng)勵(lì)。從測(cè)試的結(jié)果看,Chat-GPT能夠調(diào)用大量的專業(yè)數(shù)據(jù)庫(kù),并用巧妙的語(yǔ)言連接句將他們拼合在一起,在回答問(wèn)題時(shí),模型能根據(jù)上下文展現(xiàn)出一定的連貫性。在面對(duì)GPT-3束手無(wú)策的人稱代詞時(shí),Chat-GPT展現(xiàn)出了一定的邏輯能力。

模型背后問(wèn)題:并非底層技術(shù)上的革命性突破,產(chǎn)業(yè)端意義大于學(xué)術(shù)端意義。

與GPT-3相比,Chat-GPT測(cè)試所取得的進(jìn)步是明顯的,但這些進(jìn)步主要來(lái)自于數(shù)學(xué)層面上的優(yōu)化帶來(lái)的結(jié)果匹配精準(zhǔn)度提高,而并非算法真正為AI帶來(lái)了邏輯性,也不是能夠從訓(xùn)練的數(shù)據(jù)中學(xué)習(xí)到新的知識(shí)。對(duì)于Chat-GPT相對(duì)于原先模型的進(jìn)步的一種更直觀的理解是,Chat-GPT“解鎖”了GPT-3已經(jīng)具備的能力,通過(guò)原先的提示工程難以激發(fā):這是因?yàn)橛?xùn)練程序相對(duì)于預(yù)訓(xùn)練期間學(xué)到的東西,新知識(shí)的連接能力有限。這一過(guò)程帶來(lái)了更好的結(jié)果匹配度來(lái)逼近人類思考所使用的邏輯,但并非給予了AI底層邏輯性的概念。從大量的測(cè)試結(jié)果能看出,Chat-GPT有時(shí)仍會(huì)寫(xiě)出看似合理但不正確或荒謬的答案,以及幼兒都絕不會(huì)出現(xiàn)的邏輯性錯(cuò)誤。主要原因包括:(1)在面對(duì)邏輯性的指代,以及稍微復(fù)雜的句式,模型仍然難以分析出內(nèi)在的邏輯性關(guān)聯(lián);(2)訓(xùn)練模型更加謹(jǐn)慎導(dǎo)致它拒絕回答和逃避回答問(wèn)題;(3)監(jiān)督訓(xùn)練會(huì)誤導(dǎo)模型,因?yàn)槔硐氲拇鸢溉Q于模型知道什么,而不是人類演示者知道什么。

Chat-GPT對(duì)產(chǎn)業(yè)界的影響:底層算力、數(shù)據(jù)質(zhì)量重要性進(jìn)一步提升,toC端場(chǎng)景(智能客服等)料將率先迎來(lái)變革。

1)人類反饋強(qiáng)化學(xué)習(xí)(RLHF)更強(qiáng)調(diào)數(shù)據(jù)質(zhì)量與算力,盡管相比于GPT-3,Chat-GPT削減了一部分的數(shù)據(jù)量,但對(duì)于余下的數(shù)據(jù)做了更好的優(yōu)化以及加入了人類反饋調(diào)節(jié)的獎(jiǎng)勵(lì)系統(tǒng)。數(shù)據(jù)質(zhì)量與大算力支撐下的獎(jiǎng)勵(lì)系統(tǒng)預(yù)計(jì)將在未來(lái)Transformer發(fā)展的過(guò)程中越來(lái)越重要,一味堆疊數(shù)據(jù)量的時(shí)代可能已經(jīng)過(guò)去。能夠完成數(shù)據(jù)閉環(huán)以及有著優(yōu)秀的數(shù)據(jù)自處理能力的企業(yè)將在未來(lái)AI模型發(fā)展的過(guò)程中更加受到青睞。2)即使Chat-GPT不是一個(gè)革命性的底層AI技術(shù)的突破,但它絕對(duì)是一個(gè)成功的AI技術(shù)應(yīng)用的典范。在原先GPT-3.5與InstructGPT的框架上,OpenAI的研究員通過(guò)調(diào)試參數(shù)與數(shù)據(jù)源取得了驚人的效果。根據(jù)模型現(xiàn)有的完成度,在垂直行業(yè)針對(duì)性的做人工反饋訓(xùn)練,就可以落地為智能客服產(chǎn)品,在toC的場(chǎng)景中率先得到應(yīng)用。對(duì)比目前的智能客服,Chat-GPT支撐的客服將在靈活性與人性化服務(wù)方面有顯著的進(jìn)步。

風(fēng)險(xiǎn)因素:AI核心技術(shù)發(fā)展不及預(yù)期風(fēng)險(xiǎn);科技領(lǐng)域政策監(jiān)管持續(xù)收緊風(fēng)險(xiǎn);全球宏觀經(jīng)濟(jì)復(fù)蘇不及預(yù)期風(fēng)險(xiǎn);宏觀經(jīng)濟(jì)波動(dòng)導(dǎo)致歐美企業(yè)IT支出不及預(yù)期風(fēng)險(xiǎn);全球云計(jì)算市場(chǎng)發(fā)展不及預(yù)期風(fēng)險(xiǎn);企業(yè)數(shù)據(jù)泄露、信息安全風(fēng)險(xiǎn);行業(yè)競(jìng)爭(zhēng)持續(xù)加劇風(fēng)險(xiǎn)等。

智通聲明:本內(nèi)容為作者獨(dú)立觀點(diǎn),不代表智通財(cái)經(jīng)立場(chǎng)。未經(jīng)允許不得轉(zhuǎn)載,文中內(nèi)容僅供參考,不作為實(shí)際操作建議,交易風(fēng)險(xiǎn)自擔(dān)。更多最新最全港美股資訊,請(qǐng)點(diǎn)擊下載智通財(cái)經(jīng)App
分享
微信
分享
QQ
分享
微博
收藏