智通財經(jīng)APP獲悉,中信證券發(fā)布研究報告稱,近期月之暗面旗下對話類模型Kimi迎來重大升級,支持200萬字超長文本輸入和更復(fù)雜指令,引發(fā)市場關(guān)注。看好Kimi引領(lǐng)的這輪大模型技術(shù)革新浪潮,同時隨著對超長文本、多模態(tài)數(shù)據(jù)的支持需求提升,該行預(yù)計軟硬件基礎(chǔ)設(shè)施將迎來新一輪升級,以滿足海量非結(jié)構(gòu)化數(shù)據(jù)的存儲和計算需求。因此,持續(xù)看好AI算力賽道的投資機(jī)會,特別是商業(yè)應(yīng)用加速落地背景下,推理側(cè)算力有望實現(xiàn)快速增長。
事件:
北京時間3月18日,月之暗面旗下對話類模型Kimi迎來重大升級,支持200萬字的長文本處理和更復(fù)雜指令,引發(fā)市場強(qiáng)烈反響。Kimi Chat作為專注長文本處理的對話助手,憑借20萬漢字的超長上下文和優(yōu)秀性能,自去年10月發(fā)布以來持續(xù)受到市場青睞。今年2月的功能升級進(jìn)一步增強(qiáng)了網(wǎng)站與多問題搜索能力,帶來更佳用戶體驗。Similarweb數(shù)據(jù)顯示,Kimi Chat網(wǎng)頁端訪問量近期屢創(chuàng)新高,峰值達(dá)34.6萬人次。據(jù)AI產(chǎn)品榜統(tǒng)計,2月份Kimi Chat國內(nèi)訪問量排名第三,日活躍用戶同比翻倍,全球增速位列第一。在本次3月份的長文本版本更新后,數(shù)據(jù)顯示最新周訪問量創(chuàng)新高,3月18日-3月24日訪問量243萬,環(huán)比增加45%。
中信證券觀點如下:
Kimi主要突破:支持長文本輸入,更強(qiáng)的工程與成本控制能力。
大模型的輸入文本長度是一個重要的工程挑戰(zhàn)。隨著輸入序列長度的增加,模型推理過程中注意力層的計算時間呈指數(shù)級增長。以Llama-7b模型為例,處理100萬字的輸入需要數(shù)分鐘之久。因此,更長的上下文窗口不僅意味著模型具備更強(qiáng)大的基礎(chǔ)能力,還需要在工程實現(xiàn)上進(jìn)行特殊優(yōu)化,并將成本控制在合理水平。橫向比較當(dāng)前市場上的大語言模型,GPT-4支持3.2萬字Tokens輸入,Gemini公開版本支持13萬字,而Kimi的200萬字上下文長度無疑刷新了現(xiàn)有的最高紀(jì)錄。為實現(xiàn)更優(yōu)的長文本無損壓縮性能,月之暗面在發(fā)布會上透露,其研發(fā)團(tuán)隊從模型預(yù)訓(xùn)練、對齊到推理的各個環(huán)節(jié)進(jìn)行了原生級的重新設(shè)計和開發(fā),摒棄了“滑動窗口”和“降采樣”等折中方案,攻克了諸多底層技術(shù)難題,才取得了這一突破性進(jìn)展。該行認(rèn)為,Kimi展現(xiàn)的超長文本處理能力印證了其在工程和算法優(yōu)化方面過硬實力。
市場影響判斷:多模態(tài)能力升級的必然前提,將引起更多廠商效仿。
Kimi將輸入文本長度拓展至200萬字,絕非為刷新紀(jì)錄而作出的簡單改動。長文本處理能力直接決定了模型的多模態(tài)融合水平,是構(gòu)建能處理復(fù)雜任務(wù)的AI Agent的必要基礎(chǔ)。相較于純語言模態(tài),圖像、視頻等非結(jié)構(gòu)化數(shù)據(jù)蘊(yùn)含的信息更為豐富,需要更長的上下文才能有效表征和理解。因此,超長文本輸入已成為支持多模態(tài)處理的基本前提。從技術(shù)實現(xiàn)角度看,長文本處理主要涉及工程優(yōu)化和成本控制兩大挑戰(zhàn)。該行預(yù)計,在Kimi的示范效應(yīng)下,越來越多廠商將效仿其超長文本處理的思路,加大在算法架構(gòu)、數(shù)據(jù)壓縮、推理加速等方面的研發(fā)投入。隨著業(yè)界的技術(shù)積累和創(chuàng)新突破,長文本支持有望在今年內(nèi)成為大模型的標(biāo)準(zhǔn)配置。
投資策略:
本次月之暗面更新的Kimi長文本版本取得了實質(zhì)性技術(shù)突破,將輸入文本長度的上限提升至200萬字,刷新了當(dāng)前業(yè)界的最高紀(jì)錄。該行認(rèn)為,Kimi的這一進(jìn)展將引領(lǐng)大模型廠商掀起新一輪技術(shù)革新浪潮。長文本輸入能力是實現(xiàn)多模態(tài)處理的關(guān)鍵前提,而多模態(tài)內(nèi)容,尤其是視頻和圖像的UGC(用戶生成內(nèi)容),仍然是AI應(yīng)用層面的核心增長點。從技術(shù)實現(xiàn)角度看,長文本處理主要受限于工程優(yōu)化和成本控制能力。隨著業(yè)界對超長文本的支持需求不斷提升,該行預(yù)計硬件基礎(chǔ)設(shè)施也將隨之升級,以滿足海量文本數(shù)據(jù)的存儲和計算要求。因此,該行持續(xù)看好AI算力層面的投資機(jī)會,特別是在商業(yè)應(yīng)用日趨成熟的背景下,推理側(cè)算力有望迎來更大的增長空間。
風(fēng)險因素:AI核心技術(shù)發(fā)展不及預(yù)期風(fēng)險;科技領(lǐng)域政策監(jiān)管持續(xù)收緊風(fēng)險;私有數(shù)據(jù)相關(guān)的政策監(jiān)管風(fēng)險;全球宏觀經(jīng)濟(jì)復(fù)蘇不及預(yù)期風(fēng)險;宏觀經(jīng)濟(jì)波動導(dǎo)致歐美企業(yè)IT支出不及預(yù)期風(fēng)險;AI潛在倫理、道德、用戶隱私風(fēng)險;企業(yè)數(shù)據(jù)泄露、信息安全風(fēng)險;行業(yè)競爭持續(xù)加劇風(fēng)險等。