智通財(cái)經(jīng)APP獲悉,華創(chuàng)證券發(fā)布研究報(bào)告稱,Sora雖然在訓(xùn)練模型上不需要太多參數(shù),但實(shí)際應(yīng)用由于推理生產(chǎn)視頻過程中將涉及較大數(shù)據(jù)量的計(jì)算,同時(shí)為追求較高的視頻生成效果,訓(xùn)練和推理過程中都需要進(jìn)行盡量多次數(shù)的迭代計(jì)算,將釋放大量算力需求,利好算力底座產(chǎn)業(yè)鏈,建議優(yōu)先關(guān)注深度參與構(gòu)建全球先進(jìn)AI算力設(shè)施的光互聯(lián)光模塊企業(yè),建議關(guān)注天孚通信(300394.SZ)、中際旭創(chuàng)(300308.SZ)。
事項(xiàng):
2月16日,OpenAI發(fā)布文生視頻大模型Sora。2月15日,Google發(fā)布Gemini新一代版本Gemini 1.5。
▍華創(chuàng)證券主要觀點(diǎn)如下:
OpenAI發(fā)布文生視頻大模型Sora,模型展現(xiàn)出諸多亮點(diǎn)。
Sora模型主要有以下功能:1)遵循用戶文本生成長(zhǎng)達(dá)1分鐘的視頻;2)參考圖像衍生出視頻內(nèi)容;3)參考一段基礎(chǔ)視頻,更換視頻環(huán)境、場(chǎng)景主題、拍攝手法等;4)向前拓展視頻,可以生成視頻開頭部分且保持視頻結(jié)尾的一致;5)將多個(gè)毫無關(guān)系的視頻無縫連接到一起。相比此前已發(fā)布的文生視頻大模型,Sora在多個(gè)方面取得突破,成為超越行業(yè)的領(lǐng)先AI應(yīng)用。OpenAI在隨后發(fā)布的技術(shù)研究文檔中高度評(píng)價(jià)了Sora的意義,認(rèn)為視頻模型的持續(xù)擴(kuò)展是一條構(gòu)建物理世界和數(shù)字世界的高性能模擬器的有效途徑。
Sora的核心三要素:Diffusion+Transformer+Patch。根據(jù)OpenAI的技術(shù)文檔,Sora的模型本質(zhì)是一個(gè)Diffusion Transformer,即同時(shí)應(yīng)用到了Diffusion和Transformer兩項(xiàng)技術(shù),根據(jù)專家觀點(diǎn),模型可能僅有約30億參數(shù),可能表明訓(xùn)練Sora模型可能不需要太多算力,未來將出現(xiàn)非??斓牡?。Sora使用降維時(shí)空Patch統(tǒng)一視覺數(shù)據(jù),保持視頻/圖片分辨率,提高生成內(nèi)容的邏輯連貫性。Sora通過Patch方式可以對(duì)原始大小的數(shù)據(jù)進(jìn)行訓(xùn)練,具有靈活采樣、改善構(gòu)圖和取景等優(yōu)勢(shì)。
Google發(fā)布Gemini 1.5,超長(zhǎng)token進(jìn)一步拓展應(yīng)用場(chǎng)景。
繼2023年12月發(fā)布Gemini 1.0后,Google近期發(fā)布了Gemini 1.5版本,短時(shí)間內(nèi)實(shí)現(xiàn)較大的迭代更新。本次更新最大的亮點(diǎn)為其最高支持100萬tokens的上下文,在內(nèi)部研究環(huán)境,Google成功測(cè)試了1000萬tokens上下文。模型的上下文窗口越大,其可以接收和處理的信息就越多,從而使得輸出的一致性、相關(guān)性和可用性更強(qiáng),對(duì)于拓展模型應(yīng)用具有很大的意義。
此外Gemini 1.5是一個(gè)MoE(Mixture of Experts,混合專家)模型,根據(jù)輸入的類型,模型會(huì)決定最相關(guān)的專家網(wǎng)絡(luò)來輸出結(jié)果,因此能夠更快且高質(zhì)量地學(xué)習(xí)復(fù)雜任務(wù),同時(shí)更高效地完成訓(xùn)練和提供服務(wù)。
投資建議:
1)隨著Google Gemini 1.5和OpenAI Sora的發(fā)布,AI的大模型能力持續(xù)得到增強(qiáng),現(xiàn)象級(jí)的AI應(yīng)用有望逐步清晰呈現(xiàn),AI商業(yè)閉環(huán)有望加速。特別對(duì)于視頻類應(yīng)用,由于其受眾廣泛,隨著應(yīng)用規(guī)模的推開,有望釋放較大的市場(chǎng)增長(zhǎng)彈性,同時(shí)視頻占用流量資源較多,對(duì)上游計(jì)算、傳輸?shù)然A(chǔ)設(shè)施的大量需求也有望得到釋放。
2)Sora雖然在訓(xùn)練模型上不需要太多參數(shù),但實(shí)際應(yīng)用由于推理生產(chǎn)視頻過程中將涉及較大數(shù)據(jù)量的計(jì)算,同時(shí)為追求較高的視頻生成效果,訓(xùn)練和推理過程中都需要進(jìn)行盡量多次數(shù)的迭代計(jì)算,將釋放大量算力需求,利好算力底座產(chǎn)業(yè)鏈,建議優(yōu)先關(guān)注深度參與構(gòu)建全球先進(jìn)AI算力設(shè)施的光互聯(lián)光模塊企業(yè),建議關(guān)注天孚通信、中際旭創(chuàng)。
3)Sora的火爆出圈說明市場(chǎng)對(duì)于AI視頻生成的高度關(guān)注,未來AI生成視頻領(lǐng)域的用戶規(guī)模和市場(chǎng)空間都值得期待。Sora的出現(xiàn)降低了優(yōu)質(zhì)視頻的生產(chǎn)制造門檻,或?qū)砀笠?guī)模的視頻創(chuàng)作熱潮。此外Sora視頻的創(chuàng)作和傳播天然具有國際化條件,視頻出海需求或有望提升。Sora等文生視頻AI應(yīng)用有望拉動(dòng)視頻流量規(guī)模進(jìn)一步提升,釋放更多帶寬傳輸需求。建議重點(diǎn)關(guān)注受益邏輯更直接的內(nèi)容分發(fā)網(wǎng)絡(luò)CDN產(chǎn)業(yè)鏈,建議關(guān)注網(wǎng)宿科技。
風(fēng)險(xiǎn)提示:
AI技術(shù)發(fā)展不及預(yù)期、文生視頻應(yīng)用落地不及預(yù)期、行業(yè)監(jiān)管風(fēng)險(xiǎn)、行業(yè)競(jìng)爭(zhēng)加劇、光通信供應(yīng)格局出現(xiàn)變動(dòng)。