華創(chuàng)證券：Sora火爆出圈 AI應(yīng)用“龍騰虎躍”

作者：智通財(cái)經(jīng) 李佛 2024-02-20 14:22:01

2月16日，OpenAI發(fā)布文生視頻大模型Sora。

智通財(cái)經(jīng)APP獲悉，華創(chuàng)證券發(fā)布研究報(bào)告稱，Sora雖然在訓(xùn)練模型上不需要太多參數(shù)，但實(shí)際應(yīng)用由于推理生產(chǎn)視頻過程中將涉及較大數(shù)據(jù)量的計(jì)算，同時(shí)為追求較高的視頻生成效果，訓(xùn)練和推理過程中都需要進(jìn)行盡量多次數(shù)的迭代計(jì)算，將釋放大量算力需求，利好算力底座產(chǎn)業(yè)鏈，建議優(yōu)先關(guān)注深度參與構(gòu)建全球先進(jìn)AI算力設(shè)施的光互聯(lián)光模塊企業(yè)，建議關(guān)注天孚通信(300394.SZ)、中際旭創(chuàng)(300308.SZ)。

事項(xiàng)：

2月16日，OpenAI發(fā)布文生視頻大模型Sora。2月15日，Google發(fā)布Gemini新一代版本Gemini 1.5。

▍華創(chuàng)證券主要觀點(diǎn)如下：

OpenAI發(fā)布文生視頻大模型Sora，模型展現(xiàn)出諸多亮點(diǎn)。

Sora模型主要有以下功能：1)遵循用戶文本生成長(zhǎng)達(dá)1分鐘的視頻;2)參考圖像衍生出視頻內(nèi)容;3)參考一段基礎(chǔ)視頻，更換視頻環(huán)境、場(chǎng)景主題、拍攝手法等;4)向前拓展視頻，可以生成視頻開頭部分且保持視頻結(jié)尾的一致;5)將多個(gè)毫無關(guān)系的視頻無縫連接到一起。相比此前已發(fā)布的文生視頻大模型，Sora在多個(gè)方面取得突破，成為超越行業(yè)的領(lǐng)先AI應(yīng)用。OpenAI在隨后發(fā)布的技術(shù)研究文檔中高度評(píng)價(jià)了Sora的意義，認(rèn)為視頻模型的持續(xù)擴(kuò)展是一條構(gòu)建物理世界和數(shù)字世界的高性能模擬器的有效途徑。

Sora的核心三要素：Diffusion+Transformer+Patch。根據(jù)OpenAI的技術(shù)文檔，Sora的模型本質(zhì)是一個(gè)Diffusion Transformer，即同時(shí)應(yīng)用到了Diffusion和Transformer兩項(xiàng)技術(shù)，根據(jù)專家觀點(diǎn)，模型可能僅有約30億參數(shù)，可能表明訓(xùn)練Sora模型可能不需要太多算力，未來將出現(xiàn)非?？斓牡?。Sora使用降維時(shí)空Patch統(tǒng)一視覺數(shù)據(jù)，保持視頻/圖片分辨率，提高生成內(nèi)容的邏輯連貫性。Sora通過Patch方式可以對(duì)原始大小的數(shù)據(jù)進(jìn)行訓(xùn)練，具有靈活采樣、改善構(gòu)圖和取景等優(yōu)勢(shì)。

Google發(fā)布Gemini 1.5，超長(zhǎng)token進(jìn)一步拓展應(yīng)用場(chǎng)景。

繼2023年12月發(fā)布Gemini 1.0后，Google近期發(fā)布了Gemini 1.5版本，短時(shí)間內(nèi)實(shí)現(xiàn)較大的迭代更新。本次更新最大的亮點(diǎn)為其最高支持100萬tokens的上下文，在內(nèi)部研究環(huán)境，Google成功測(cè)試了1000萬tokens上下文。模型的上下文窗口越大，其可以接收和處理的信息就越多，從而使得輸出的一致性、相關(guān)性和可用性更強(qiáng)，對(duì)于拓展模型應(yīng)用具有很大的意義。

此外Gemini 1.5是一個(gè)MoE(Mixture of Experts，混合專家)模型，根據(jù)輸入的類型，模型會(huì)決定最相關(guān)的專家網(wǎng)絡(luò)來輸出結(jié)果，因此能夠更快且高質(zhì)量地學(xué)習(xí)復(fù)雜任務(wù)，同時(shí)更高效地完成訓(xùn)練和提供服務(wù)。

投資建議：

1)隨著Google Gemini 1.5和OpenAI Sora的發(fā)布，AI的大模型能力持續(xù)得到增強(qiáng)，現(xiàn)象級(jí)的AI應(yīng)用有望逐步清晰呈現(xiàn)，AI商業(yè)閉環(huán)有望加速。特別對(duì)于視頻類應(yīng)用，由于其受眾廣泛，隨著應(yīng)用規(guī)模的推開，有望釋放較大的市場(chǎng)增長(zhǎng)彈性，同時(shí)視頻占用流量資源較多，對(duì)上游計(jì)算、傳輸?shù)然A(chǔ)設(shè)施的大量需求也有望得到釋放。

2)Sora雖然在訓(xùn)練模型上不需要太多參數(shù)，但實(shí)際應(yīng)用由于推理生產(chǎn)視頻過程中將涉及較大數(shù)據(jù)量的計(jì)算，同時(shí)為追求較高的視頻生成效果，訓(xùn)練和推理過程中都需要進(jìn)行盡量多次數(shù)的迭代計(jì)算，將釋放大量算力需求，利好算力底座產(chǎn)業(yè)鏈，建議優(yōu)先關(guān)注深度參與構(gòu)建全球先進(jìn)AI算力設(shè)施的光互聯(lián)光模塊企業(yè)，建議關(guān)注天孚通信、中際旭創(chuàng)。

3)Sora的火爆出圈說明市場(chǎng)對(duì)于AI視頻生成的高度關(guān)注，未來AI生成視頻領(lǐng)域的用戶規(guī)模和市場(chǎng)空間都值得期待。Sora的出現(xiàn)降低了優(yōu)質(zhì)視頻的生產(chǎn)制造門檻，或?qū)砀笠?guī)模的視頻創(chuàng)作熱潮。此外Sora視頻的創(chuàng)作和傳播天然具有國際化條件，視頻出海需求或有望提升。Sora等文生視頻AI應(yīng)用有望拉動(dòng)視頻流量規(guī)模進(jìn)一步提升，釋放更多帶寬傳輸需求。建議重點(diǎn)關(guān)注受益邏輯更直接的內(nèi)容分發(fā)網(wǎng)絡(luò)CDN產(chǎn)業(yè)鏈，建議關(guān)注網(wǎng)宿科技。

風(fēng)險(xiǎn)提示：

AI技術(shù)發(fā)展不及預(yù)期、文生視頻應(yīng)用落地不及預(yù)期、行業(yè)監(jiān)管風(fēng)險(xiǎn)、行業(yè)競(jìng)爭(zhēng)加劇、光通信供應(yīng)格局出現(xiàn)變動(dòng)。

智通聲明：本內(nèi)容為作者獨(dú)立觀點(diǎn)，不代表智通財(cái)經(jīng)立場(chǎng)。未經(jīng)允許不得轉(zhuǎn)載，文中內(nèi)容僅供參考，不作為實(shí)際操作建議，交易風(fēng)險(xiǎn)自擔(dān)。更多最新最全港美股資訊，請(qǐng)點(diǎn)擊下載智通財(cái)經(jīng)App

相關(guān)閱讀