智通財經(jīng)APP獲悉,天風(fēng)證券發(fā)布研究報告稱,在圖像生成領(lǐng)域,以擴(kuò)散模型為代表的方法已經(jīng)取得了特別成功,迅速取代了基于生成對抗網(wǎng)絡(luò)(GANs)和自回歸變換器的方法。該行認(rèn)為從排名靠前的應(yīng)用中可以看出多模態(tài)AIGC與效率工具有可能是GPTs應(yīng)用中的重要部分,多模態(tài)領(lǐng)域較高的比重也說明了圖片與視頻模態(tài)的生成是用戶需求的主要方向之一。text-to-video技術(shù)的奇點(diǎn)正在加速到來,該行看好視頻多模態(tài)領(lǐng)域的AI產(chǎn)業(yè)機(jī)會。
天風(fēng)證券主要觀點(diǎn)如下:
采取擴(kuò)散模型的視頻生成與編輯算法取得快速突破,Runway、Pika等公司產(chǎn)品持續(xù)迭代
在圖像生成領(lǐng)域,以擴(kuò)散模型為代表的方法已經(jīng)取得了特別成功,迅速取代了基于生成對抗網(wǎng)絡(luò)(GANs)和自回歸變換器的方法。同樣自從VideoDiffusionModel首次嘗試設(shè)計(jì)用擴(kuò)散模型用于視頻生成后,擴(kuò)散模型在視頻生成,于2023年迎來了學(xué)術(shù)上的快速發(fā)展,相應(yīng)的論文數(shù)量顯著增加。相應(yīng)的,Runway、Pika等公司的產(chǎn)品也在取得持續(xù)突破,Runway從3月份測試GEN-2模型開始,6月份正式向公眾發(fā)布,隨后在11月更新了4K模式,生成視頻的一致性也迎來了重大改進(jìn),不連貫、閃爍變形等問題逐步解決。Pika在7月份于Discord推出服務(wù)器,截至目前用戶已超50萬,隨后在11月29日推出了Pika1.0,用戶能夠通過Pika實(shí)現(xiàn)畫布延展、局部修改、視頻時長拓展等編輯需求。
GPTs應(yīng)用數(shù)量突破3萬,截止12月1日,最佳GPTs應(yīng)用聚焦于多模態(tài)AIGC與效率工具
從最流行的10個GPTs應(yīng)用來看,5個為包括圖像和視頻生成在內(nèi)的多模態(tài)AIGC領(lǐng)域,3個為與包括寫作在內(nèi)的效率工具,其余2個為與Coding相關(guān)、主要面向開發(fā)者的網(wǎng)頁設(shè)計(jì),排名前五的分別是面向科研人員的ResearchGPT、多模態(tài)生成的BrickBoxGenerator、PhotoMultiverse、VideoGPTbyVEED,和撰寫博客等文章的Bloggy:AutomatedBlogPostWriter。該行認(rèn)為從排名靠前的應(yīng)用中可以看出多模態(tài)AIGC與效率工具有可能是GPTs應(yīng)用中的重要部分,多模態(tài)領(lǐng)域較高的比重也說明了圖片與視頻模態(tài)的生成是用戶需求的主要方向之一。
text-to-video技術(shù)的奇點(diǎn)正在加速到來,該行看好視頻多模態(tài)領(lǐng)域的AI產(chǎn)業(yè)機(jī)會
文生視頻是一個年輕的方向,該領(lǐng)域面臨多方面的挑戰(zhàn),包括高算力成本、缺乏高質(zhì)量的數(shù)據(jù)集等,但隨著視頻擴(kuò)散模型技術(shù)的突破,VideoLDM、Text2Video-Zero、RunwayGen1、RunwayGen2等算法模型不斷涌現(xiàn),該行也看到以Runway為代表的企業(yè)在近半年內(nèi)取得了較大的進(jìn)步,生成視頻的一致性和保真度也有了較大改進(jìn),該行看好未來在視頻多模態(tài)領(lǐng)域的應(yīng)用機(jī)會,同時算力基礎(chǔ)設(shè)施在視頻模態(tài)技術(shù)的帶領(lǐng)下也有望迎來快速增長。
建議關(guān)注:多模態(tài)應(yīng)用:萬興科技、美圖公司(與海外組聯(lián)合覆蓋)、易點(diǎn)天下、網(wǎng)達(dá)軟件、焦點(diǎn)科技、當(dāng)虹科技
算力:(1)華為昇騰:神州數(shù)碼、高新發(fā)展、烽火通信、拓維信息、廣電運(yùn)通;(2)非華為國產(chǎn)AI芯片:海光信息、寒武紀(jì)、云天勵飛、景嘉微(與電子組聯(lián)合覆蓋)
風(fēng)險提示:自主芯片技術(shù)不及預(yù)期、視頻多模態(tài)技術(shù)發(fā)展速度不及預(yù)期、應(yīng)用推廣不及預(yù)期。