2024開年不久,AI世界迎來了巨大的變革和新一輪的角力。
2月16日凌晨,OpenAI在其官方發(fā)布了文生視頻模型Sora。用戶只需輸入文本指令,Sora可以快速生成60s視頻內(nèi)容,同時理解和模擬真實世界,輸出準確反映用戶提示的視頻。
在一些行業(yè)觀察人士眼里,Sora不僅性能遙遙領(lǐng)先于競爭對手,甚至可以被視為一款“世界模擬器”。在這樣的背景下,人工智能產(chǎn)業(yè)將在Sora這一革命性技術(shù)迭新中迎來新一輪上漲周期,反饋至資本市場中,則體現(xiàn)為Sora概念股引爆了海內(nèi)外AI行情,2月19日,Sora概念股在A股市場中掀起漲停潮。
比這更令人關(guān)注的是,AGI相關(guān)產(chǎn)業(yè)的投資機會目前還看不到天花板,從中無疑蘊含著爆發(fā)式成長機遇。
Sora引領(lǐng)技術(shù)變革,2024年或為AI視頻年
從年初蘋果發(fā)布Vision Pro頭戴式顯示設備、到各家PC大廠接連發(fā)布AIPC,再到這次的OpenAI發(fā)布Sora,全世界對于人工智能的創(chuàng)新在加速,迭代地越來越快。
OpenAI將Sora定位為一款世界模擬器的視頻生成模型,為未來發(fā)展理解和模擬真實世界的模型奠定基礎(chǔ)。根據(jù)官方介紹,目前Sora具備生成包括多個角色、特定類型的運動、準確細節(jié)的主體和復雜場景的能力。同時,還能夠創(chuàng)建多個鏡頭,模擬復雜的攝像機運鏡效果,使得生成的視頻更加生動。
此外,由于OpenAI將擴散模型與LLM相結(jié)合,使得Sora具備了理解和模擬真實世界的能力,因此Sora所生成的視頻中已經(jīng)可以展現(xiàn)出空間以及空間內(nèi)物體之間的真實物理關(guān)系。目前Sora除了文生視頻功能外,還具備圖生視頻、視頻擴展、視頻拼接、視頻編輯、圖像生成等功能。
這無疑將是視頻領(lǐng)域的巨大變革:從產(chǎn)品和技術(shù)本身來看,在過去10年內(nèi),人類生成視頻的速度一直在提高,但從1秒到4秒,花了10年的時間才有所突破。即便如在線工具Pika、Runway也都卡在了十多秒的限制上。
然而,OpenAI的Sora直接將這個限制提升至60秒,且與Pika、Runway等之前的AI文生視頻工具相比,Sora不僅具有完成視頻向前擴展、視頻拼接等更加復雜的任務的能力,還能通過多鏡頭等方式帶來更加生動的多視角視頻,同時在生成視頻的時長、流暢度和邏輯性等方面優(yōu)勢顯著。
圖源:華泰證券
工銀瑞信研報同步指出,Sora采用了“擴散+Transformer”的視頻生成大模型技術(shù)路線,可謂有了里程碑式的技術(shù)進步。相比以往使用的同為擴散模型的U-Net,Transformer架構(gòu)的參數(shù)可拓展性強,即參數(shù)量增加,性能加速提升,同時支持任意分辨率、長寬比、時長的視頻訓練數(shù)據(jù),不會因為壓縮導致訓練數(shù)據(jù)質(zhì)量下降。此外,Sora訓練了能在時間和空間上壓縮視頻的自編碼器,這也是其能夠大幅提升生成視頻時長的原因。
而Sora文生視頻模型的巨大成功,標志著AI應用的迭代升級,有望在一定程度上大大縮短AGI通用人工智能的預期時間,帶來從技術(shù)轉(zhuǎn)變?yōu)槿a(chǎn)業(yè)的巨大變革浪潮,由此來看,Sora的誕生是將AGI實現(xiàn)過程中的重大里程碑事件。
文生視頻迭代提速,環(huán)球墨非增長潛力凸顯
就商業(yè)化角度而言,Sora有望深刻改變各大細分賽道,其中又以泛娛樂賽道更為超越預期。由于Sora模型所生成的視頻在空間細節(jié)上的真實程度超出了很多人的預期,后續(xù)將在圖像創(chuàng)作、視頻創(chuàng)意等領(lǐng)域會有較大的應用潛力。
可預見的是,多模態(tài)模型的應用在2024將迎來爆發(fā)式增長,率先布局相關(guān)領(lǐng)域的企業(yè)有望跑出“新生”巨頭。
從Sora的泛用性和場景應用上來看,用AI自動創(chuàng)作生成的內(nèi)容會影響很多的行業(yè)領(lǐng)域,或?qū)硇乱惠唭?nèi)容創(chuàng)作產(chǎn)業(yè)革命。但按視頻生成的底層邏輯來看,Sora統(tǒng)一了圖像與視頻的數(shù)據(jù)表示方式,并通過超大量數(shù)據(jù)集來擴大模型規(guī)模,提高模型表現(xiàn),行業(yè)內(nèi)擁有海量優(yōu)質(zhì)圖像或視頻資源的玩家有望率先受益。
若在此邏輯之下尋找標的,美股上市的3D內(nèi)容企業(yè)環(huán)球墨非(GMM.US),無疑有望在這股技術(shù)引領(lǐng)的變革浪潮中跑出成長加速度。
智通財經(jīng)APP了解到,環(huán)球墨非是一家以數(shù)字技術(shù)為核心,通過開發(fā)創(chuàng)新的解決方案為元宇宙行業(yè)提供定制化服務。公司一直專注于3D可視化,堅持以“AI+3D”為技術(shù)發(fā)展方向,將虛擬數(shù)字資產(chǎn)與真實世界的互動體驗相結(jié)合,打破了傳統(tǒng)媒介的界限,為客戶提供了豐富的視效和沉浸式體驗。
公司主要通過其專有的“MofyLab”技術(shù)平臺(該平臺由尖端的三維(3D)重建技術(shù)和人工智能(AI)交互技術(shù)組成),創(chuàng)建廣泛的3D高清虛擬版本可以在不同應用中使用的物理世界對象(如人、動物和場景)。截至目前,環(huán)球墨非是中國領(lǐng)先的數(shù)字資產(chǎn)銀行之一,由30000多個高精度3D數(shù)字資產(chǎn)組成,而這些均有望成為數(shù)字內(nèi)容和視頻生成領(lǐng)域的重要底層資產(chǎn)。
值得關(guān)注的是,近年以來,環(huán)球墨非一直在文生圖像、視頻等跨模態(tài)領(lǐng)域進行積極布局。在該公司3D數(shù)字資產(chǎn)業(yè)務中,涉及到大量的三維建模、3D渲染和IP內(nèi)容資產(chǎn)生成,公司一直致力于將前沿科技和視覺體驗呈現(xiàn)給客戶,因此在AI應用層面,公司一直積極推動3D模型+AI的落地以及場景應用,以及AIGC的可視化交互體驗。
隨著3D內(nèi)容成本的下降,在中國推動數(shù)字化和技術(shù)進步的過程中,也會有更多的場景來結(jié)合譬如Sora這類的新興技術(shù),實現(xiàn)元宇宙應用的快速落地,從而產(chǎn)生一些內(nèi)容服務的需求,為環(huán)球墨非帶來業(yè)績上的增量。倘若再疊加空間計算時代,VR、MR等場景本身也需要AI3D模型來擴充和豐富虛擬現(xiàn)實產(chǎn)業(yè)的內(nèi)容供給。
展望未來,在Sora所引領(lǐng)的AI文生視頻技術(shù)突破浪潮之下,3D等多模態(tài)領(lǐng)域有望持續(xù)加速,持續(xù)提高AI3D模型的生成效率及精度,推動AI3D引擎技術(shù)拐點的到來。而環(huán)球墨非有望保有數(shù)字資產(chǎn)領(lǐng)先優(yōu)勢,通過建模、仿真等技術(shù)連結(jié)虛擬與真實世界,為業(yè)界提供數(shù)據(jù)驅(qū)動和基于模型的解決方案,作為底層技術(shù)變革受益者和內(nèi)容素材提供者,享受更大的成長紅利。