智通財經(jīng)獲悉,OpenAI將把人工智能技術(shù)帶到視頻領(lǐng)域。該公司周四推出了新的生成式人工智能模型Sora。Sora的工作原理類似于OpenAI的圖像生成人工智能工具DALL-E。用戶輸入想要的場景,Sora就會返回一個高清視頻剪輯。Sora還可以生成受靜態(tài)圖像啟發(fā)的視頻剪輯,并擴展現(xiàn)有視頻或填充缺失的幀。
隨著聊天機器人和圖像生成器進入消費者和商業(yè)世界,視頻可能成為生成式人工智能的下一個前沿領(lǐng)域。雖然創(chuàng)造性的機會將激發(fā)人工智能愛好者,但隨著全球重大政治選舉的臨近,新技術(shù)帶來了嚴(yán)重的錯誤信息擔(dān)憂。
OpenAI希望通過Sora與Meta(META.US)和谷歌(GOOGL.US)等公司的視頻生成人工智能工具競爭。谷歌今年1月宣布推出AI視頻大模型Lumiere。其他初創(chuàng)公司也有類似的人工智能工具,比如Stability AI,該公司有一款名為Stable Video Diffusion的產(chǎn)品。亞馬遜(AMZN.US)還發(fā)布了“Create with Alexa”,這是一個專門生成基于提示的兒童動畫短片的模型。
Sora目前僅限于生成一分鐘或更短的視頻。在提供更廣泛的人工智能模型套件的努力中,由微軟(MSFT.US)支持的OpenAI將多模態(tài)(結(jié)合文本、圖像和視頻生成)作為目標(biāo)。
到目前為止,Sora僅供一小部分安全測試人員或“紅隊”使用,他們測試該模型在錯誤信息和偏見等方面的漏洞。除了在其網(wǎng)站上可以找到的10個樣本片段外,該公司還沒有發(fā)布任何公開演示,并表示將在周四晚些時候發(fā)布隨附的技術(shù)論文。
OpenAI還表示,它正在構(gòu)建一個“檢測分類器”,可以識別Sora生成的視頻片段,并計劃在其輸出中包含某些元數(shù)據(jù),以幫助識別AI生成的內(nèi)容。這是Meta在今年大選年用來識別人工智能生成的圖像的同一類型的元數(shù)據(jù)。
Sora是一種擴散人工智能模型,與ChatGPT一樣,它使用了谷歌研究人員在2017年的一篇論文中介紹的Transformer架構(gòu)。OpenAI在聲明中寫道:“Sora是能夠理解和模擬現(xiàn)實世界的模型的基礎(chǔ)。”