效果炸裂！OpenAI發(fā)布首個視頻生成模型Sora：輸文字出視頻

作者：智通財經(jīng) 魏昊銘 2024-02-16 10:32:20

OpenAI將把人工智能技術(shù)帶到視頻領(lǐng)域。

智通財經(jīng)獲悉，OpenAI將把人工智能技術(shù)帶到視頻領(lǐng)域。該公司周四推出了新的生成式人工智能模型Sora。Sora的工作原理類似于OpenAI的圖像生成人工智能工具DALL-E。用戶輸入想要的場景，Sora就會返回一個高清視頻剪輯。Sora還可以生成受靜態(tài)圖像啟發(fā)的視頻剪輯，并擴展現(xiàn)有視頻或填充缺失的幀。

隨著聊天機器人和圖像生成器進入消費者和商業(yè)世界，視頻可能成為生成式人工智能的下一個前沿領(lǐng)域。雖然創(chuàng)造性的機會將激發(fā)人工智能愛好者，但隨著全球重大政治選舉的臨近，新技術(shù)帶來了嚴(yán)重的錯誤信息擔(dān)憂。

OpenAI希望通過Sora與Meta(META.US)和谷歌(GOOGL.US)等公司的視頻生成人工智能工具競爭。谷歌今年1月宣布推出AI視頻大模型Lumiere。其他初創(chuàng)公司也有類似的人工智能工具，比如Stability AI，該公司有一款名為Stable Video Diffusion的產(chǎn)品。亞馬遜(AMZN.US)還發(fā)布了“Create with Alexa”，這是一個專門生成基于提示的兒童動畫短片的模型。

Sora目前僅限于生成一分鐘或更短的視頻。在提供更廣泛的人工智能模型套件的努力中，由微軟(MSFT.US)支持的OpenAI將多模態(tài)(結(jié)合文本、圖像和視頻生成)作為目標(biāo)。

到目前為止，Sora僅供一小部分安全測試人員或“紅隊”使用，他們測試該模型在錯誤信息和偏見等方面的漏洞。除了在其網(wǎng)站上可以找到的10個樣本片段外，該公司還沒有發(fā)布任何公開演示，并表示將在周四晚些時候發(fā)布隨附的技術(shù)論文。

OpenAI還表示，它正在構(gòu)建一個“檢測分類器”，可以識別Sora生成的視頻片段，并計劃在其輸出中包含某些元數(shù)據(jù)，以幫助識別AI生成的內(nèi)容。這是Meta在今年大選年用來識別人工智能生成的圖像的同一類型的元數(shù)據(jù)。

Sora是一種擴散人工智能模型，與ChatGPT一樣，它使用了谷歌研究人員在2017年的一篇論文中介紹的Transformer架構(gòu)。OpenAI在聲明中寫道:“Sora是能夠理解和模擬現(xiàn)實世界的模型的基礎(chǔ)。”

智通聲明：本內(nèi)容為作者獨立觀點，不代表智通財經(jīng)立場。未經(jīng)允許不得轉(zhuǎn)載，文中內(nèi)容僅供參考，不作為實際操作建議，交易風(fēng)險自擔(dān)。更多最新最全港美股資訊，請點擊下載智通財經(jīng)App

相關(guān)閱讀

OpenAI再現(xiàn)“人事地震”：創(chuàng)始成員Andrej Karpathy離職

2024-02-14 20:18 馬火敏

第一批進入臨床的AI設(shè)計藥物怎么樣了？

2024-02-14 08:30 智通轉(zhuǎn)載

2024年值得關(guān)注的十大產(chǎn)業(yè)趨勢

2024-02-13 07:53 智通轉(zhuǎn)載

吹響AI PC號角！微軟(MSFT.US)在Windows中不斷增加“Copilot含量”

2024-02-11 07:53 智通轉(zhuǎn)載

美國AI安全研究所成立! 成員陣容龐大：微軟、OpenAI以及谷歌領(lǐng)銜

2024-02-08 20:58 盧梭