智通財經(jīng)APP獲悉,國泰君安證券發(fā)布研報稱,最新的 GPT-4o 能夠與用戶實時溝通、理解語氣,在教育、情感陪伴、虛擬人等賽道具備較強落地可能性,相關(guān)布局公司產(chǎn)品效果有望提升。AI 應(yīng)用門檻持續(xù)降低,語音及圖像交流的使用體驗進一步提升,繼續(xù)看好 C 端應(yīng)用場景拓展,如下場景可能受益:1)教育,受益標(biāo)的世紀(jì)天鴻、皖新傳媒、南方傳媒、鴻合科技;2)情感陪伴與語音賽道,受益標(biāo)的昆侖萬維、盛天網(wǎng)絡(luò);3)虛擬人與游戲,推薦愷英網(wǎng)絡(luò)、吉比特、三七互娛、完美世界,受益標(biāo)的巨人網(wǎng)絡(luò)、掌趣科技、捷成股份;4)硬件端產(chǎn)品合作。
5 月 14 日,OpenAI 發(fā)布最新旗艦大模型 GPT-4o。GPT-4o 免費向所有人提供 GPT-4 級別的 AI,應(yīng)對低成本開源模型競爭態(tài)勢。GPT-4o將對所有用戶免費開放當(dāng)前Plus會員版的全部功能,包括視覺、聯(lián)網(wǎng)、記憶、數(shù)據(jù)分析、執(zhí)行代碼、GPT Store 等。
GPT-4o 打通多模態(tài),可實時語音對話。根據(jù)官方演示效果,GPT-4o能實現(xiàn) 1)與演示者即時交流、2)理解和表達語言情緒、3)根據(jù)攝像頭輸入實時互動解答問題;相比下,之前的 GPT 只能進行單輪次的語言對話、單張照片輸入,也無法理解和表達語言情緒,語音溝通的實現(xiàn)是通過“語音轉(zhuǎn)文字”、“文字理解(GPT4)”、“文字轉(zhuǎn)語音”的方式進行文本信息的處理。此次 GPT-4o 實現(xiàn)的“無縫交流”說明其能夠同時理解文本、圖像、音頻等,并能將其任何組合作為輸入或輸出。GPT-4o 所有輸入和輸出由同一個神經(jīng)網(wǎng)絡(luò)處理,這使它能壓縮響應(yīng)時間至 320 毫秒并接收語氣、停頓等非語言信息,實現(xiàn)幾乎無延遲的實時對話。
期待端側(cè)應(yīng)用場景與開發(fā)端應(yīng)用。隨著多模態(tài)打通,GPT-4o 響應(yīng)速度更快、成本更低、人機交互更順暢,能夠更好的在手機、電腦等端側(cè)進行 AI 交互,可期待相關(guān)布局推進;同時,GPT-4o 的 API 被放出,可以部署到各種下游應(yīng)用程序中,相較 GPT-4 Turbo,推理速度提升2 倍,消息上限提高五倍,價格降低 50%。
風(fēng)險提示:GPT-4o 效果及推進不及預(yù)期;國內(nèi)大模型發(fā)展進度不及預(yù)期。