智通財經(jīng)APP獲悉,國聯(lián)證券發(fā)布研報稱,北京時間5月14日凌晨,OpenAI發(fā)布新一代旗艦生成模型GPT-4o、桌面App,并重點(diǎn)展示了突破性的語音交互能力。2024年以來,多模態(tài)能力成為生成式AI的重點(diǎn)攻堅(jiān)方向,而OpenAI作為頭部企業(yè),在技術(shù)和產(chǎn)品層面持續(xù)引領(lǐng)行業(yè)發(fā)展。此外,2月OpenAI發(fā)布Sora以來,海內(nèi)外視頻生成類應(yīng)用加速落地。此次GPT-4o的發(fā)布,亦有望助推語音交互類AI應(yīng)用的落地進(jìn)程,其中在社交、游戲、教育領(lǐng)域有望率先落地。
隨著海外AI模型能力加速演進(jìn),以及國內(nèi)模型能力的持續(xù)追趕,2024年以來國內(nèi)AIC端應(yīng)用落地進(jìn)程顯著加速,有望孵化AI原生的“殺手級應(yīng)用”。建議關(guān)注:1)AIC端應(yīng)用落地較快的昆侖萬維(300418.SZ)、盛天網(wǎng)絡(luò)(300494.SZ);2)估值低位、業(yè)績較優(yōu)的游戲標(biāo)的愷英網(wǎng)絡(luò)(002517.SZ)、巨人網(wǎng)絡(luò)(002558.SZ)。
國聯(lián)證券主要觀點(diǎn)如下:
GPT-4o交互能力實(shí)現(xiàn)突破,“擬人化”程度進(jìn)一步提升
從產(chǎn)品效果來看,GPT-4o在實(shí)時語音交互領(lǐng)域?qū)崿F(xiàn)突破性進(jìn)展,為用戶提供更為自然、準(zhǔn)確的交互體驗(yàn):1)用戶可以隨時打斷模型,而不需要等到其結(jié)束才開始說話,交互更加符合人類交互邏輯。2)實(shí)時響應(yīng)能力大幅提升,模型具有實(shí)時響應(yīng)的能力,不會出現(xiàn)用戶長時間等待模型給出響應(yīng)的尷尬情況。
3)模型具有情緒感知能力,能夠生成不同情緒風(fēng)格的語音,交互更加擬人。基于GPT-4o強(qiáng)大的交互能力,發(fā)布會中展示了豐富的應(yīng)用場景,包括聲情并茂地講情感故事、實(shí)時視頻對話、實(shí)時音頻翻譯等。從技術(shù)層面看,GPT-4o采用了全新技術(shù),所有的輸入和輸出都由同一個神經(jīng)網(wǎng)絡(luò)處理,從而實(shí)現(xiàn)文本、視覺和音頻端到端的訓(xùn)練。
1)社交:目前,AI+社交產(chǎn)品形態(tài)多以“用戶-AI智能體”交互為主,用戶通過與個性化AI虛擬人的交互過程,獲得陪伴感與情緒價值。從產(chǎn)品數(shù)據(jù)來看,海外頭部產(chǎn)品Character.AI月活達(dá)千萬級別,國內(nèi)Minimax旗下“星野”增勢顯著。從落地門檻來看,陪伴類場景的任務(wù)簡單、容錯率高,因此成為最快落地的AIC端應(yīng)用場景。從用戶需求來看,AI智能體“更像人”是AI社交用戶的核心需求。GPT-4o發(fā)布后,有望從多模態(tài)(從文字交互到語音交互)、擬人化(更準(zhǔn)確識別用戶的情緒和需求)等方面大幅提升用戶體驗(yàn),從而推動AI社交類產(chǎn)品進(jìn)一步破圈、提升商業(yè)化能力。
2)游戲:AI在游戲研發(fā)流程中落地較快,目前核心關(guān)注游戲玩法的創(chuàng)新。其中AI+NPC已在網(wǎng)易《逆水寒》等產(chǎn)品中落地,但僅限于文字類交互,與核心玩法的結(jié)合也較為有限。隨著GPT-4o引領(lǐng)交互方式變革,游戲內(nèi)NPC有望與用戶實(shí)現(xiàn)實(shí)時的語音交互、擬人化程度有望進(jìn)一步提升,大幅提升用戶的沉浸感,進(jìn)而提升活躍度及付費(fèi)意愿。
3)教育:此前,海外多鄰國等已將生成式AI運(yùn)用于口語練習(xí)等場景中,助推2023Q4付費(fèi)用戶同比增長57%。GPT-4o落地后有望使“AI教師”更為擬人,進(jìn)一步提升教學(xué)、培訓(xùn)效率和用戶體驗(yàn)。
風(fēng)險提示:技術(shù)發(fā)展不及預(yù)期,AI應(yīng)用落地不及預(yù)期,政策監(jiān)管風(fēng)險。