智通財經(jīng)APP獲悉,近日,據(jù)媒體報道,蘋果公司發(fā)布了一篇研究論文,討論了其正在研究的生成式AI技術(shù)——HUGS。據(jù)介紹,目前HUGS經(jīng)過訓練,可以在約30分鐘內(nèi)生成數(shù)字人類分身。據(jù)稱,這比NeuMan、Vid 2 Avatar在內(nèi)的其他方式要快約100倍??梢钥吹?,蘋果正在大刀闊斧地進行更新,預計接下來,在人工智能技術(shù)的影響下,相關(guān)行業(yè)將會不斷出現(xiàn)新的技術(shù)創(chuàng)新。東方證券表示,AI數(shù)字人的加速落地,相關(guān)產(chǎn)業(yè)政策的快速跟進,建議關(guān)注行業(yè)各細分賽道。相關(guān)概念股:商湯(00020)、百度集團-SW(09888)、網(wǎng)易-S(09999)。
蘋果研究員Anurag Ranjan發(fā)布推文,表示HUGS的全稱叫作Human Gaussian Splats,使用機器學習和計算機視覺,在原始輸入數(shù)據(jù)較少的情況下,創(chuàng)建出逼真的人像元素。蘋果官方介紹中表示神經(jīng)渲染技術(shù)目前已經(jīng)有了長足的進步,但最適合的場景依然是靜態(tài)場景的攝影測量,還無法推廣到環(huán)境中自由移動的人類。
HUGS使用3DGaussian Splatting的技術(shù),在場景中創(chuàng)建可移動的人類。該方法本身需要少量的主體視頻,通常在場景中運動,并顯示盡可能多的表面供系統(tǒng)工作。在某些情況下,該技術(shù)對源輸入數(shù)據(jù)的要求很低,最少可以低至50到100幀的單目視頻,相當于2到4秒的24fps視頻。
事實上,蘋果公司一直致力于有關(guān)數(shù)字分身的研究。例如在其最新MR頭顯VisionPro里,該設備能夠通過前置攝像頭掃描用戶面部信息,并基于機器學習技術(shù)和編碼神經(jīng)網(wǎng)絡,為用戶生成一個數(shù)字分身。當用戶使用FaceTime通話時,數(shù)字分身便可以模仿用戶的面部及手部動作。
此外,據(jù)媒體消息報道,iPhone 16系列最大的更新可以說是引入AIGC。蘋果計劃對iPhone 16麥克風進行重大升級,以改善新的人工智能增強Siri體驗。郭明錤在最新的帖子中寫道,加強Siri的硬件和軟件功能和規(guī)格是推廣人工智能生成內(nèi)容的關(guān)鍵。他表示,蘋果的生成式AI野心以及將大型語言模型(LLMs)集成到Siri中將嚴重依賴于改進的語音輸入處理。
據(jù)行業(yè)人士透露,蘋果計劃最早在2024年底開始在iPhone和iPad上融入AIGC技術(shù)。今年10月,蘋果發(fā)布用于個人電腦的M3、M3 Pro和M3 Max芯片時也透露出關(guān)鍵信息。蘋果當時稱,這些芯片引入了增強型神經(jīng)網(wǎng)絡引擎,用于加速強大的機器學習(ML)模型。
2023年,無疑是AI行業(yè)風起云涌的一年,圍繞大模型競爭引發(fā)了諸多行業(yè)熱潮,在全球科技企業(yè)的共同推動下,其應用也從云端更多地走向邊緣、終端,智能手機、PC等消費電子設備正在開始大幅更新,以適應大模型、AIGC的應用。
展望2024年,著名科技媒體Tech Crunch對明年AI行業(yè)趨勢做出六大預測:1)OpenAI將成為一家產(chǎn)品公司;2)代理、生成視頻和生成音樂從小眾走向大眾;3)混合小模型可能更有優(yōu)勢;4)很多公司會放棄大規(guī)模應用AI,行業(yè)會出現(xiàn)一輪整合浪潮;5)蘋果即將加入戰(zhàn)局;6)可能會出現(xiàn)全新的AI合規(guī)行業(yè)。
東方證券表示,AI賦能使數(shù)字人有更加智能的內(nèi)核。虛擬數(shù)字人的驅(qū)動可分為由真人扮演的“中之人”驅(qū)動和AI驅(qū)動,過去AI驅(qū)動數(shù)字人的痛點在于成本較高、交互效果不佳,因此由“中之人”驅(qū)動更為常見:而隨著近期AI領域的技術(shù)突破、文本、圖像等領域的大模型應用的快速落地,將使數(shù)字人的應用場景及范圍明顯擴大。AI數(shù)字人的加速落地,相關(guān)產(chǎn)業(yè)政策的快速跟進,建議關(guān)注行業(yè)各細分賽道。
投資機會方面,信達證券建議重點關(guān)注AI三大創(chuàng)新領域。2023年以來,AI行業(yè)實現(xiàn)了突飛猛進的發(fā)展,是目前全球科技進步的最前沿方向。該行認為以GPT為代表的大語言模型方向,以圖像/視頻生成技術(shù)為代表的AIGC方向,和以自動控制/邊緣計算為代表的硬件及自動駕駛方向,是AI行業(yè)值得重點關(guān)注的三大創(chuàng)新領域。建議重點關(guān)注擁有大語言模型的科技巨頭微軟、谷歌、百度、騰訊控股、阿里巴巴等,AIGC應用龍頭Adobe、美圖公司、阜博集團、檸萌影視,邊緣硬件端PC和手機頭部品牌聯(lián)想集團、小米集團,以及自動駕駛技術(shù)領先的新勢力企業(yè)小鵬汽車等。
相關(guān)概念股:
商湯(00020):9月份,商湯“如影SenseAvatar”AI數(shù)字人生成平臺通過中國信通院首批“可信虛擬人生成內(nèi)容管理系統(tǒng)”測評,并榮獲“L3卓越級”證書,標志著商湯如影在功能完備程度、系統(tǒng)可信能力、產(chǎn)業(yè)化能力方面,已達到行業(yè)標桿級水平。
百度集團-SW(09888):由百度研究院孵化的VidPress是業(yè)界首個支撐通用型、大規(guī)模生產(chǎn)的智能視頻合成平臺,用戶僅需一鍵輸入新聞圖文內(nèi)容鏈接,就可以自動化完成視頻制作,整套制作流程在數(shù)分鐘內(nèi)即可全部完成。
網(wǎng)易-S(09999):目前網(wǎng)易自研AI技術(shù)已應用于游戲工業(yè)化全流程,AI技術(shù)對關(guān)鍵環(huán)節(jié)的工作效率提升高達90%。據(jù)介紹,網(wǎng)易互娛AI LAB已自研數(shù)十款AI提效工具,覆蓋AI語音生成、AI原畫生成、AI視頻動捕、AI模型生成等諸多環(huán)節(jié)。