智通財(cái)經(jīng)APP獲悉,8月25日晚間,商湯(00020)發(fā)布了截至2023年6月30日的半年業(yè)績報(bào)告。財(cái)報(bào)顯示,上半年商湯集團(tuán)總收入為人民幣14.33億元,同比增長1.3%;毛利潤為人民幣6.48億元,毛利率為45.3%。在業(yè)績交流會上,商湯表示,公司初步判斷生成式人工智能的收入到了24年應(yīng)該會比23年很有可能可以翻一倍,甚至更多。到24年我們估計(jì)占整個公司收入的比例很有機(jī)會在30%以上,因?yàn)樯习肽暌堰_(dá)20%。到25年不出意外到40%的總收入以上。再往后看,到 26、27年 應(yīng)該是不斷地往上走,公司到了那個時候,應(yīng)該是一個逐漸由生成式人工智能來帶領(lǐng)的生意。
此外,商湯提到,公司服務(wù)過超過200個以上的互聯(lián)網(wǎng)的APP,互聯(lián)網(wǎng)APP會逐步開始接入公司的大語言模型,包括像微博、小紅書、b站、美圖等直接轉(zhuǎn)化為大模型應(yīng)用的客戶。
Q&A
Q:我們看到現(xiàn)在開源和閉源的模型同時在推進(jìn),比如llama2是一個開源的模型,國內(nèi)也有一些開源的模型,但是OpenAl的GPT4是閉源的,怎么看開源模型和閉源模型未來的競爭和發(fā)展趨勢。
A:開源、閉源是一個硬幣的兩方面,一方面是閉源是希望取得更大的商業(yè)上的領(lǐng)先,但是如果沒有在現(xiàn)在這個點(diǎn)上,開源擁有更大的生態(tài)來協(xié)助著整個迭代的話,那么閉源的模型性能又不可能說走得更加靠前。我們通過上千次的實(shí)驗(yàn)發(fā)現(xiàn),對于行業(yè)的knowhow構(gòu)建的數(shù)據(jù)配方,以及對于一些訓(xùn)練的技巧,其實(shí)是模型迭代的關(guān)鍵。這個部分的關(guān)鍵是需要我們開源開放我們的生態(tài),讓更多的人能夠參與到構(gòu)建當(dāng)中,從而形成更多的knowhow的沉淀,來打造更好的性能的基模型。
在這過程當(dāng)中包括開源還可以做前端部署的壓縮,增量訓(xùn)練,如果模型完全閉源的話,很多的這樣的操作會有很大的困難,所以對于很多的場景上我們利用開源來吸引、打造和生態(tài),同時開源又很有利于我們的AI的基礎(chǔ)設(shè)施sensecore來提供一體化數(shù)據(jù)、算力算法的一體化的服務(wù),從而使得我們的客戶能夠享受到基礎(chǔ)模型的發(fā)展的過程。有一些行業(yè)我們做行業(yè)性的端到端的模型,是由商湯來閉源完成,提供一個行業(yè)高質(zhì)量模型的服務(wù)。
Q:國內(nèi)很多企業(yè)都需要大模型在本地化或做私有化的部署,我們?nèi)绾慰创诓煌袠I(yè)私有化部署的行業(yè)機(jī)遇?對于商湯來講,我們預(yù)期未來短期我們會聚焦在哪些領(lǐng)域里面做我們私有化部署的大模型商業(yè)化實(shí)現(xiàn)?
A:中國大模型ToB賦能的市場很大,因?yàn)槲覀儦v史的發(fā)展機(jī)遇和一些現(xiàn)有的狀況,所以大模型一方面可以更好地結(jié)合到行業(yè)的數(shù)據(jù)弄好,二來對于很多的數(shù)據(jù)安全、價值觀體系的管控,可以相對做到能夠更好地跟人的行為更好地對齊。
在現(xiàn)在的這樣的行業(yè)應(yīng)用當(dāng)中,我們看到很多垂直領(lǐng)域的應(yīng)用,比如農(nóng)業(yè)、能源、金融、地產(chǎn)、教育、人力資源,包括傳媒以及工業(yè)制造等等系列的垂直行業(yè)里面,來打造我們的垂直行業(yè)的大模型。這是一個 ToB大模型的部署。這些部署的私有化部署的條件分行業(yè)還有些區(qū)分,有一些需要更嚴(yán)苛的服務(wù)級別的私有化部署,另外有一些可能是需要說我們的大裝置來開辟私有化的區(qū)域等等,但是整體上來講,私有化的模型和升級部署是跟行業(yè)的knowhow相結(jié)合,并且現(xiàn)在是一個很好的發(fā)展的機(jī)遇。
另外有一類我們服務(wù)的客戶,除了純粹b端之外,我們也有很多2B2C。我們傳統(tǒng)的企業(yè)客戶里面有一類客戶是互聯(lián)網(wǎng)客戶,我們也服務(wù)過超過200個以上的互聯(lián)網(wǎng)的APP,互聯(lián)網(wǎng)APP也會逐步開始接入我們的大語言模型,因?yàn)樵趦r值觀對齊的情況下會有更多的這樣的應(yīng)用開放。原來的我們的互聯(lián)網(wǎng)的應(yīng)用,包括像微博、小紅書、b站、美圖等直接轉(zhuǎn)化為大模型應(yīng)用的客戶。
隨著價值觀能夠更好地對齊,大模型終將通過ToBtoc賦能到行業(yè),這一類客戶相對它也是隨著行業(yè)應(yīng)用來定制化的模型。但這類模型未必是一個完全私有化的部署,可能是有一個安全的鏈接就能夠推到推廣。所以我們在接下來的半年當(dāng)中,我們在這兩方面上我們會聚焦地推動我們大模型的落地。
怎么看一個基模型的核心能力?還是看它的functioncore,也就是它怎么去調(diào)用這些API的能力?隨著這部分能力的綜合提升,很多的傳統(tǒng)當(dāng)中我們認(rèn)為像操作系統(tǒng)級別的,搜索引擎級別的內(nèi)容都會被逐步地顛覆和變化,這個會帶來新的生產(chǎn)力工具的商機(jī),而這類商機(jī)恰恰是我們覺得現(xiàn)大模型能夠推動產(chǎn)業(yè)發(fā)展,跟實(shí)體產(chǎn)業(yè)做結(jié)合一個最重要的這個要素之一,所以這也是我們下半年會發(fā)力的。
Q:大模型短期來看很難直接給企業(yè)直接的用,這里面有可能還需要一些工程化的事情。有些行業(yè)有可能工程化需求量也是比較大。咱們?nèi)绾蝸砜催@個問題,或者咱們會不會比如說通過一些自建私有化部署的團(tuán)隊(duì),還是通過找一些合作伙伴去做工程化的事情?
A:我覺得這是分兩方面,一方面怎么構(gòu)造這個行業(yè)的私有化模型、垂直模型。基模型能力很強(qiáng),但是它對于行業(yè)如果有一些行業(yè)的能力沒有見過,那實(shí)際上它是有缺失的,所以是需要一個團(tuán)隊(duì),實(shí)際上某種程度上叫數(shù)據(jù)工程團(tuán)隊(duì)來針對行業(yè)來構(gòu)造我們這個數(shù)據(jù)的recipe,這部分的recipe是能夠值得真正讓大模型走向這個行業(yè),否則行業(yè)里面很多的應(yīng)用是沒有辦法去過正確率的限制。
第二個,即使是這類打穿了之后,在私有化部署當(dāng)中,它涉及到多卡調(diào)動、并行推理等等一系列的復(fù)雜的場景,那么可能是需要有一個比較強(qiáng)的部署團(tuán)隊(duì),這個部分相對來說我們可以用大裝置的能力去賦能我們的合作伙伴,我們有很多的傳統(tǒng)大眾,甚至是在智慧城市當(dāng)中的 SIP幫助我們?nèi)ソ鉀Q大量的部署化的問題。所以有了這兩個的支撐,我們相信大模型ToB甚至是和實(shí)體產(chǎn)業(yè)的結(jié)合應(yīng)該會很快的做經(jīng)濟(jì)上的效益。
Q:生成式AI相關(guān)業(yè)務(wù)的收入增長還是很強(qiáng)勁的,它增長的動能,我們和其他競爭者相比的優(yōu)勢以及未來的展望。未來收入占比和利潤占比可以有一個怎么樣的展望?
A:我們對生成式人工智能的業(yè)務(wù)確實(shí)是寄予厚望,因?yàn)槲覀冋莆樟诉@個新興技術(shù)的諸多的關(guān)鍵成功要素,包括大模型訓(xùn)練的人才和經(jīng)驗(yàn),這個經(jīng)驗(yàn)是需要很長時間積累,而且真正頂尖的人才是并沒有那么多的。
第二是大數(shù)據(jù)集的獲取和優(yōu)化,這里面的學(xué)問也非常多。還有充足的算力的積累,我們在中國已經(jīng)積累到了第一梯隊(duì)的巨大的算力,另外還需要擁有這個應(yīng)用場景的大客戶,和我們能夠長期合作,我們歷史上已經(jīng)有眾多各行各業(yè)的客戶跟我們在各種層面做合作,他們現(xiàn)在都對生成式人工智能非常的感興趣,所以這一系列的因素都對我們非常有利。
這個事情因?yàn)檫€處于一個巨大市場剛剛起飛的狀況,所以很難預(yù)測得非常的精準(zhǔn)。但我們的感覺是它今后會有越來越多的機(jī)會是產(chǎn)生直接或間接面對c端的應(yīng)用相關(guān)的收入,也有一些是緊密結(jié)合行業(yè)大模型的相關(guān)的收入,這兩塊占比在生成式人工智能收入里面會逐漸越來越高。在歷史上這兩塊稍微會低一些,因?yàn)椴艅倓傞_始,我們初步判斷生成式人工智能的收入到了24年應(yīng)該會比23年很有可能可以翻一倍,甚至更多。到24年我們估計(jì)占我們整個公司收入的比例很有機(jī)會在30%以上,因?yàn)槲覀兩习肽?0%。到25年我們覺得不出意外到40%的總收入以上。
再往后看,到 26、27 應(yīng)該是不斷地往上走,所以我們公司到了那個時候,應(yīng)該是一個逐漸由生成式人工智能來帶領(lǐng)的生意。而且這在這塊上我們確實(shí)當(dāng)之無愧,因?yàn)橐呀?jīng)擁有了很多得天獨(dú)厚的成功因素在里面,而且我們整個管理層都是把主要的精力和資源都投在這個地方。
Q:從利潤率層面來看,生成式AI業(yè)務(wù)是增厚的還是攤薄的?
A:這個也比較難回答得很準(zhǔn)確,因?yàn)楹芏嗌虡I(yè)模式才剛剛的在試驗(yàn)中。在今年上半年,我們因?yàn)閯倓傞_始,目前總體的業(yè)務(wù)的毛利率初步看是比我們公司平均毛利要高的,但是它未來確實(shí)是有各種各樣不同商業(yè)模式的,會影響整個生成式的總的毛利。
我個人猜想在剛剛開始井噴式增長的時候,大家也許會比較注重把產(chǎn)品盡快推出去,在最早的時候大家可能對毛利不一定太注重,可能先要讓更多的人去享用、試用這款或者是若干款非常牛的產(chǎn)品。所以它剛剛開始的時候,可能毛利率本身不一定是最關(guān)鍵的指標(biāo),但是我們也是經(jīng)歷了人工智能小模型時代,本質(zhì)上大模型規(guī)模效應(yīng)肯定比小模型要高的,大模型可以同時展示非常強(qiáng)大的綜合的能力,所以只要你一旦確定了行業(yè)技術(shù)明顯的優(yōu)勢,不是一個隨便誰都可以很輕松地達(dá)到你的技術(shù)水平,我們覺得這個技術(shù)的壁壘是非常高的。
在這個前提下,我們覺得這個業(yè)務(wù)往后,往未來、往長期走,它應(yīng)該長期的利潤空間很有可能比人工智能小模型時代要高,它的規(guī)模效應(yīng)、商業(yè)效率都應(yīng)該是很高。所以
這也就是為什么我們覺得它并不一定會把整個公司的毛利率往下去拉,但是在初創(chuàng)時期的井噴時期,有時候比較難說得特別的準(zhǔn)確,我有時候是先要把份額先占到,讓所有人先用到我們的產(chǎn)品,那個時候可能會做一些戰(zhàn)略上的考量,但是長遠(yuǎn)我們覺得對公司的毛利不應(yīng)該是一個drag。