本文來自微信公眾號“線性資本”(ID:LinearCapital),作者:虞兆愷Kelvin,編輯/翻譯:張碩何James。
作者介紹:本文作者虞兆愷Kelvin現(xiàn)就讀于普林斯頓大學計算機科學本科二年級,于 2019 年 6 月加入線性資本作為全職暑期實習生。他的郵箱為zkyu@princeton.edu,對此話題感興趣的讀者可以與他聯(lián)系,感謝來信。本文原題為《SaaS is Evolving: Introducing the New Wave of AI-First Enterprise Solutions 》。
編者按
人是一種由規(guī)則組成的碳基生命,進食之于存續(xù),猶如生病之于凋零。
而企業(yè)組織是一種由規(guī)則組成的群體,在人類進化的長河中,將人所被制定的規(guī)則轉嫁到了組織之上,直到現(xiàn)在,企業(yè)成為了新的群體性生命。
直覺是發(fā)自內(nèi)心的,而理性則是反人性的。
企業(yè)的管理如同人的生存之道,這是一個由直覺慢慢總結為經(jīng)驗,再由經(jīng)驗出發(fā)提煉出規(guī)則的過程。
就像對于獵食動物的恐懼深植在草原部落上原始祖先的海馬體中,同樣的,對于企業(yè)組織的未雨綢繆也是企業(yè)領導記憶深處的商業(yè)案例的反射。
所以,靠直覺和經(jīng)驗管理企業(yè),是企業(yè)大腦中最直接的反射。
一套可被參照且自動執(zhí)行的智能化流程,是每一個企業(yè)最終極的理想。
從最早由經(jīng)驗管理公司,再到S.O.P.的出現(xiàn),借由網(wǎng)絡把S.O.P搬上云端變?yōu)镾aaS,最后,其實還是期望能進化成可被AI執(zhí)行的流程。
但是,對于經(jīng)驗的迷信,對于證據(jù)的直覺依賴,是存于人類碳基結構的基因之中的。
基于硅體的人工智能不是要復制人的智能,而只是要適應經(jīng)驗的短板。
本文作者縱覽發(fā)跡于美國硅谷與其他北美地區(qū)的SaaS企業(yè),希望能較為全面地展示一套企業(yè)組織如何利用A.I.進入到智能化的進程中,勾畫一個脫碳入硅的藍圖,為中國SaaS企業(yè)提供方法論的參考。
01.作者序
橫軸表示為公司規(guī)模(以員工數(shù)量單位);縱軸表示為SaaS產(chǎn)品的使用量
眾所周知,美國的企業(yè)們擁有世界上相對來說最深厚的技術儲備。
隨著各個體量的大小公司紛紛采購SaaS產(chǎn)品,服務于企業(yè)端的軟件數(shù)量激增,也因此造就了一條成熟的軟件供給與采購的鏈條。
以銷售科技類公司Chiefmartec為例,在在2011年公司旗下?lián)碛?50名銷售人員,覆蓋了廣告、內(nèi)容管理、客戶關系管理、銷售、數(shù)據(jù)分析與公司運營管理等領域。
這一數(shù)字在2017年達到了5000名,在如今的2019年更是達到了7040名。
2011年度的銷售科技板塊:共有150家供貨商
2017年度的銷售科技板塊:共有5000家供貨商;到了2019年,數(shù)字為7040家供應商
現(xiàn)如今的美國SaaS市場以趨近于飽和,且已經(jīng)出現(xiàn)了許多平臺級的解決方案。
為了用來區(qū)分這些產(chǎn)品,我們將傳統(tǒng)的SaaS公司歸納為四個不同屬性的戰(zhàn)略:
1. 用戶精準型
區(qū)別于傳統(tǒng)通用的解決方案,比如Salesforce所提供的,用戶精準型的企業(yè)擅于在一個絕對垂直領域為其客戶細分提供適配且精準的服務,在一定程度上放棄了廣闊的市場來達成市場與產(chǎn)品的高度匹配,即「Product-Market-Fit」。
2. 市場細分型
與前者不同的是,市場細分型的企業(yè)是從一個市場大小的絕對值來看的,這類企業(yè)專注在一個體量比較有限的市場細分下,比如專門服務中小型企業(yè),即「Small and Medium-sized Businesses, SMBs」。
3. 產(chǎn)品精耕型
產(chǎn)品精耕型企業(yè)的產(chǎn)品通常強調極大限度地優(yōu)化產(chǎn)品,可能僅以20%的產(chǎn)品功能便獲得了80%的回報,以一個極簡化的姿態(tài)來參與市場競爭。
4. 雙邊優(yōu)化型
雙邊指的是客戶端與企業(yè)端,雙邊優(yōu)化型的企業(yè)擅于在產(chǎn)品戰(zhàn)略上讓企業(yè)端與客戶端同時產(chǎn)出價值,讓客戶成為產(chǎn)品自傳播的渠道,從而提升企業(yè)價值。
但是,在過去幾年中,我們開始看到一種更為獨特的企業(yè)戰(zhàn)略,并且因此孕育了一大批新興企業(yè)。
盡管在這些企業(yè)中,他們擁有不同的行業(yè)區(qū)分和業(yè)務區(qū)分,但是他們都擁有一個共同的「人工智能先行的戰(zhàn)略」,即「AI-First Strategy」。
AI為傳統(tǒng)SaaS賦能的過程,可以被看作是一場范式的躍遷。
因為AI賦能之后的軟件行業(yè),將呈現(xiàn)出一些從未有過的業(yè)務形態(tài)、一種千人千面的使用體驗、一個未曾想過的商業(yè)潛能。
但這也不是說所有的商業(yè)模型都適合被AI智能化,企業(yè)需要考慮的是從傳統(tǒng)架構遷移到智能化平臺后所帶來的投資回報,一味地追求數(shù)字化與智能化,并不會簡單地提升所有業(yè)務的價值。
因此,本文的核心訴求是給予讀者一個價值判斷的框架,去理解這個時代變遷后的商業(yè)新格局,從新的緯度來看目前格局的企業(yè)劃分,以及思考一下人工智能為行業(yè)和企業(yè)帶來的結果。
在接下來的章節(jié)中,將要為讀者展示三種獨特的AI結合SaaS戰(zhàn)略,正式他們讓這些新興企業(yè)與傳統(tǒng)SaaS服務提供商區(qū)別開來,以及五個來自不同公司的AI應用。
另外,在最后一個章節(jié)中,將要討論為什么SaaS企業(yè)的AI賦能卻不能帶來一個贏者通吃的終局。
值得一提的是,企業(yè)AI智能化產(chǎn)業(yè)的先驅之一李開復博士是極為看好AI賦能的未來,但是在這里本文根據(jù)三個緯度的數(shù)據(jù)分析,來一一駁斥其中玄機。
02.三種獨特的AI+SaaS結合戰(zhàn)略
AI+SaaS結合型的企業(yè)在功能上也具備之前提到的四種戰(zhàn)略的特征,并且在一定程度上,大部分企業(yè)可以很輕易使用用戶精準型戰(zhàn)略的。
但是AI為這些新興企業(yè)賦予了一個全新的產(chǎn)品形態(tài),這點是傳統(tǒng)SaaS企業(yè)難以望其項背的。
舉例來說,隨著計算機視覺技術的演進,一個基于面部捕捉和情感分析的商業(yè)智能化產(chǎn)業(yè)就被開辟出來了。
如今,經(jīng)銷商可以根據(jù)客戶在購物過程中的體態(tài)和表情變化來分析哪一類商品更受歡迎,大學課堂上的演講和當堂反應也可以被用來分析哪一位老師更能吸引學生注意力。
所以,「AI先行」的公司可以被歸納為三種獨特的戰(zhàn)略模式:
1. 能借助AI運行超復雜系統(tǒng)和超負荷任務。
以Invenica為例,憑借基于機器學習開發(fā)的預測模型能夠通過預測多個單點電力柵極的活動狀態(tài)來管理整個復雜的電力網(wǎng)。憑借此項技術,Invenica更是拿下多個訂單,為多個管理系統(tǒng)提供預測模型。
2. 能夠借助AI轉錄和分析以往并不能被數(shù)字化的數(shù)據(jù)形式(e.g. 計算機視覺)。
拿Tractable AI來說,其AI+SaaS的解決方案被應用于汽車保險領域,通過一套成熟的計算機視覺算法,在經(jīng)過成千上萬張受損汽車的圖片集訓練之后,能夠精準快速的分揀車禍保單并移交到相應的流程化處理環(huán)節(jié)。
3. 能夠借助AI將傳統(tǒng)SaaS的體驗提升10倍以上。
在這里舉一個中國公司的例子,助理來也通過搭建智能化的自動應答機器人為企業(yè)提供了一個定制化場景的客服應答體驗。
「AI先行」的定義可以被詮釋為「缺少了AI的賦能,產(chǎn)品所提供的核心價值將一無是處」。
換言之,一個真正的以「AI先行」為核心戰(zhàn)略的企業(yè)應將AI納入其價值主張之中。
如果剔除掉AI技術,「AI先行」企業(yè)將運行超復雜系統(tǒng)和超負荷任務;同理,缺少了AI,「AI先行」企業(yè)將無法理解極為抽象的數(shù)據(jù)形態(tài),更談何在其上建構邏輯關系;如果沒有了AI,那與傳統(tǒng)SaaS企業(yè)和企業(yè)服務產(chǎn)品有何不同,在已經(jīng)飽和的市場何來容身之地。
03.三種獨特的AI+SaaS結合戰(zhàn)略
如前文所述,「AI先行」的SaaS企業(yè)與傳統(tǒng)SaaS企業(yè)在本質上是不同的,接下來我們將探討一下AI在企業(yè)級服務中的實際作用。
盡管AI的功能性劃分不盡其數(shù),我們不妨以一種終局的思維分類一下AI多起的作用。傳統(tǒng)的功能性劃分將AI拆解如下:
首先,智能應用的目的是為了分析商業(yè)形式,即「模式識別Pattern Recognition」;其次,便是對未來可能性的預測,即「預測分析Predictive Analytics」;然后,是針對特定限制條件的行為設定以達成結果優(yōu)化,即「行為優(yōu)化Optimization」;接著,將這套方法融合進特定的應用場景中,即「場景定制Personalization」;最后,達成在復雜數(shù)據(jù)之上建立邏輯關聯(lián),以此將這套算法推廣,即「數(shù)據(jù)商用Data-as-a-Commodity」。
我們沿著這個邏輯,將公司分別在垂直業(yè)務和平行行業(yè)兩個緯度做更細化的解讀:
模式識別
在「模式識別」這個語境中的企業(yè)往往擅于從龐大的歷史數(shù)據(jù)中找出隱藏著的關聯(lián)性,但是這樣僅僅是幫助他們理解過去、分析現(xiàn)在,卻不能預測未來。
舉例來說,Tractable公司從車禍照片的數(shù)據(jù)中判斷出肇事者、損傷程度以及其他的數(shù)據(jù)樣本。
但需要注意的是,Tractable是在利用過去的數(shù)據(jù)來判斷當下所發(fā)生的交通事故,并不能對何時何地發(fā)生交通事故做出預判。
承上,主要圍繞「模式識別」發(fā)展業(yè)務的公司在自動化決策上是有點薄弱的。
這類公司雖然詬病粗放的人工操作,但是一定不會用機器取而代之。
因為,他們認為人工智能還沒有發(fā)展足夠可靠的地步,而往往項目的沉沒成本讓公司難以在一個機器程序上試錯。
也有公司在嘗試跳出「模式識別」固有模式,這里有兩個典型的案例:
首當其沖的是CB Insights公司,其業(yè)務核心便是利用聚合和分析私有公司底層數(shù)據(jù)的能力為投資機構提供商業(yè)決策。
私有化投資其實和其他品類的投資產(chǎn)品類似,要求挖掘和分析跨行業(yè)的、極細顆粒度的行為數(shù)據(jù),這原本是人更擅長的抽象工作,而非機器。
第二個例子是利用「模式識別」在早期癌癥診斷上的應用。
雖然基于AI技術的癌癥診斷工具在許多準確性測試中都優(yōu)于人類,但是萬分之一誤診的可能性都是災難性的,所以人類常常作為機器診斷的補充,在其后充當著最后一道關卡。
預測分析
應用「預測分析」技術的這類企業(yè)很好的詮釋了一個問題 - “你從哪里來,要到哪里去?”
其實,這類企業(yè)所預測和分析的遠遠超出了簡單地匹配模型并給出可能的預測。
在這個預測的基礎上,系統(tǒng)會給出一套可供人做執(zhí)行的深度建議或直接用機器自動執(zhí)行任務。
以Zest Finance為例,這家企業(yè)利用機器學習幫助借款人可以做更快、更精準的貸款信用的評判。
另一個例子是InsideSales,這家企業(yè)通過一個基于人工智能的智能系統(tǒng)為客戶做推薦,并實現(xiàn)了15% - 30%的轉化。
大多數(shù)情況下,預測過程呈現(xiàn)了一個黑箱狀態(tài),有一些分析預測型企業(yè)往往是將最終決策丟回給人工來操作。
但是,需要指出的是,由機器來做也無非是一個典型的二選一,比如對于Zest Finance來說就是「借」與「不借」的區(qū)別。
行為優(yōu)化
專注于「行為優(yōu)化」的企業(yè)們在解決的問題是 - “如何才能在特定路徑上通過優(yōu)化自身決策來接近企業(yè)目標?”
在過去,企業(yè)只能依靠一些不盡完美的標的,諸如點擊率等來推測一個模糊的用戶動向。
但是,自從有了人工智能技術,各項業(yè)務都可以在極細分的數(shù)據(jù)集下來做分析,像是光標路徑分析、頁面停留時間等等,以此來提升利潤空間和留存率等。
舉例來說,Nextail和Focal System這兩家零售領域的商業(yè)智能平臺通過分析存貨量和跨門店的購買歷史,以此給出一個合理的進貨數(shù)量或是建議周轉調配到其他門店。
另一個例子是Amplero,它是一個主要做市場營銷的智能平臺,所做出的商業(yè)分析都是圍繞企業(yè)的績效指標來指定的,而非傳統(tǒng)的諸如點擊率等提升銷售、利潤空間和留存率等。
表面上看,「行為優(yōu)化」與「預測分析」類似,兩者都是在做面向未來的決策。
但是,不同之處就在于「行為優(yōu)化」會給出現(xiàn)在可執(zhí)行的「行為建議」;而「預測分析」,正如其名,是提出可能的「未來走向」。
這就像是一個病人走進醫(yī)院告訴醫(yī)生她感到胃疼,這種情況下,「預測分析」算法通常會基于病人的病史以及現(xiàn)在的胃部病癥來預測「未來走向」,接下來胃疼程度是會緩解還是更糟.
相較而言,「行為優(yōu)化」算法會給出一個「行為建議」來指導如何控制疼痛、判斷生存預期等等。
甚至,還是在這個例子中,「模式識別」算法也會利用相同的數(shù)據(jù)來判斷病人再次患病的概率。
場景定制
主要做「場景定制」業(yè)務的企業(yè)會利用人工智能技術營造一種私人訂制的體驗給終端用戶。
還記得第三章第一節(jié)所著的Salesforce是如何打敗Oracle和SAP的嗎?
其勝利的主要原因就是傳統(tǒng)大廠即使提供了一系列產(chǎn)品服務,但是很少能匹配云端的需求。
如今又是風水輪流轉,當Salesforce身為SaaS大廠在做幾乎所有的事情的時候,也不能做到十全十美,因為在各個細分領域都需要做到定制化和功能優(yōu)化。
根據(jù)細分需求是可以讓商業(yè)決策變得更加精準的,以MailChimp為例,這是一個價值40億美金的市場營銷自動化生意,這家企業(yè)為客戶提供郵件訂閱服務的營銷內(nèi)參,讓企業(yè)用戶們掌握客戶畫像以及點擊數(shù)據(jù)。
企業(yè)用戶可以輕易掌握到這些數(shù)據(jù),了解其客戶的所做所想,但是沒有「場景定制」的弊端就在于,這家企業(yè)的郵件訂閱內(nèi)容在同一時段給不客戶提供的是同樣的內(nèi)容。
客戶根據(jù)各自的需求去挑選合適的產(chǎn)品,但是大部分的SaaS營銷工具并不能提供場景定制化的功能。
但是有一家目前走過B輪的中國創(chuàng)業(yè)公司能提供不一樣的角度,那就是由人工智能驅動的數(shù)字內(nèi)容平臺特贊,它為企業(yè)客戶提供了千人千面的網(wǎng)頁頭版和橫幅等的設計。
在一份埃森哲于2018年發(fā)布的調查中,來自歐洲和北美的8000名受訪者中有接近91%的人認為基于個人需求定制的廣告和推薦是更受歡迎的,另有74%的人愿意提供個人數(shù)據(jù)以供運營商為他們推送定制化內(nèi)容。
對于直接那些需要與客戶直接打交道的SaaS產(chǎn)品來說,諸如CRM平臺、市場營銷平臺還有聊天機器人應用等等,擁有定制化的功能和內(nèi)容將為公司在早期建立起一定的競爭壁壘。
但是隨著人工智能商業(yè)化的普及,定制化需求正在成為必要的前提,提供定制化的服務一定是未來「AI+SaaS」的發(fā)展方向。
數(shù)據(jù)商用
當數(shù)據(jù)收集的需求和對人工智能技術的依賴在不斷增加時,便會產(chǎn)生平臺效應,一些高階的技術工具聚集在平臺之上可供各個量級的用戶調取,這就像是用戶在使用亞馬遜云服務平臺一樣方便。
谷歌便是利用其自身的人工智能和機器學習的技術儲備在向這樣一個開放的數(shù)據(jù)平臺發(fā)展,但是與其同時,這一領域已經(jīng)匯集不少玩家。
比如說,有提供計算機視覺引擎API的Clarifai公司、提供人工數(shù)據(jù)整合服務的MostlyAI公司、為企業(yè)客戶提供原始銷售數(shù)據(jù)的Tonic公司等。
這些公司甚至不必成為一家真正的、以「AI」為核心的公司,因為在他們所處的各自領域都在享受到有人工智能增值帶來的二階效應。
以Segment和Snowflake為例,這兩家公司都推出了企業(yè)客戶系統(tǒng)化管理數(shù)據(jù)的服務,但是他們都不是典型的有人工智能技術起家的公司,而且他們現(xiàn)在分別估值15億美元和39億美元。
「數(shù)據(jù)商用」型企業(yè)和此前提到的「場景定制」型企業(yè)類似,都是為典型的垂直領域用戶服務,因為他們真正在售賣的是一種企業(yè)后臺工具。
不過數(shù)據(jù)/AI商用型公司與只服務于垂直場景的AI定制化公司的規(guī)模似乎比較能看到天花板,當這個細分場景的掘金潮來臨時,似乎是一門好生意。
Domino Data Lab的發(fā)跡歷史就是很好的證明,他們向數(shù)據(jù)科學家出售軟件解決方案,以此幫助他們的客戶進行模型的快速搭建和配置。
自然地,他們也獲得了來自風險投資機構的超過8000萬美元的融資。
04.為什么AI技術不會導向贏者通吃的市場終局
此前,我們已經(jīng)基本遍歷了AI在SaaS企業(yè)中的應用前景。
而至于AI在SaaS企業(yè)中的應用弊端,這就說來話長了。
不過,似乎有一種聲音正在出現(xiàn),即是通過應用AI技術可以讓企業(yè)走向一個相對壟斷的市場地位。
因為AI行業(yè)的入門門檻是相對高的,只有資源頂端的公司可以為如此高成本的人力買單。
與此同時,AI的產(chǎn)業(yè)鏈條中,數(shù)據(jù)收集、將數(shù)據(jù)喂給AI模型、打造AI產(chǎn)品、收集更多數(shù)據(jù)來正向反饋給這個鏈條,可以看出這是一個贏者愈贏、強者愈強的局面。
表面上看,這是符合邏輯的,因為模型是依賴于更精確的數(shù)據(jù)源,只要是能獲取到精準的數(shù)據(jù),那么占據(jù)在這個身位上就一定能比后來者更有先手優(yōu)勢。
而所訓練出來的模型,反過來會讓先發(fā)企業(yè)創(chuàng)造更好的產(chǎn)品,這樣一來就擁有更多的資源去投入到獲取數(shù)據(jù)中。
知名的技術領域風險投資人、AI領域的研究專家李開復博士曾經(jīng)在其著作《AI·未來》中有總結到:
AI在某些行業(yè)內(nèi)是一定會取得贏者通吃的局面。深度學習與數(shù)據(jù)挖掘的關系造就了一個閉環(huán),并且在不斷地為優(yōu)秀的公司和產(chǎn)品賦能。 因為更充足的數(shù)據(jù)會造就更優(yōu)秀的產(chǎn)品,這也會吸引更多的用戶,而用戶會產(chǎn)生更多的數(shù)據(jù)為產(chǎn)品迭代產(chǎn)生動力。 這些數(shù)據(jù)池和其帶來的巨大利潤會為頭部的公司們吸引來頭部的開發(fā)人員,這樣一來,公司與公司之間的差距就愈發(fā)明顯。
其實,爭議主要圍繞三個最基本的假設:
1. 頭部玩家可以在很長的一段時間持續(xù)獲取到有效數(shù)據(jù)。
2. 更多的數(shù)據(jù)和更好的模型之間存在線性正相關的關聯(lián)。
3. 未來AI方面的人才仍然處于一個供應短缺的高價狀態(tài)。
顯然,這些假設并不能成立,而以下是三個駁斥點:
1. AI技術和數(shù)據(jù)的商用化正在崛起。
2. 數(shù)據(jù)和數(shù)據(jù)產(chǎn)生的價值正逐漸成負相關。
3. AI技術從業(yè)者的入門門檻正在降低。
05.AI技術和數(shù)據(jù)的商用化正在崛起
當數(shù)據(jù)收集的需求和對人工智能技術的依賴在不斷增加時,便會產(chǎn)生平臺效應,一些高階的技術工具聚集在平臺之上可供各個量級的用戶調取,這就像是用戶在使用亞馬遜云服務平臺一樣方便。
谷歌便是利用其自身的人工智能和機器學習的技術儲備在向這樣一個開放的數(shù)據(jù)平臺發(fā)展,但是與其同時,這一領域已經(jīng)匯集不少玩家。
比如說,有提供計算機視覺引擎API的Clarifai公司、提供人工數(shù)據(jù)整合服務的MostlyAI公司、為企業(yè)客戶提供原始銷售數(shù)據(jù)的Tonic公司等。
這些公司甚至不必成為一家真正的、以「AI」為核心的公司,因為在他們所處的各自領域都在享受到有人工智能增值帶來的二階效應。
以Segment和Snowflake為例,這兩家公司都推出了企業(yè)客戶系統(tǒng)化管理數(shù)據(jù)的服務,但是他們都不是典型的有人工智能技術起家的公司,而且他們現(xiàn)在分別估值15億美元和39億美元。
開復老師認為的頭部公司所具有的顯著優(yōu)勢是持續(xù)獲得有效數(shù)據(jù)的能力,但是在未來這一點很可能不復存在。
真實的數(shù)據(jù)生產(chǎn)過程是為了能測試和改進AI模型的人工數(shù)據(jù)生產(chǎn)過程。
一個實現(xiàn)的基本路徑是記錄真實世界的數(shù)據(jù)是如何分布的,之后根據(jù)分布結果來做統(tǒng)計。
問題的復雜之處在于這個過程需要足夠先進的收集方法,但是正如讀者所見,在文章開頭的板塊圖中,已經(jīng)有創(chuàng)業(yè)公司在嘗試「數(shù)據(jù)創(chuàng)造即服務,Data-Generation-as-a-Service」。
此項技術已經(jīng)被Waymo和Tesla應用在自動駕駛的模擬中。
在2019年7月,Waymo已經(jīng)完成了1千萬英里的模擬駕駛,但于此同時,真人駕駛的數(shù)據(jù)累計也才1千萬英里,此處可以看到模擬數(shù)據(jù)在執(zhí)行時的效率。
總結來說,獲取、管理、應用數(shù)據(jù)正日益變得漸變,當真實數(shù)據(jù)的生產(chǎn)方式讓相關數(shù)據(jù)變得更容易獲取時,獨角獸企業(yè)Segmet和Snowflake證明了數(shù)據(jù)管理可以更簡化10倍,Clarifai和Google將AI集成到棧也可以更簡化10倍。
06.數(shù)據(jù)和數(shù)據(jù)產(chǎn)生的價值正逐漸成負相關
風險投資基金Andreessen Horowitz的投資人Martin Casado和Peter Lauten曾經(jīng)對于數(shù)據(jù)領域的護城河效應有一個著名的論調:
誠然,這個行業(yè)是有規(guī)模效應的,但是我們觀察到數(shù)據(jù)領域的護城河并不穩(wěn)固。 因為和傳統(tǒng)行業(yè)的規(guī)?;煌?,傳統(tǒng)行業(yè)往往越早吸引到投資,相對優(yōu)勢就越發(fā)明顯。而數(shù)據(jù)領域其實有些背道而馳,獲取特異性的數(shù)據(jù)資源讓成本陡升,但是數(shù)據(jù)所累計的價值缺越來越不明顯。
有一種論調是說數(shù)據(jù)的門檻是當收集了更多的數(shù)據(jù)之后能正向促進模型的精準度。
在某些語境下這是對的,比如當AI可以很顯著地達成網(wǎng)絡效應的地方(e.g. Tiktok)。
但是更多的時候,數(shù)據(jù)收集和清洗帶來的成本往往高居不下或持續(xù)增加,而新數(shù)據(jù)的多樣性卻不能被保證。
最終數(shù)據(jù)采集的價值曲線持續(xù)放緩,甚至會有所回落。
以上圖表來自于Eloquent Labs的Aru Chaganty,顯示了客戶支持領域內(nèi)提交給智能問答機器人的一些提問。
a16z基金還表示:
在這其中,在20%的系統(tǒng)資源臨界點,系統(tǒng)一共處理了20%的客戶請求。 在這個臨界點之上,數(shù)據(jù)處理的效率曲線不但明顯增長緩慢,處理成本也隨著數(shù)據(jù)抓去和清洗量上升而陡增。 另外一個值得注意的點是,數(shù)據(jù)分布的極限是往40%這個點無限趨近,這就意味著自動應答可被執(zhí)行的內(nèi)容范圍的極限就是這個量
如果讀者熟悉機器學習的話,還可以從另一個角度來思考這個問題,那就是「主成分分析 Principal Component Analysis」,即「PCA」。
「PCA」是一種數(shù)據(jù)降維算法,將n維特征映射到k維上,這k維是全新的正交特征也被稱為主成分,是在原有n維特征的基礎上重新構造出來的k維特征。
事實上,在噪音較大的數(shù)據(jù)集中,在前幾個緯度內(nèi)捕捉到了大部分信號內(nèi)容,而之后的緯度充滿了噪音。
同樣的,數(shù)據(jù)收集在達到某一個臨界點之后,再增加的新數(shù)據(jù)邊際效應就很有限了。
換言之,數(shù)據(jù)收集呈現(xiàn)了一種明顯的冪次法則,或者說帕累托分布:在某一個臨界點之下,數(shù)據(jù)對于達成更精準的模型是很重要的,但是當數(shù)據(jù)的采集量逐漸逼急10倍或100倍時,對于模型精準度的貢獻在成本和功能上都十分有限。
AI對于有些終端是管用的,比如最終目的是提升用戶體驗和用戶價值的,而不是模型本身。
至此,再回過頭來看一下「AI贏者通吃論」的前兩個假設條件。
第一,頭部玩家可以在很長的一段時間持續(xù)獲取到有效數(shù)據(jù);第二,更多的數(shù)據(jù)和更好的模型之間存在線性正相關的關聯(lián)。本文所秉承的觀點就是「AI/數(shù)據(jù)商用化」企業(yè)會有效降低行業(yè)的入門門檻,因此第一個假設不攻自破。
第二點,也是更重要的一點,即更多的數(shù)據(jù)并不一定會造就更精確的模型。
07.AI技術從業(yè)者的入門門檻正在降低
如果「AI/數(shù)據(jù)的商用化」正在從技術層面上讓AI模型的搭建變得簡易,但是為什么這拉低AI從業(yè)者的入門門檻呢?
接下來需要用軟件工程來做一下類比。
比方說,讀者想要學習如何在iPhone上搭建一個移動端應用,在早期會怎么做呢?
很大可能是買來一本厚重的編程書,或是雇傭一個助教,又或者是在網(wǎng)上鉆研晦澀難懂的文章。
在過去的十年中,這一局面獲得了很大的改觀。
如今,根本用不上翻閱難啃的開發(fā)教程或是上昂貴的編程課,在網(wǎng)絡上已經(jīng)擁有了龐大的、已用的公開教學資源,而且大部分還是免費的。
比如,在StackOverflow上,無需依靠閱讀文檔來艱難地找出Bug,論壇里的帖子能回答幾乎所有新手會犯的錯誤。
但是不僅如此,AWS和Heroku提供的SaaS、PaaS和IaaS的解決方案能夠顯著地帶來簡單易用的機會去視覺化、檢測、運維和發(fā)布任何客戶端應用產(chǎn)品。
讀者也許會反駁到,這個論述只看到了產(chǎn)業(yè)中下游的提升,在上游的精英級別從業(yè)者們并不會因此改變太多。
在此,本文的立場應該是與這種反駁完全對立的。
當一個行業(yè)的信息壁壘降低,有機會讓足夠多的人持續(xù)進入這個行業(yè)時,處于頂層的精英人數(shù)一定有機會同比增加。
不過,在這里還是引用一下行業(yè)專家李開復自己的話。
他的這段文字闡述了他認為的為什么科技人才可能造就AI領域成為領頭行業(yè)的原因:
頂尖的公司把充足的數(shù)據(jù)量與資本結合起來,就能吸引到頂尖的人工智能人才,進一步擴大產(chǎn)業(yè)領先者與落后者之間的差距。
同意。我們繼續(xù)來看他在書中是如何比較研究領域和應用領域的:
許多人之所以誤認為美國在人工智能領域具有重大優(yōu)勢,主要是因為他們還停留在我們生活在「發(fā)明的年代」的印象中: 在發(fā)明的年代,人工智能的頂尖研究人員不斷打破舊有典范,最終破解存在已久的謎題,媒體不斷報道人工智能的最新成就,更是助長了這種印象。 例如在某些癌癥的診斷上,人工智能做得比醫(yī)生更好;在德州撲克的人機大賽中,人工智能擊敗了人類冠軍;不用人為干預,人工智能就自己學會并精通新技能等。 媒體如此關注報道人工智能的每一項新成就,也難怪一般觀察者甚至是專業(yè)分析師會認為人工智能研究將不斷獲得突破性的新發(fā)現(xiàn)。
他認為,這種現(xiàn)象有誤導作用,因為在這些「新里程碑」中,很多成就其實只是把過去10年的技術性突破應用到 新問題上。
其中主要是深度學習,但還有一些互補的技術,例如強化學習(reinforcement learning)和遷移學習(transfer learning)。 研究人員做這些事,需要卓越的技能和深度的專業(yè)知識,不僅要有能力思考、撰寫復雜的數(shù)學算法,還要能夠處理巨量數(shù)據(jù),針對不同問題調整人工神經(jīng)網(wǎng)絡。 這往往需要博士級的專業(yè)知識技能,但這些發(fā)展都不過是依賴著深度學習這項科技的大發(fā)展所做的漸進式改善和優(yōu)化。 這些漸進式的改善和優(yōu)化,其實是把深度學習在模式識別與預測上的強大能力應用到種種不同的領域上,如疾病診斷、核發(fā)保單、開車、中英翻譯等。
這其中理由也很簡單:
但這些改善和優(yōu)化并不代表我們正在朝著「通用人工智能」的方向快速前進,或是出現(xiàn)了類似深度學習的重大技術性突破。簡單來說,人工智能正式進入了實干的年代,想要利用這個時期賺錢的公司,需要擁有有遠見和才干的創(chuàng)業(yè)者、工程師和產(chǎn)品經(jīng)理。
他還補充到:
想要訓練處成功的深度學習算法,需要運算力、工程能力以及大量的數(shù)據(jù)。在未來這三點中最重要的是數(shù)據(jù)量,因為工程能力達到一定水平后,就會開始出現(xiàn)收益遞減,這時數(shù)據(jù)量才能決定一切。只要數(shù)據(jù)量足夠大,由優(yōu)良但非頂尖的工程師設計出的深度學習算法,也有機會超過全球頂尖專家設計的算法。
行業(yè)精英們肯定可以幫助頭部企業(yè)鞏固住他們的地位。
但是,我們是處于一個增量的時代,是不是普通工程師也能完成實操,因為畢竟數(shù)據(jù)為王?
答案是否定的,不,這并不能說得通。
持續(xù)吸引優(yōu)秀的人才和保持人才的運轉是創(chuàng)造任何壁壘的必要條件,但是開復博士自己也坦言,這在AI并不是至關重要的。
雖然AI的核心人才還是相對稀缺的,但是需要指出的是,行業(yè)的入門門檻正在降低。
此外,市場的流動性給越來越多的從業(yè)者提供了機會,類似于1997年和2014年計算機從業(yè)者數(shù)量翻番。
中國發(fā)布了將要在2030年引領全球AI市場的國家戰(zhàn)略,因此2019年已有超過400所高校開展并設立了AI、大數(shù)據(jù)、機器人相關的專項教育。
這樣的宏觀刺激會顯著提升AI從業(yè)者的基數(shù),而且技術工具的使用壁壘也在下降,所以AI從業(yè)者的總體數(shù)量會比預計樂觀很多。
08.總結
來到最后,回到本文所給出的三個最終結論:
AI技術和數(shù)據(jù)收集管理正在被大幅度簡化和商用化;
數(shù)據(jù)和數(shù)據(jù)產(chǎn)生的價值正逐漸成負相關;
AI技術從業(yè)者的入門門檻和使用工具的學習壁壘正在降低,人才供應會逐步提升且成本會降低。
我們可以得出一個結論,AI技術并不能確保運用它的企業(yè)走向贏者同者通吃的局面。在一個行業(yè)中的絕對優(yōu)勢是建立在能夠同時在多個緯度處于領先:人才儲備、數(shù)據(jù)廣度、數(shù)據(jù)深度、產(chǎn)品體驗還有資本儲備。
無數(shù)的例子證明,曾經(jīng)的領先者會因為相同的原因而落沒。
首先,他們獲得資金;然后,安于舒適區(qū);最后,他們死去。
AI是某些終端的解決辦法之一,但是不要讓這個技術本身蒙蔽了企業(yè)未來的發(fā)展道路。保持多條路徑并行,持續(xù)饑渴、不斷迭代,去尋找未來新的增長點。