AI時(shí)代數(shù)據(jù)就是金山銀山! 富達(dá)等機(jī)構(gòu)的專有數(shù)據(jù)變得無(wú)比搶手

作者：智通財(cái)經(jīng) 盧梭 2023-06-08 15:25:00

創(chuàng)建專業(yè)人工智能服務(wù)所需的專有數(shù)據(jù)開(kāi)始變得非常搶手;一些專注于人工智能系統(tǒng)的科技公司垂涎富達(dá)長(zhǎng)達(dá)數(shù)十年的金融數(shù)據(jù)庫(kù)。

隨著世界各地的科技公司競(jìng)相創(chuàng)建類似ChatGPT的生成式人工智能服務(wù)，構(gòu)建它們所需的“基礎(chǔ)原材料”——數(shù)據(jù)，突然間變得前所未有地?fù)屖帧?/p>

智通財(cái)經(jīng)APP了解到，富達(dá)投資(Fidelity Investments)就是這一趨勢(shì)的最新例子:這家全球財(cái)富管理巨頭的首席信息官M(fèi)ihir Shah近日在接受媒體采訪時(shí)表示，科技初創(chuàng)企業(yè)和一些企業(yè)集團(tuán)都在向這家財(cái)富管理巨頭示好，希望獲得其金融服務(wù)數(shù)據(jù)庫(kù)。

對(duì)于那些尋求為金融服務(wù)行業(yè)構(gòu)建生成式人工智能系統(tǒng)的科技公司來(lái)說(shuō)，富達(dá)數(shù)十年的線上交易記錄、客戶通話記錄以及面對(duì)面的客戶互動(dòng)報(bào)告將是一個(gè)巨大的寶藏。據(jù)悉，富達(dá)擁有大約8PB級(jí)別的數(shù)據(jù)——相當(dāng)于數(shù)萬(wàn)億頁(yè)的印刷文本。

Mihir Shah表示，這家美國(guó)投資管理巨頭管理著超過(guò)11萬(wàn)億美元的資金，擁有數(shù)千萬(wàn)級(jí)別的客戶，但該機(jī)構(gòu)尚未與任何一家追求者接洽。Shah正在領(lǐng)導(dǎo)一項(xiàng)從富達(dá)數(shù)據(jù)中獲取價(jià)值的工作，他表示，該機(jī)構(gòu)已經(jīng)在考慮建立自己的人工智能模型，盡管還沒(méi)有正式?jīng)Q定是否走這條路。他表示，該公司共享的任何數(shù)據(jù)都將被匿名化，并按照最佳安全級(jí)別措施去除個(gè)人信息。

ChatGPT等生成式AI提供的堪稱全能的服務(wù)基于大語(yǔ)言模型或人工智能系統(tǒng)，這些模型或系統(tǒng)搜集和分析來(lái)自互聯(lián)網(wǎng)和其他來(lái)源的大量數(shù)據(jù)以及文字，以最終確定如何生成聽(tīng)起來(lái)像人類寫(xiě)出的文本。隨著企業(yè)紛紛尋求降低成本、更好地服務(wù)客戶的方法，這項(xiàng)技術(shù)在全球范圍內(nèi)的各行各業(yè)引發(fā)了興奮情緒——從摩根大通到摩根士丹利等華爾街大型商業(yè)銀行都走在了AI科技前列，紛紛將生成式AI用于輔助業(yè)務(wù)。

ChatGPT的創(chuàng)造者OpenAI、谷歌母公司Alphabet Inc.和Meta Platforms Inc.都是該領(lǐng)域的技術(shù)領(lǐng)導(dǎo)者，其中OpenAI得到了微軟(Microsoft Corp.)的支持。他們大多使用幾乎相同的公開(kāi)數(shù)據(jù)來(lái)訓(xùn)練他們的AI系統(tǒng)，最終以類似人類的方式理解文本，以及生成人類通用的文本或代碼。

專屬于金融服務(wù)行業(yè)的LLM模型離問(wèn)世不遠(yuǎn)了

但是，像富達(dá)所擁有的超大容量專項(xiàng)數(shù)據(jù)將使他們的人工智能服務(wù)在競(jìng)爭(zhēng)中脫穎而出，Shah表示，他29年前開(kāi)始在富達(dá)工作，并監(jiān)督其網(wǎng)站的建設(shè)，這是一家大型金融服務(wù)公司的第一個(gè)網(wǎng)站。他現(xiàn)在正在指導(dǎo)富達(dá)全公司范圍內(nèi)的云數(shù)據(jù)倉(cāng)庫(kù)的全面創(chuàng)建，以更好地利用這些數(shù)據(jù)。

Shah通過(guò)視頻表示:“區(qū)別在于將第一方數(shù)據(jù)與公共數(shù)據(jù)結(jié)合起來(lái)，為金融服務(wù)行業(yè)建立一個(gè)垂直的大語(yǔ)言模型?！薄拔覀円呀?jīng)看到，在科學(xué)研究和醫(yī)療保健行業(yè)出現(xiàn)了垂直的大語(yǔ)言模型。”

一般來(lái)說(shuō)，一個(gè)大語(yǔ)言模型的價(jià)值很大程度上取決于它所訓(xùn)練的數(shù)據(jù)的數(shù)量和質(zhì)量。人工智能系統(tǒng)需要大量的文本、圖像、聲音和其他信息來(lái)學(xué)習(xí)人類的模式和人類世界的關(guān)系，從而可以基于它們生成內(nèi)容。

開(kāi)發(fā)大語(yǔ)言模型的過(guò)程是比較復(fù)雜且技術(shù)極為密集。通常意義上的常用步驟包括：數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、模型選擇、訓(xùn)練模型、微調(diào)模型、測(cè)試模型以及部署模型?？傊?，大語(yǔ)言模型的開(kāi)發(fā)需要開(kāi)發(fā)者具備一定的機(jī)器學(xué)習(xí)/深度學(xué)習(xí)、自然語(yǔ)言處理等相關(guān)技能和經(jīng)驗(yàn)。同時(shí)，需要有大量的數(shù)據(jù)和計(jì)算資源作為支撐，才能開(kāi)發(fā)出高質(zhì)量、高效的模型。

Shah表示，富達(dá)的數(shù)據(jù)被認(rèn)為非常有吸引力，以至于一些追求者提議為該公司免費(fèi)建立一個(gè)人工智能系統(tǒng)，以換取合作。他表示，富達(dá)的很多數(shù)據(jù)都是相對(duì)最新的，是根據(jù)最新的合規(guī)要求在過(guò)去7年里所保存下來(lái)。據(jù)悉，富達(dá)擁有超過(guò)4,200萬(wàn)客戶，并且為數(shù)萬(wàn)家企業(yè)管理退休計(jì)劃和其他福利項(xiàng)目。

Shah還表示，在決定如何部署數(shù)據(jù)時(shí)，富達(dá)需要考慮到人工智能系統(tǒng)面臨的一些挑戰(zhàn)，如可靠性、信息偏見(jiàn)以及如何處理個(gè)人身份信息。他表示，與此同時(shí)，該公司正在采取措施加強(qiáng)其安全基礎(chǔ)設(shè)施，并進(jìn)一步限制具體哪些名單可以訪問(wèn)這些數(shù)據(jù)。

Shah還強(qiáng)調(diào):“我們對(duì)這些新工具非常謹(jǐn)慎。”“對(duì)于生成式人工智能，你不能完全相信其結(jié)果?！?/p>

邁入AI時(shí)代，數(shù)據(jù)就是“金山銀山”

隨著OpenAI推出的ChatGPT和谷歌推出的Bard等以消費(fèi)者應(yīng)用為中心的生成式人工智能(AI)工具接連問(wèn)世，全球開(kāi)始邁入AI時(shí)代，現(xiàn)代化的人工智能程序開(kāi)始使用大語(yǔ)言模型(LLM模型)，在海量的數(shù)據(jù)基礎(chǔ)上訓(xùn)練人工智能系統(tǒng)，其中的數(shù)據(jù)內(nèi)容包括富達(dá)龐大的金融數(shù)據(jù)庫(kù)，推特和Reddit等網(wǎng)站上用戶生成的帖子等等。因此，如今掌握大量的數(shù)據(jù)資源，意味著掌握開(kāi)發(fā)LLM模型的“原材料”。

隨著全球開(kāi)始邁入AI時(shí)代，推特和Reddit顯然已嗅到數(shù)據(jù)庫(kù)帶來(lái)的巨大商機(jī)，已經(jīng)開(kāi)始收費(fèi)，只有付費(fèi)的客戶才有資格訪問(wèn)他們的數(shù)據(jù)內(nèi)容。

在6月初，據(jù)媒體報(bào)道，有著“美版貼吧”之稱的社交媒體和新聞聚合網(wǎng)站Reddit要求開(kāi)發(fā)者支付數(shù)千美元才能直接訪問(wèn)該公司的數(shù)據(jù)和內(nèi)容，此舉可能有助于該公司構(gòu)建更多元化的營(yíng)收來(lái)源。根據(jù)一款名為Apollo的流行第三方應(yīng)用程序的開(kāi)發(fā)者披露的帖子，該公司要求開(kāi)發(fā)者每5000萬(wàn)次請(qǐng)求支付1.2萬(wàn)美元。

特斯拉CEO埃隆·馬斯克私有化的推特于在2月份結(jié)束了免費(fèi)的API系統(tǒng)，并引入了付費(fèi)使用系統(tǒng)。推特在3月宣布對(duì)5000萬(wàn)次請(qǐng)求收取4.2萬(wàn)美元時(shí)，用戶和開(kāi)發(fā)者都感到憤怒。推特提供了三種套餐，其中最便宜的為：每月支付4.2萬(wàn)美元可以訪問(wèn)5000萬(wàn)條推文。套餐等級(jí)越高，研究人員或企業(yè)獲得的推文數(shù)量就越多：每月支付12.5萬(wàn)美元可以獲得1億條、每個(gè)月支付21萬(wàn)美元可以獲得2億條;每年最高等級(jí)收費(fèi)高達(dá)250萬(wàn)美元。

智通聲明：本內(nèi)容為作者獨(dú)立觀點(diǎn)，不代表智通財(cái)經(jīng)立場(chǎng)。未經(jīng)允許不得轉(zhuǎn)載，文中內(nèi)容僅供參考，不作為實(shí)際操作建議，交易風(fēng)險(xiǎn)自擔(dān)。更多最新最全港美股資訊，請(qǐng)點(diǎn)擊下載智通財(cái)經(jīng)App

2023-06-08 09:26 李佛

中金：持續(xù)看多AI 并看好AI在教育領(lǐng)域賦能

2023-06-08 08:29 劉家殷

AI前景廣闊對(duì)沖大神德魯肯米勒計(jì)劃持有英偉達(dá)(NVDA.US)數(shù)年

2023-06-08 07:40 馬火敏

TechInsights：預(yù)計(jì)2023年全球智能手機(jī)出貨量同比下降2.8% 繼續(xù)處于收縮階段

2023-06-07 14:21 陳雯芳

券商晨會(huì)精華 | AI應(yīng)用被帶動(dòng) 傳媒板塊再度回歸估值低位

2023-06-07 08:48 智通轉(zhuǎn)載