GPT-5紅隊測試郵件曝光,最早6月發(fā)布?網(wǎng)友在線逼問Altman,數(shù)十億美元超算26年啟動

作者: 智通轉(zhuǎn)載 2024-04-05 15:08:39
有傳聞?wù)f,GPT-5將于今年6月發(fā)布。

今天,陸續(xù)有網(wǎng)友曬出OpenAI發(fā)給自己的紅隊邀請郵件,看起來,GPT-5已經(jīng)進入紅隊測試了?網(wǎng)友們紛紛展開暢想,對Sam Altman在線「催更」。另有外媒曝出,OpenAI的一個mini版數(shù)十億「星際之門」,最快2026年就會啟動。

GPT-5已經(jīng)開始紅隊測試了?

就在這幾天,網(wǎng)上已經(jīng)有多人曬出了OpenAI發(fā)給自己的紅隊錄取通知書。

圖片

此前有傳聞?wù)f,GPT-5將于今年6月發(fā)布??雌饋恚t隊測試與模型發(fā)布的時間線十分吻合。

圖片

有網(wǎng)友直接曬出了自己收到OpenAI郵件邀請的截圖。

圖片
圖片

這倒是和此前Sam Altman的說法對上了。

圖片

據(jù)悉,GPT-5早已為大家準(zhǔn)備好,只是發(fā)布風(fēng)險太大了,所以還得往后延。

圖片

三個月就能用了?

不過還有人表示,先別急,這些人只是收到了紅隊邀請測試而已,并沒有提及具體模型。

圖片

有可能是他們填了如下的申請信息之后,才收到了郵件。

圖片

安全測試對于新版GPT如此重要的原因,一方面是ChatGPT已經(jīng)有了非常大的用戶數(shù),如果在安全性上出問題,OpenAI可能也會面對像谷歌一樣的輿論壓力。

另一方面,To B業(yè)務(wù)是OpenAI的主要收入來源,定制化的ChatGPT能大大增強各個企業(yè)的業(yè)務(wù)能力和效率。

有人表示,紅隊測試會持續(xù)90-120天。

圖片

如果此次紅隊測試就是針對GPT-5的話,那么三個月內(nèi),我們應(yīng)該就能用上它了!

圖片

而在坊間,這一傳聞讓群眾們沸騰了!他們早已按捺不住對于GPT-5的猜測和暢想。

比如,GPT-5的上下文窗口會達到多少?

圖片

目前,Gemini 1.5 Pro是1M,Claude 3是200K,GPT-4是128K,不知道GPT-5會突破怎樣的驚人紀(jì)錄。

圖片

大家紛紛列出自己對于GPT-5的愿望清單——

比如10Mtoken的上下文窗口,閃電般的快速干擾,長期戰(zhàn)略規(guī)劃和推理,執(zhí)行復(fù)雜開放式操作的能力,GUI / API導(dǎo)航,長期情境記憶,始終處于隱形狀態(tài)的RAG,多模態(tài)等等。

圖片

有人猜,或許GPT-5會和Claude 3一樣,提供幾種不同的型號。

圖片

有人總結(jié)了目前關(guān)于GPT-5和紅隊的最新謠言和傳聞,大致要點如下——

-OpenAI預(yù)計于今年夏天發(fā)布GPT-5,部分企業(yè)客戶已收到增強功能的演示;

-GPT-5「實質(zhì)性更好」,相比GPT-4進行了重大升級。它需要更多的訓(xùn)練數(shù)據(jù);

-GPT-5的潛在功能包括生成更逼真的文本、執(zhí)行翻譯和創(chuàng)意寫作等復(fù)雜任務(wù)、處理視頻輸入以及改進推理;

-Sam Altman表示,GPT-5仍在訓(xùn)練中,沒有確切的發(fā)布日期,廣泛的安全測試可能還需數(shù)月。然而,他確認OpenAI今年將「發(fā)布一個驚人的新模型」。

圖片

在3月29日,獲得內(nèi)部信息的Runway CEO兼AI投資人Siqi Chen就稱,GPT-5已經(jīng)在推理方面取得了意想不到的階躍函數(shù)增益。

它甚至可以靠自己就獨立地弄清楚,如何讓ChatGPT不用每隔一天就登錄一次。

圖片

Ilya看到的東西,也許就是這個?

圖片

這是不是就意味著,在OpenAI內(nèi)部,已經(jīng)實現(xiàn)了AGI?!如果是真的,這也太驚人了。

圖片

「我不相信,只有AGI才能實現(xiàn)這樣的能力」。

圖片

總之,網(wǎng)友們紛稱,根據(jù)泄露的待辦清單顯示,OpenAI的下一項任務(wù),就是發(fā)布GPT-5了!

圖片

大家紛紛呼喚Altman,是時間放出GPT-5了,別太吹毛求疵了,我們要求不高。

圖片

紅隊測試上陣,確保GPT-5安全

早在23年9月,OpenAI就曾官宣招募一批紅隊測試人員(Red Teaming Network),邀請不同領(lǐng)域?qū)<以u估模型。

圖片

不同領(lǐng)域?qū)<医M成的紅隊去尋找系統(tǒng)漏洞,成為確保下一代模型GPT-5安全的關(guān)鍵。

那么,紅隊測試人員一般都需要做哪些工作?

AI紅隊攻擊的類型主要包括,提示攻擊、數(shù)據(jù)中毒、后門攻擊、對抗性示例、數(shù)據(jù)提取等等。

「提示攻擊」是指在控制LLM的提示中注入惡意指令,從而導(dǎo)致大模型執(zhí)行非預(yù)期的操作。

比如,今年早些時候,一名大學(xué)生利用提示獲取了一家大公司的機密信息,包括開發(fā)的AI項目的代碼名稱,以及一些本不應(yīng)該暴露的元數(shù)據(jù)。

而「提示攻擊」最大的挑戰(zhàn)是,找到威脅行為者尚未發(fā)現(xiàn)、利用的新提示或提示集。

圖片

紅隊需要測試的另一種主要攻擊是「數(shù)據(jù)中毒」。

在數(shù)據(jù)中毒的情況下,威脅者會試圖篡改LLM接受訓(xùn)練的數(shù)據(jù),從而產(chǎn)生新的偏差、漏洞供他人攻擊以及破壞數(shù)據(jù)的后門。

「數(shù)據(jù)中毒」會對LLM提供的結(jié)果產(chǎn)生嚴重影響,因為當(dāng)LLM在中毒數(shù)據(jù)上接受訓(xùn)練時,它們會根據(jù)這些信息學(xué)習(xí)關(guān)聯(lián)模式。

比如,關(guān)于某個品牌、政治人物的誤導(dǎo)性,或不準(zhǔn)確信息,進而左右人們的決策。

還有一種情況是,受到污染的數(shù)據(jù)訓(xùn)練后,模型提供了關(guān)于如何治療常規(guī)疾病或病痛的不準(zhǔn)確醫(yī)療信息,進而導(dǎo)致更嚴重的后果。

因此,紅隊人員需要模擬一系列數(shù)據(jù)中毒攻擊,以發(fā)現(xiàn)LLM訓(xùn)練和部署流程中的任何漏洞。

除此以外,還有多元的攻擊方式,邀請專家也是OpenAI確保GPT-5能夠完成安全測試。

GPT-5,真的不遠了

正如網(wǎng)友所言,紅隊測試開啟,意味著GPT-5真的不遠了。

前段時間,Altman在博客采訪中曾提到,「我們今年會發(fā)布一款令人驚艷的新模型,但不知道會叫什么名字」。

圖片

盡管如此,全網(wǎng)都一致地將OpenAI發(fā)布的下一代模型稱為GPT-5,并有傳言稱代號為Arrakis的項目,就是GPT-5的原型。

根據(jù)FeltSteam的預(yù)測,這個Arrakis的多模態(tài)模型,性能遠超GPT-4,非常接近AGI。

圖片

另外,模型參數(shù)據(jù)稱有125萬億,大約是GPT-4的100倍,并在2022年10月完成訓(xùn)練。

網(wǎng)友還總結(jié)了以往GPT系列模型發(fā)布時間表:GPT-1在2018年6月誕生,GPT-2在2019年2月,GPT-3在2020年6月,GPT-3.5在2022年12月,GPT-4僅在三個月后于2023年3月發(fā)布。

關(guān)于GPT-5的發(fā)布時間,可能在今年夏天就問世。

最近,網(wǎng)上流傳的一張圖上,顯示了Y Combinator推出了GPT-5早期準(zhǔn)入候補名單。

圖片

網(wǎng)友發(fā)起疑問,我們都清楚奧特曼和YC的關(guān)系不同尋常。這是否意味著他們可以在模型或信息公開之前獲得訪問權(quán)限?

圖片

而上月也有爆料稱,已有用戶對GPT-5上手體驗過了,性能驚人。

圖片

外媒透露,一些企業(yè)用戶已經(jīng)體驗到了最新版的ChatGPT。

「它真的很棒,有了質(zhì)的飛躍,」一位最近見識到GPT-5效果的CEO表示。

OpenAI展示了,新模型是如何根據(jù)這位CEO公司的特殊需求和數(shù)據(jù)進行工作的。

他還提到,OpenAI還暗示模型還有其他一些未公開的功能,包括調(diào)用OpenAI正在開發(fā)的AI智能體來自主完成任務(wù)的能力。

GPT-5,一定是正確路線嗎?

不過,在萬眾矚目期待GPT-5面世的呼聲中,也有一些不一樣的聲音。

比如有人覺得,GPT-5無法駕駛你的汽車,GPT-5無法解決核聚變問題,GPT-5無法治愈癌癥......

圖片

另外,我們對模型的追求,非得是更智能嗎?

更便宜、更快、更不費水電的模型,可能比單獨的GPT-5更有革命性意義。

圖片

有人同意這個觀點,表示現(xiàn)在實在有太多人(尤其是開發(fā)者)過于癡迷GPT-5了。

其實完全沒必要這么狂熱,使用當(dāng)前的模型,就可以已經(jīng)完成和構(gòu)建太多東西。

只需正確選擇利基市場,構(gòu)建滿足該利基市場需求的AI產(chǎn)品,讓用戶可以直觀地訪問AI,專注于更好的UI/UX即可。

公式很簡單。我們真的有必要一味追求力大磚飛嗎?

圖片

很多人表示贊同,表示甚至用GPT-3.5就可以造出非常有價值的東西。

問題不在于模型多先進,而在于怎樣滿足利基市場的需求。

圖片

智算中心,先從小的建起

而3月底曝出的用于訓(xùn)練GPT-6的千億美元「星際之門」超算,今天又被外媒挖出了更多新的內(nèi)容。

上周五,外媒The Information曝出了一個驚人消息:OpenAI和微軟正在制定一項雄心勃勃的數(shù)據(jù)中心項目,預(yù)計耗資1000億美元。

圖片

此消息一曝出,AI和云計算行業(yè)人士的提問,像雪片一樣襲來——

數(shù)據(jù)中心具體位于美國的哪個地區(qū)?

會使用什么芯片?

運行數(shù)據(jù)中心所需的驚人巨量電力,從何而來?

……

為此,The Information又挖出了更多料,具體細節(jié)如下。

首先,之前的消息說是星際之門最早在2028年啟動,而最新消息顯示,最快在2026年,就會在威斯康星州啟動一個功率較小的數(shù)據(jù)中心。

它的價值當(dāng)然不到千億美元,但估計仍會耗資數(shù)十億。

其他細節(jié)如下——

用英偉達芯片,但不用英偉達網(wǎng)線

首先,這次數(shù)據(jù)中心的多數(shù)服務(wù)器機架,當(dāng)然主要還是用的英偉達芯片。

不過有趣的是,將各個AI芯片服務(wù)器連接起來的網(wǎng)線,則并不會采用英偉達的產(chǎn)品。

據(jù)悉,OpenAI已經(jīng)告知微軟,自己不想再使用英偉達的InfiniBand網(wǎng)絡(luò)設(shè)備。相反,它可能會使用基于以太網(wǎng)的電纜。

圖片

OpenAI「拋棄」英偉達InfiniBand,原因有二。

其一,InfiniBand太貴了!

它雖然能提供更好的性能,但它也比以太網(wǎng)電纜更昂貴。

其二,OpenAI不想讓AI開發(fā)人員過于依賴英偉達。

要知道,目前OpenAI是全球最大的英偉達服務(wù)器集群消費者之一。并且,InifiniBand設(shè)備的性能,有時也并不可靠。

所以,英偉達會失去一大筆收入嗎?

不,你想多了。

節(jié)省下來數(shù)十億美元,OpenAI會用來購買更多的英偉達芯片,英偉達依然賺翻了。

看來,OpenAI可以接受網(wǎng)絡(luò)性能的降低,但對于更強算力的渴望,仍然是不變的。

InfiniBand與以太網(wǎng)之爭,已成熱門話題

其實,在最近硅谷的會議和晚宴上,InfiniBand和以太網(wǎng)的pk,一直是個大熱門話題。

所有云提供商和數(shù)據(jù)中心運營商都在預(yù)測:以太網(wǎng)是否會趕超InfiniBand?

絕大多數(shù)人給出的答案是肯定的。

而OpenAI放棄后者的舉動,更是支持了這個論點。

英偉達的電纜到底有多貴?

這個數(shù)字說出來,十分驚人——

英偉達的網(wǎng)絡(luò)電纜銷售額,已經(jīng)超過了賣GPU的錢!

英偉達首席財務(wù)官Collete Kress今年2月透露了這一驚人數(shù)據(jù):新興的電纜業(yè)務(wù)的年化收入,已經(jīng)超過了130億美元。

也就是說,它在12月創(chuàng)造了約11億美元的收入,約占英偉達當(dāng)月總收入的15%。

網(wǎng)絡(luò)電纜賣這么貴,難怪OpenAI會選擇不玩了。

本文選自微信公眾號:新智元。智通財經(jīng)編輯:張計偉。

智通聲明:本內(nèi)容為作者獨立觀點,不代表智通財經(jīng)立場。未經(jīng)允許不得轉(zhuǎn)載,文中內(nèi)容僅供參考,不作為實際操作建議,交易風(fēng)險自擔(dān)。更多最新最全港美股資訊,請點擊下載智通財經(jīng)App
分享
微信
分享
QQ
分享
微博
收藏