OpenAI公布最新版本GPT-4 稱其能在SAT考試中擊敗90%人類

作者：智通財(cái)經(jīng) 許然 2023-03-15 06:00:00

OpenAI公布了其主要大型語(yǔ)言模型GPT的最新版本GPT-4，并表示模型在許多專業(yè)測(cè)試中表現(xiàn)出“人類水平的性能”

智通財(cái)經(jīng)APP獲悉，周二，OpenAI公布了其主要大型語(yǔ)言模型GPT的最新版本GPT-4，并表示模型在許多專業(yè)測(cè)試中表現(xiàn)出“人類水平的性能”。

ChatGPT-4比以前的版本“更大”，這意味著它已經(jīng)在更多的數(shù)據(jù)上進(jìn)行了訓(xùn)練，它的運(yùn)行成本也更高。

目前，此領(lǐng)域的許多研究人員認(rèn)為，人工智能領(lǐng)域的許多最新進(jìn)展，都來(lái)自于在數(shù)千臺(tái)超級(jí)計(jì)算機(jī)上運(yùn)行越來(lái)越大的模型，這些模型的訓(xùn)練過(guò)程可能耗資數(shù)千萬(wàn)美元。GPT-4是“擴(kuò)大規(guī)?！币垣@得更好結(jié)果的訓(xùn)練方法的一個(gè)例子。

OpenAI表示，它使用的是微軟(MSFT.US)Azure訓(xùn)練模型，微軟已經(jīng)向這家初創(chuàng)公司投資了數(shù)十億美元。OpenAI沒(méi)有公布具體模型大小的細(xì)節(jié)，也沒(méi)有公布用來(lái)訓(xùn)練模型的硬件，理由是“競(jìng)爭(zhēng)情況”。

OpenAI的GPT大型語(yǔ)言模型為許多人工智能演示提供了支持，包括必應(yīng)的AI聊天和ChatGPT，這些演示在過(guò)去六個(gè)月里讓科技行業(yè)的人們驚嘆不已。最新版本是新技術(shù)的預(yù)覽，可能會(huì)在未來(lái)幾周內(nèi)開(kāi)始整合到聊天機(jī)器人等消費(fèi)產(chǎn)品中。微軟周二表示，必應(yīng)的人工智能聊天機(jī)器人將使用GPT-4。

OpenAI表示，新模型將產(chǎn)生更少的錯(cuò)誤答案，更少地偏離話題，更少地談?wù)摻稍掝}，甚至在許多標(biāo)準(zhǔn)化測(cè)試中比人類表現(xiàn)得更好。

OpenAI稱，GPT-4在模擬律師資格考試中排名第90，在SAT閱讀考試中排名第93，在SAT數(shù)學(xué)考試中排名第89。

然而，OpenAI警告說(shuō)，新軟件還不完美，在許多情況下，它的能力不如人類。公司表示，它仍然存在“幻覺(jué)”或自己編造的主要問(wèn)題，而且在事實(shí)問(wèn)題上并不可靠。它仍然傾向于在錯(cuò)誤的時(shí)候堅(jiān)持自己是正確的。

公司在一篇博客文章中表示：“GPT-4仍有許多已知的局限性，我們正在努力解決，比如社會(huì)偏見(jiàn)、幻覺(jué)和對(duì)抗性提示。在閑談中中，GPT-3.5和GPT-4之間的區(qū)別可能很微妙。當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時(shí)，差異就顯現(xiàn)出來(lái)了——GPT-4比GPT-3.5更可靠、更有創(chuàng)造力，能夠處理更細(xì)致的指令。”

新模型將提供給ChatGPT的付費(fèi)用戶，也將作為API的一部分提供，允許程序員將AI集成到他們的應(yīng)用程序中。OpenAI將對(duì)750字左右的指令信息收費(fèi)3美分，對(duì)750字左右的響應(yīng)信息收費(fèi)6美分。

智通聲明：本內(nèi)容為作者獨(dú)立觀點(diǎn)，不代表智通財(cái)經(jīng)立場(chǎng)。未經(jīng)允許不得轉(zhuǎn)載，文中內(nèi)容僅供參考，不作為實(shí)際操作建議，交易風(fēng)險(xiǎn)自擔(dān)。更多最新最全港美股資訊，請(qǐng)點(diǎn)擊下載智通財(cái)經(jīng)App

2023-03-08 14:14 張計(jì)偉

如何看待OpenAI開(kāi)放ChatGPT商用API？中信證券：有望推動(dòng)更多AI產(chǎn)品在中短期的商業(yè)化落地

2023-03-06 09:57 張計(jì)偉

OpenAI向付費(fèi)企業(yè)提供ChatGPT工具 Shopify(SHOP.US)、Snap(SNAP.US)等公司已是客戶

2023-03-02 06:00 許然

ChatGPT制造商OpenAI稱正在努力減少偏見(jiàn)和不良行為

2023-02-17 08:16 李均柃

微軟(MSFT.US)公布AI技術(shù)嵌入必應(yīng)后的初步反饋 71%測(cè)試者給予認(rèn)可

2023-02-16 20:29 宏林