OpenAI公布最新版本GPT-4 稱其能在SAT考試中擊敗90%人類

OpenAI公布了其主要大型語(yǔ)言模型GPT的最新版本GPT-4,并表示模型在許多專業(yè)測(cè)試中表現(xiàn)出“人類水平的性能”

智通財(cái)經(jīng)APP獲悉,周二,OpenAI公布了其主要大型語(yǔ)言模型GPT的最新版本GPT-4,并表示模型在許多專業(yè)測(cè)試中表現(xiàn)出“人類水平的性能”。

ChatGPT-4比以前的版本“更大”,這意味著它已經(jīng)在更多的數(shù)據(jù)上進(jìn)行了訓(xùn)練,它的運(yùn)行成本也更高。

目前,此領(lǐng)域的許多研究人員認(rèn)為,人工智能領(lǐng)域的許多最新進(jìn)展,都來(lái)自于在數(shù)千臺(tái)超級(jí)計(jì)算機(jī)上運(yùn)行越來(lái)越大的模型,這些模型的訓(xùn)練過(guò)程可能耗資數(shù)千萬(wàn)美元。GPT-4是“擴(kuò)大規(guī)?!币垣@得更好結(jié)果的訓(xùn)練方法的一個(gè)例子。

OpenAI表示,它使用的是微軟(MSFT.US)Azure訓(xùn)練模型,微軟已經(jīng)向這家初創(chuàng)公司投資了數(shù)十億美元。OpenAI沒(méi)有公布具體模型大小的細(xì)節(jié),也沒(méi)有公布用來(lái)訓(xùn)練模型的硬件,理由是“競(jìng)爭(zhēng)情況”。

OpenAI的GPT大型語(yǔ)言模型為許多人工智能演示提供了支持,包括必應(yīng)的AI聊天和ChatGPT,這些演示在過(guò)去六個(gè)月里讓科技行業(yè)的人們驚嘆不已。最新版本是新技術(shù)的預(yù)覽,可能會(huì)在未來(lái)幾周內(nèi)開(kāi)始整合到聊天機(jī)器人等消費(fèi)產(chǎn)品中。微軟周二表示,必應(yīng)的人工智能聊天機(jī)器人將使用GPT-4。

OpenAI表示,新模型將產(chǎn)生更少的錯(cuò)誤答案,更少地偏離話題,更少地談?wù)摻稍掝},甚至在許多標(biāo)準(zhǔn)化測(cè)試中比人類表現(xiàn)得更好。

OpenAI稱,GPT-4在模擬律師資格考試中排名第90,在SAT閱讀考試中排名第93,在SAT數(shù)學(xué)考試中排名第89。

然而,OpenAI警告說(shuō),新軟件還不完美,在許多情況下,它的能力不如人類。公司表示,它仍然存在“幻覺(jué)”或自己編造的主要問(wèn)題,而且在事實(shí)問(wèn)題上并不可靠。它仍然傾向于在錯(cuò)誤的時(shí)候堅(jiān)持自己是正確的。

公司在一篇博客文章中表示:“GPT-4仍有許多已知的局限性,我們正在努力解決,比如社會(huì)偏見(jiàn)、幻覺(jué)和對(duì)抗性提示。在閑談中中,GPT-3.5和GPT-4之間的區(qū)別可能很微妙。當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時(shí),差異就顯現(xiàn)出來(lái)了——GPT-4比GPT-3.5更可靠、更有創(chuàng)造力,能夠處理更細(xì)致的指令。”

新模型將提供給ChatGPT的付費(fèi)用戶,也將作為API的一部分提供,允許程序員將AI集成到他們的應(yīng)用程序中。OpenAI將對(duì)750字左右的指令信息收費(fèi)3美分,對(duì)750字左右的響應(yīng)信息收費(fèi)6美分。

智通聲明:本內(nèi)容為作者獨(dú)立觀點(diǎn),不代表智通財(cái)經(jīng)立場(chǎng)。未經(jīng)允許不得轉(zhuǎn)載,文中內(nèi)容僅供參考,不作為實(shí)際操作建議,交易風(fēng)險(xiǎn)自擔(dān)。更多最新最全港美股資訊,請(qǐng)點(diǎn)擊下載智通財(cái)經(jīng)App
分享
微信
分享
QQ
分享
微博
收藏