智通財(cái)經(jīng)APP獲悉,周二,OpenAI公布了其主要大型語(yǔ)言模型GPT的最新版本GPT-4,并表示模型在許多專業(yè)測(cè)試中表現(xiàn)出“人類水平的性能”。
ChatGPT-4比以前的版本“更大”,這意味著它已經(jīng)在更多的數(shù)據(jù)上進(jìn)行了訓(xùn)練,它的運(yùn)行成本也更高。
目前,此領(lǐng)域的許多研究人員認(rèn)為,人工智能領(lǐng)域的許多最新進(jìn)展,都來(lái)自于在數(shù)千臺(tái)超級(jí)計(jì)算機(jī)上運(yùn)行越來(lái)越大的模型,這些模型的訓(xùn)練過(guò)程可能耗資數(shù)千萬(wàn)美元。GPT-4是“擴(kuò)大規(guī)?!币垣@得更好結(jié)果的訓(xùn)練方法的一個(gè)例子。
OpenAI表示,它使用的是微軟(MSFT.US)Azure訓(xùn)練模型,微軟已經(jīng)向這家初創(chuàng)公司投資了數(shù)十億美元。OpenAI沒(méi)有公布具體模型大小的細(xì)節(jié),也沒(méi)有公布用來(lái)訓(xùn)練模型的硬件,理由是“競(jìng)爭(zhēng)情況”。
OpenAI的GPT大型語(yǔ)言模型為許多人工智能演示提供了支持,包括必應(yīng)的AI聊天和ChatGPT,這些演示在過(guò)去六個(gè)月里讓科技行業(yè)的人們驚嘆不已。最新版本是新技術(shù)的預(yù)覽,可能會(huì)在未來(lái)幾周內(nèi)開(kāi)始整合到聊天機(jī)器人等消費(fèi)產(chǎn)品中。微軟周二表示,必應(yīng)的人工智能聊天機(jī)器人將使用GPT-4。
OpenAI表示,新模型將產(chǎn)生更少的錯(cuò)誤答案,更少地偏離話題,更少地談?wù)摻稍掝},甚至在許多標(biāo)準(zhǔn)化測(cè)試中比人類表現(xiàn)得更好。
OpenAI稱,GPT-4在模擬律師資格考試中排名第90,在SAT閱讀考試中排名第93,在SAT數(shù)學(xué)考試中排名第89。
然而,OpenAI警告說(shuō),新軟件還不完美,在許多情況下,它的能力不如人類。公司表示,它仍然存在“幻覺(jué)”或自己編造的主要問(wèn)題,而且在事實(shí)問(wèn)題上并不可靠。它仍然傾向于在錯(cuò)誤的時(shí)候堅(jiān)持自己是正確的。
公司在一篇博客文章中表示:“GPT-4仍有許多已知的局限性,我們正在努力解決,比如社會(huì)偏見(jiàn)、幻覺(jué)和對(duì)抗性提示。在閑談中中,GPT-3.5和GPT-4之間的區(qū)別可能很微妙。當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時(shí),差異就顯現(xiàn)出來(lái)了——GPT-4比GPT-3.5更可靠、更有創(chuàng)造力,能夠處理更細(xì)致的指令。”
新模型將提供給ChatGPT的付費(fèi)用戶,也將作為API的一部分提供,允許程序員將AI集成到他們的應(yīng)用程序中。OpenAI將對(duì)750字左右的指令信息收費(fèi)3美分,對(duì)750字左右的響應(yīng)信息收費(fèi)6美分。