智通財(cái)經(jīng)APP獲悉,據(jù)媒體報(bào)道,在美國(guó)收緊芯片出口限制的情況下,全球AI芯片領(lǐng)導(dǎo)者英偉達(dá)(NVDA.US)計(jì)劃在2024年第二季度開(kāi)始批量生產(chǎn)為中國(guó)市場(chǎng)而專門設(shè)計(jì)的人工智能(AI)芯片。媒體援引知情人士的話報(bào)道稱,專門面向中國(guó)市場(chǎng)的H20 AI芯片的初始產(chǎn)量將非常有限,該公司將主要考慮滿足大型客戶的訂單。
原計(jì)劃于去年11月推出的H20 AI芯片是英偉達(dá)為遵守美國(guó)出口限制而開(kāi)發(fā)的三款專門面向中國(guó)市場(chǎng)的AI芯片中計(jì)算功能最為強(qiáng)大的AI芯片。目前該芯片巨頭尚未宣布正式出售這三種芯片中的任何一種。英偉達(dá)在財(cái)報(bào)中曾指出,中國(guó)和其他一些受限制影響的地區(qū)帶來(lái)的營(yíng)收約占其數(shù)據(jù)中心營(yíng)收規(guī)模的四分之一,其中中國(guó)市場(chǎng)占據(jù)絕大多數(shù)比例。
英偉達(dá)首席財(cái)務(wù)官Colette Kress表示,美國(guó)的規(guī)定要求某些出口產(chǎn)品獲得許可證,該公司表示正在與這些地區(qū)的客戶合作,試圖獲得部分產(chǎn)品的發(fā)貨許可,以及不會(huì)引發(fā)美國(guó)政府限制的“解決方案”。她甚至表示,如果沒(méi)有針對(duì)中國(guó)AI芯片的出貨新規(guī)定,英偉達(dá)第四財(cái)季(截至今年1月)的業(yè)績(jī)展望數(shù)據(jù)將會(huì)更高。
英偉達(dá)在業(yè)績(jī)預(yù)期中表示,該公司2024財(cái)年Q4(對(duì)于截至今年1月的第四季度)總營(yíng)收將達(dá)到約200億美元。盡管這一數(shù)據(jù)超過(guò)了179億美元的華爾街分析師平均預(yù)測(cè)數(shù)據(jù),但部分分析師的預(yù)測(cè)甚至高達(dá)210億美元。
英偉達(dá)的H20 AI芯片是在特定的背景下推出的,主要是為了應(yīng)對(duì)美國(guó)對(duì)中國(guó)的芯片出口管制政策。據(jù)報(bào)道,英偉達(dá)將基于H100推出三款針對(duì)中國(guó)市場(chǎng)的AI芯片,包括HGX H20、L20 PCle、L2 PCle,這些新產(chǎn)品都是基于英偉達(dá)的Hopper和Ada Lovelace架構(gòu)。
和H100相比,性能最強(qiáng)的中國(guó)特供版AI芯片H20性能如何?
幾乎可以肯定的是,這三款A(yù)I芯片都是H100的“閹割版”或“縮水版”,這反映了為了遵守出口管制而做出的調(diào)整。其中,H20 AI芯片擁有96GB HBM3存儲(chǔ)空間,內(nèi)存帶寬高達(dá)4.0 Tb/s,均高于H100,但綜合計(jì)算能力僅為296 TFLOP,性能密度為2.9,遠(yuǎn)遠(yuǎn)不如H100。
在具體的性能指標(biāo)方面,H20 AI芯片是H100的一種調(diào)整版本。據(jù)測(cè)評(píng)機(jī)構(gòu)報(bào)道,H20的綜合算力相比H100降低了約80%。這一變化反映了芯片的性能調(diào)整,以適應(yīng)美國(guó)出口管制政策的相關(guān)要求。盡管如此,H20仍然具有在特定情況下的性能優(yōu)勢(shì)。例如,通過(guò)將推理所需的芯片數(shù)量從兩個(gè)減少到一個(gè),如果再使用8位量化,LLAMA 70B模型可以在單個(gè)H20上有效運(yùn)行,而不是需要兩個(gè)H100。這表明H20在某些應(yīng)用場(chǎng)景中仍然能提供有效的性能。
從傳統(tǒng)算力的角度來(lái)看,H20相比H100有所降級(jí),但在LLM推理這一方面,H20實(shí)際上會(huì)比H100快了20%以上,理由是H20在某些方面與2024年要發(fā)布的H200相似。注意,H200是H100的后繼產(chǎn)品,專注于復(fù)雜AI和HPC工作負(fù)載的超級(jí)性能芯片。因此,英偉達(dá)H20 AI芯片的推出是為了適應(yīng)美國(guó)對(duì)中國(guó)的出口管制政策,其性能相比于H100有所降低,但在某些應(yīng)用場(chǎng)景下仍然保持了一定的效率和實(shí)用性。
英偉達(dá)和其他的大型科技巨頭計(jì)劃在本周于拉斯維加斯舉行的消費(fèi)電子展(CES)上公布他們的最新研發(fā)成果。該公司預(yù)計(jì)將在此次活動(dòng)中展示幾款最新的GPU產(chǎn)品,其中將包括RTX 4080 Super, 4070 Ti Super和4070 Super。分析人士普遍預(yù)期,英偉達(dá)傾向于保持在全球游戲硬件領(lǐng)域的絕對(duì)領(lǐng)先地位。
AI芯片“價(jià)格博弈”苗頭隱現(xiàn)
股票研究以及市場(chǎng)情報(bào)提供商Edgewater Research表示,在2023年年底,AI芯片巨頭英偉達(dá)的人工智能芯片渠道需求展望首次出現(xiàn)“喜憂參半”的預(yù)期數(shù)據(jù)。在需求端,買賣雙方“價(jià)格博弈”信號(hào)已經(jīng)出現(xiàn),尤其是一些買家選擇觀望,等待他們能接受的市場(chǎng)價(jià)格。
該公司表示,目前還不清楚為什么英偉達(dá)的人工智能GPU需求突然出現(xiàn)了“好壞參半”的數(shù)據(jù)預(yù)測(cè)點(diǎn),不過(guò)人們猜測(cè)最有可能的原因是全新H200 AI芯片的正式推出(于上個(gè)月宣布),以及最強(qiáng)大競(jìng)爭(zhēng)對(duì)手之一AMD發(fā)布號(hào)稱“最強(qiáng)算力”的AI芯片Instinct MI300X,這一局面導(dǎo)致主要客戶在重新考慮GPU采購(gòu)計(jì)劃時(shí)暫停購(gòu)買,直至等到英偉達(dá)報(bào)出他們認(rèn)為合理的市場(chǎng)價(jià)格。然而,該研究機(jī)構(gòu)補(bǔ)充表示:“這也可能表明2024年中期的英偉達(dá)新產(chǎn)品潛在需求將因性能等優(yōu)勢(shì)而重新加速?!?/p>
AMD并未透露MI300X的定價(jià),但AMD首席執(zhí)行官蘇姿豐表示,AMD的芯片必須比英偉達(dá)的芯片購(gòu)買和運(yùn)營(yíng)成本更低,才能說(shuō)服潛在大客戶購(gòu)買。
全球AI芯片領(lǐng)導(dǎo)者英偉達(dá)在AI芯片領(lǐng)域份額接近90%,AMD則遠(yuǎn)遠(yuǎn)不及英偉達(dá),然而在AMD發(fā)布號(hào)稱“最強(qiáng)算力”的AI芯片Instinct MI300X之后,英偉達(dá)壟斷地位毫無(wú)疑問(wèn)將面臨來(lái)自AMD的巨大威脅?!癆dvancing AI”發(fā)布會(huì)上,AMD將截至2027年的全球AI芯片市場(chǎng)規(guī)模預(yù)期,從此前預(yù)期的1500億美元猛然上修至4000億美元,而2023年AI市場(chǎng)規(guī)模預(yù)期僅僅為300億美元左右。華爾街大行花旗預(yù)計(jì)2024年AI芯片市場(chǎng)規(guī)模將在 750億美元左右,同時(shí)預(yù)計(jì)AMD能夠占據(jù) 10% 左右的市場(chǎng)份額。