智通財(cái)經(jīng)APP獲悉,民生證券發(fā)布研究報(bào)告稱(chēng),運(yùn)營(yíng)商提倡液冷滲透率提升有望協(xié)同產(chǎn)業(yè)鏈上下游推進(jìn)液冷機(jī)柜與服務(wù)器解耦,引領(lǐng)形成統(tǒng)一標(biāo)準(zhǔn)。同時(shí)隨著智算中心落地,以曙光數(shù)創(chuàng)為代表的的芯片級(jí)液冷技術(shù)供應(yīng)商有望得益于適配芯片生態(tài)快速放量相應(yīng)解決方案,建議關(guān)注申菱環(huán)境(301018.SZ)、英維克(002837.SZ)、科創(chuàng)新源(300731.SZ)。
▍民生證券主要觀點(diǎn)如下:
風(fēng)冷在AI數(shù)據(jù)中心的現(xiàn)實(shí)焦慮。
2023年7月3日,“2023第四屆中國(guó)電子通訊設(shè)備結(jié)構(gòu)設(shè)計(jì)及熱管理技術(shù)論壇”在上海舉辦,多位行業(yè)專(zhuān)家針對(duì)液冷進(jìn)行深入分析。電流通過(guò)電阻時(shí),所消耗的電能會(huì)轉(zhuǎn)化為熱能,即電流的熱效應(yīng)。由于早期計(jì)算機(jī)具備功耗低、體積大的特點(diǎn),因此不需要單獨(dú)設(shè)計(jì)系統(tǒng)級(jí)的散熱解決方案,可直接通過(guò)背后放置風(fēng)扇的方式將熱流導(dǎo)出。
而AI芯片的功耗隨算力性能的提升快速增長(zhǎng),根據(jù)CIME,10年前市面上能買(mǎi)到的最頂級(jí)的數(shù)據(jù)中心GPU是英偉達(dá)K40,其熱設(shè)計(jì)功耗(TDP)為235W,2020年英偉達(dá)發(fā)布A100時(shí),熱設(shè)計(jì)功耗接近400W,到了H100芯片,熱設(shè)計(jì)功耗直接提升到700W。AI訓(xùn)練中心通常依靠高密度工作集群,往往會(huì)在至少數(shù)十個(gè)甚至數(shù)百個(gè)GPU上運(yùn)行,每個(gè)GPU都有數(shù)千個(gè)內(nèi)核需要供電。
考慮到GPU的功耗可達(dá)700W甚至以上,AI服務(wù)器集群算力密度普遍有望達(dá)到20-50kW/機(jī)柜,冷熱風(fēng)道隔離的微模塊加水冷空調(diào)水平制冷在機(jī)柜功率超過(guò)15kW后性?xún)r(jià)會(huì)比大幅下降。
登納德縮放定律逐漸失效,數(shù)據(jù)中心機(jī)架功率密度有進(jìn)一步提升趨勢(shì)。
目前,最新的計(jì)算芯片難以遵守登納德定律的縮放,隨著芯片集成度的提升,所需的功耗和散熱要求越來(lái)越大,產(chǎn)生了“功耗墻”問(wèn)題。未來(lái)芯片供應(yīng)商們新發(fā)布CPU和GPU會(huì)有更高功耗,數(shù)據(jù)中心的機(jī)架功率密度也將會(huì)有進(jìn)一步增加的趨勢(shì)。
服務(wù)器與液冷廠商開(kāi)展業(yè)務(wù)協(xié)同,打通液冷產(chǎn)業(yè)“阿喀琉斯之踵”。
針對(duì)無(wú)法規(guī)模部署且有價(jià)格顧慮的用戶(hù),AI服務(wù)器供應(yīng)商寧暢可提供“嘗鮮版”,該公司提出在24小時(shí)內(nèi),寧暢團(tuán)隊(duì)可實(shí)現(xiàn)風(fēng)冷服務(wù)器節(jié)點(diǎn)內(nèi)的液冷改造以及液冷機(jī)柜升級(jí),該方案可免機(jī)房部署,對(duì)比同型號(hào)配置全新機(jī)器,成本降低90%,性能提升10%。液冷終歸是解決服務(wù)器廠商需求,需要的是服務(wù)器廠商實(shí)施經(jīng)驗(yàn)的積累。
風(fēng)險(xiǎn)提示:
液冷進(jìn)展不及預(yù)期,數(shù)據(jù)中心機(jī)柜建設(shè)不及預(yù)期,市場(chǎng)競(jìng)爭(zhēng)加劇。