91亚洲精品在线观看|国产一级激情|成年女人视频|日本a∨中文字幕,久久丫精品国产亚洲AV不卡,国产精品久久久久久久av大片,怀孕挺大肚子疯狂高潮av毛片

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

“買顯存送核心”,AI芯片競(jìng)賽進(jìn)入“內(nèi)存為王”!智能體大時(shí)代,中國(guó)AI芯片有何機(jī)會(huì)?

2026-03-05 00:42:42

2025年下半年以來(lái)存儲(chǔ)芯片持續(xù)漲價(jià),進(jìn)入2026年漲幅更驚人,AI芯片進(jìn)入“內(nèi)存為王”時(shí)代。大模型發(fā)展使訓(xùn)練和推理對(duì)顯存需求大增,內(nèi)存重要性超GPU核心。在此背景下,中國(guó)AI芯片廠商在工程化領(lǐng)域或凸顯優(yōu)勢(shì)。

每經(jīng)記者|朱成祥    每經(jīng)編輯|杜宇    

曾經(jīng),云服務(wù)廠商買AI芯片,關(guān)注GPU(圖形處理器)算力大小,而如今,可能更多的是看重顯存大小,比如是40GB還是80GB。

甚至有人調(diào)侃“買顯存送核心”,即買一張GPU算力卡,更看重的是顯存帶寬和容量,而不是GPU算力大小。

如今,內(nèi)存芯片一兩個(gè)月價(jià)格翻倍的大漲潮,正是對(duì)AI芯片進(jìn)入“內(nèi)存為王”的集中體現(xiàn)。

AI云基礎(chǔ)設(shè)施廠商PPIO相關(guān)專家告訴每經(jīng)記者:“HBM(高帶寬內(nèi)存)及CoWoS(基板上晶圓、芯片)封裝產(chǎn)生的成本已經(jīng)超過(guò)純GPU芯片,HBM成本已經(jīng)‘碾壓’核心,‘買顯存送核心’已成為現(xiàn)實(shí)?!?/p>

某GPU芯片企業(yè)技術(shù)負(fù)責(zé)人李明(化名)對(duì)每經(jīng)記者表示:“結(jié)合我們硬件設(shè)計(jì)與供應(yīng)鏈經(jīng)驗(yàn),CoWoS封裝GPU中,當(dāng)前HBM顯存成本已接近甚至超過(guò)GPU核心,是整卡成本最高的單一組件?!?/p>

懂芯創(chuàng)始人張慧娟告訴每經(jīng)記者:“AI芯片的競(jìng)爭(zhēng)已從單純的算力競(jìng)賽,轉(zhuǎn)向了內(nèi)存帶寬和內(nèi)存容量的雙重競(jìng)賽。HBM通過(guò)先進(jìn)封裝技術(shù)與GPU裸片集成在同一封裝內(nèi),實(shí)現(xiàn)了計(jì)算與存儲(chǔ)的緊耦合,極大地緩解了內(nèi)存難題,越來(lái)越成為業(yè)界追捧的主要方向?!?/p>

圖片來(lái)源:每經(jīng)媒資庫(kù)

智能體大時(shí)代:內(nèi)存需求強(qiáng)勁

2025年下半年以來(lái),存儲(chǔ)芯片持續(xù)漲價(jià)成了半導(dǎo)體行業(yè)最熱門(mén)的話題。進(jìn)入2026年,存儲(chǔ)芯片仍保持上漲趨勢(shì),且漲幅驚人。

而這背后,是AI芯片已進(jìn)入“內(nèi)存為王”的時(shí)代。

2023年,ChatGPT石破天驚,人類社會(huì)進(jìn)入大模型時(shí)代。進(jìn)入2026年,大模型已然從思考轉(zhuǎn)向應(yīng)用,智能體、Skill以及“養(yǎng)蝦”成了熱門(mén)話題。

人工智能的發(fā)展,也對(duì)AI芯片有了新的要求。隨著大模型參數(shù)的增加,訓(xùn)練和推理對(duì)顯存(內(nèi)存的一種)的需求也與日俱增。

張慧娟表示:“我們已經(jīng)見(jiàn)證了模型參數(shù)量的指數(shù)級(jí)增長(zhǎng),從GPT-3的1750億到萬(wàn)億級(jí)MoE(混合專家模型),直接推動(dòng)了HBM需求的爆發(fā)。這也逐步造成,制約算力的瓶頸往往不是芯片算力本身,而是數(shù)據(jù)從內(nèi)存?zhèn)鬏數(shù)接?jì)算核心的速度,因?yàn)閰?shù)必須被加載到計(jì)算單元附近的高速存儲(chǔ)介質(zhì)中,計(jì)算單元才能以極低的延遲調(diào)用它們進(jìn)行運(yùn)算?!?/p>

李明認(rèn)為:“大模型的參數(shù)量與內(nèi)存需求之間存在著直接的正向關(guān)系。在2026年的技術(shù)背景下,雖然模型架構(gòu)(如MoE混合專家模型)和量化技術(shù)(Quantization)在不斷優(yōu)化,但‘參數(shù)量越大,內(nèi)存需求越高’依然是AI領(lǐng)域的基本物理定律。除了模型權(quán)重需要的靜態(tài)顯存占用以外,大模型運(yùn)行時(shí)需要的KV Cache和激活值等都會(huì)額外占用顯存。在訓(xùn)練任務(wù)中,還需要額外顯存來(lái)保存梯度和優(yōu)化器狀態(tài)等信息?!?/p>

但大模型對(duì)內(nèi)存的強(qiáng)勁“渴望”,不僅僅局限于參數(shù)的增長(zhǎng)。

智能體的快速發(fā)展,令A(yù)I推理對(duì)AI芯片的需求大增。業(yè)界普遍認(rèn)為,未來(lái)AI推理對(duì)AI芯片的需求將大幅超越AI訓(xùn)練。

PPIO專家表示:“大模型推理場(chǎng)景中,GPU內(nèi)存主要用于兩個(gè)方面,一是保存大模型的權(quán)重,另一個(gè)是推理過(guò)程中用于存儲(chǔ)中間狀態(tài),也就是KV Cache緩存。前者由大模型參數(shù)量決定,后者取決于會(huì)話的上下文長(zhǎng)度。大模型發(fā)展至今,參數(shù)量已經(jīng)趨于穩(wěn)定,不會(huì)大幅增加。而會(huì)話的上下文長(zhǎng)度還在持續(xù)增加,特別是Agent(智能體)場(chǎng)景下,1百萬(wàn)Token的上下文長(zhǎng)度已成為主流。這樣進(jìn)一步增加對(duì)內(nèi)存的開(kāi)銷,長(zhǎng)上下文成為內(nèi)存需求的主要因素。”

參數(shù)、長(zhǎng)上下文,這兩大因素的作用下,內(nèi)存的重要性已然超越GPU計(jì)算核心。

成本結(jié)構(gòu):內(nèi)存>算力

不僅僅客戶需求側(cè)更加看重內(nèi)存。在成本結(jié)構(gòu)中,內(nèi)存的成本也大幅高于純粹的GPU核心。

PPIO專家稱:“一張GPU的成本構(gòu)成主要分成三部分,一是HBM內(nèi)存,容量越大成本越高;二是GPU核心(邏輯計(jì)算芯片);三是先進(jìn)封裝工藝(CoWoS)。高端GPU,由于HBM內(nèi)存容量更大,其HBM的成本更高,以B200(英偉達(dá)GPU)為例,其總生產(chǎn)成本的構(gòu)成中,HBM內(nèi)存占比約45%,CoWoS封裝及良率損失占比約34%,GPU核心芯片占比只有14%左右?!?/p>

即英偉達(dá)B200的成本結(jié)構(gòu)中,45%源自向SK海力士、三星、美光等廠商購(gòu)買HBM,14%源自臺(tái)積電代工的GPU裸芯,34%源自臺(tái)積電代工的CoWoS封裝及良率損失。

而HBM由多層DRAM(動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器)堆疊而成。HBM需求大增,意味著SK海力士這類廠商將越來(lái)越多的DRAM產(chǎn)能用于制造HBM,相應(yīng)用于消費(fèi)級(jí)的DRAM產(chǎn)能便少了。

PPIO專家表示:“三大存儲(chǔ)巨頭(三星、SK海力士、美光)已經(jīng)將70%的產(chǎn)能轉(zhuǎn)移到HBM上,用于消費(fèi)電子的GDDR產(chǎn)能反而會(huì)下降。因此我們首先看到消費(fèi)領(lǐng)域的GeForce GPU的價(jià)格普遍上漲,大內(nèi)存GPU減產(chǎn)甚至停產(chǎn),這是由于GDDR內(nèi)存減產(chǎn)以優(yōu)先保障HBM內(nèi)存導(dǎo)致的?!?/p>

那么,若未來(lái)存儲(chǔ)行業(yè)產(chǎn)能提升,消費(fèi)電子領(lǐng)域存儲(chǔ)價(jià)格是否也將率先受到?jīng)_擊?

張慧娟認(rèn)為:“消費(fèi)電子往往是最先感知到波動(dòng)的領(lǐng)域。特別是對(duì)于存儲(chǔ)來(lái)說(shuō),比如手機(jī)、PC(個(gè)人電腦)用的LPDDR(低功耗內(nèi)存)、SSD(固態(tài)硬盤(pán))等接近于標(biāo)準(zhǔn)品,價(jià)格彈性大。一旦上游晶圓產(chǎn)能提升,最先反映在現(xiàn)貨價(jià)上的是這些產(chǎn)品。”

李明認(rèn)為:“未來(lái)存儲(chǔ)產(chǎn)能提升后,最先受到影響的是消費(fèi)電子用存儲(chǔ)。消費(fèi)級(jí)存儲(chǔ)認(rèn)證周期短、需求彈性大、替換靈活,新產(chǎn)能可快速導(dǎo)入消費(fèi)端,價(jià)格波動(dòng)也最為明顯。而數(shù)據(jù)中心用存儲(chǔ)認(rèn)證流程通常需要6—18個(gè)月,新產(chǎn)能導(dǎo)入速度較慢,且存儲(chǔ)廠商會(huì)優(yōu)先保障數(shù)據(jù)中心的產(chǎn)能供給,因此它受產(chǎn)能提升的影響最晚、幅度最小。總體而言,產(chǎn)能提升的影響會(huì)先平抑消費(fèi)端價(jià)格,再逐步傳導(dǎo)至企業(yè)級(jí)市場(chǎng)?!?/p>

簡(jiǎn)而言之,存儲(chǔ)產(chǎn)能提升后,將率先平抑消費(fèi)端存儲(chǔ)芯片價(jià)格。

HBM需求強(qiáng)勁,產(chǎn)能嚴(yán)重不足

值得一提的是,三星、SK海力士未來(lái)將有兩座晶圓廠陸續(xù)投產(chǎn),這將緩解內(nèi)存“缺貨漲價(jià)”嗎?若P4L(三星電子)和M15x(SK海力士)提前投入運(yùn)營(yíng),是否將對(duì)存儲(chǔ)芯片價(jià)格帶來(lái)沖擊?

張慧娟認(rèn)為:“P4L和M15x新增產(chǎn)能,很大程度上是為HBM和高性能DDR5(第五代計(jì)算機(jī)內(nèi)存規(guī)格)準(zhǔn)備的,而不是傳統(tǒng)的DDR4(第四代計(jì)算機(jī)內(nèi)存規(guī)格)或NAND(閃存)。這些屬于高端產(chǎn)能。”

其補(bǔ)充表示:“對(duì)HBM的價(jià)格沖擊可能不大,甚至不會(huì)降價(jià)。因?yàn)锳I芯片開(kāi)發(fā)周期長(zhǎng),且市場(chǎng)處于供不應(yīng)求的局面。新增產(chǎn)能是為了填平供需缺口,有望抑制價(jià)格進(jìn)一步大漲,但難以帶來(lái)大幅降價(jià)。對(duì)普通DRAM而言,假設(shè)HBM需求不及預(yù)期,或者廠商將部分產(chǎn)線切換回通用DRAM,那么會(huì)對(duì)消費(fèi)電子內(nèi)存價(jià)格帶來(lái)壓力。但目前看,晶圓廠更傾向于優(yōu)先保證高利潤(rùn)的HBM生產(chǎn)?!?/p>

李明對(duì)每經(jīng)記者表示:“從存儲(chǔ)芯片供應(yīng)鏈與GPU硬件配套的角度分析,三星P4L與SK海力士M15x即便提前投產(chǎn),短期內(nèi)對(duì)存儲(chǔ)芯片價(jià)格的沖擊也較為有限。核心原因在于,這兩座工廠的新產(chǎn)能主要聚焦于HBM、先進(jìn)制程DDR等高端存儲(chǔ)產(chǎn)品,并未直接擴(kuò)產(chǎn)消費(fèi)級(jí)存儲(chǔ)?!?/p>

李明補(bǔ)充表示:“當(dāng)前AI需求呈爆發(fā)式增長(zhǎng),高端存儲(chǔ)仍處于供需緊張狀態(tài),因此短期價(jià)格將維持高位。中長(zhǎng)期來(lái)看,隨著產(chǎn)能逐步釋放,高端存儲(chǔ)的供給壓力會(huì)有所緩解,但新產(chǎn)能將優(yōu)先配套AI與數(shù)據(jù)中心需求,普通消費(fèi)級(jí)存儲(chǔ)不會(huì)出現(xiàn)大幅降價(jià),整體呈現(xiàn)結(jié)構(gòu)性緩和態(tài)勢(shì)。此外,各大廠商的存儲(chǔ)優(yōu)化技術(shù),也能進(jìn)一步平衡供需,避免全品類存儲(chǔ)價(jià)格出現(xiàn)大幅波動(dòng)?!?/p>

PPIO認(rèn)為:“HBM的產(chǎn)能嚴(yán)重不足以及AI數(shù)據(jù)中心對(duì)GPU的旺盛需求是造成HBM內(nèi)存成本遠(yuǎn)高于GPU核心的主要因素。市場(chǎng)的供需不平衡會(huì)促使更多內(nèi)存廠商擴(kuò)大生產(chǎn),尤其是增加HBM的生產(chǎn)和供給,不過(guò)短期很難改變供需失衡的現(xiàn)狀,未來(lái)HBM內(nèi)存價(jià)格還將繼續(xù)上漲,但趨勢(shì)會(huì)放緩?!?/p>

在AI算力相對(duì)不稀缺而HBM短缺的背景下,中國(guó)AI芯片廠商有何機(jī)會(huì)?

據(jù)記者了解,國(guó)內(nèi)AI芯片廠商除了自身產(chǎn)品和技術(shù)解決方案,還在基礎(chǔ)軟件層面聯(lián)合各大人工智能基礎(chǔ)設(shè)施公司、大模型廠商和互聯(lián)網(wǎng)等生態(tài)伙伴一同研究例如低精度量化、專家預(yù)測(cè)加載等工程優(yōu)化技術(shù),來(lái)系統(tǒng)性地降低實(shí)際大模型部署和應(yīng)用過(guò)程中對(duì)內(nèi)存的需求。

即在工程化領(lǐng)域,中國(guó)工程師紅利或?qū)⑼癸@。


封面圖片來(lái)源:每經(jīng)媒資庫(kù)

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

3

0