三年前,當(dāng)英特爾首次提出其雄心勃勃的「XPU」(跨架構(gòu)統(tǒng)一編程)戰(zhàn)略時(shí),業(yè)界不乏觀望與質(zhì)疑。這不僅僅是一個(gè)產(chǎn)品路線圖,更是一場(chǎng)旨在徹底革新計(jì)算范式的宏大構(gòu)想。如今,經(jīng)過(guò)三年的潛心耕耘與密集布局,英特爾已成功將這份充滿技術(shù)術(shù)語(yǔ)的「PPT」轉(zhuǎn)化為一系列切實(shí)可感、驅(qū)動(dòng)行業(yè)變革的實(shí)際成果,特別是在數(shù)據(jù)處理與存儲(chǔ)服務(wù)領(lǐng)域,構(gòu)建起一個(gè)更加多元、靈活且高效的計(jì)算生態(tài)系統(tǒng)。
XPU戰(zhàn)略的核心:超越CPU的異構(gòu)計(jì)算
傳統(tǒng)上,以CPU為中心的計(jì)算模型已難以滿足人工智能、高性能計(jì)算、云原生和邊緣計(jì)算等新興負(fù)載對(duì)算力多樣性、能效與性價(jià)比的極致要求。英特爾的XPU戰(zhàn)略應(yīng)運(yùn)而生,其核心思想是:不再依賴單一類型的處理器,而是通過(guò)整合CPU、GPU、FPGA、AI加速器(如Habana Gaudi)等多種計(jì)算架構(gòu),并借助統(tǒng)一的軟件棧(如oneAPI),讓開(kāi)發(fā)者能夠靈活地為特定任務(wù)選擇最優(yōu)的計(jì)算單元,實(shí)現(xiàn)「正確的架構(gòu)處理正確的工作負(fù)載」。
三年成果:從硬件矩陣到軟件生態(tài)的全面落地
過(guò)去三年,英特爾在硬件產(chǎn)品線上實(shí)現(xiàn)了里程碑式的突破,為數(shù)據(jù)處理與存儲(chǔ)服務(wù)提供了堅(jiān)實(shí)的底層支撐:
- CPU的持續(xù)進(jìn)化:第三代至強(qiáng)? 可擴(kuò)展處理器(Ice Lake)及最新發(fā)布的第四代(Sapphire Rapids)集成了更多核心、更強(qiáng)的AI加速能力(AMX)以及先進(jìn)的內(nèi)存和I/O技術(shù)(如DDR5、PCIe 5.0、CXL),顯著提升了數(shù)據(jù)中心通用計(jì)算、數(shù)據(jù)分析與存儲(chǔ)處理的性能與效率。
- GPU的強(qiáng)勢(shì)入局:數(shù)據(jù)中心GPU Max系列(Ponte Vecchio)與Flex系列的推出,標(biāo)志著英特爾正式在高端HPC/AI和主流視覺(jué)云市場(chǎng)與對(duì)手展開(kāi)競(jìng)爭(zhēng)。這些GPU專為高帶寬、并行計(jì)算密集型負(fù)載設(shè)計(jì),極大地加速了機(jī)器學(xué)習(xí)訓(xùn)練、推理以及復(fù)雜的科學(xué)模擬和媒體處理任務(wù),分擔(dān)了CPU的壓力。
- 專用加速器的深化:通過(guò)收購(gòu)Habana Labs,英特爾獲得了領(lǐng)先的AI訓(xùn)練(Gaudi)和推理(Goya)處理器。與通用GPU相比,這些專用ASIC在能效和性價(jià)比上針對(duì)AI負(fù)載進(jìn)行了深度優(yōu)化,正在被全球主要云服務(wù)商采納,用于大規(guī)模AI模型的訓(xùn)練與服務(wù)部署。
- FPGA的靈活賦能:Agilex? FPGA系列提供了無(wú)可比擬的硬件可編程性,使得數(shù)據(jù)中心和邊緣設(shè)備能夠針對(duì)網(wǎng)絡(luò)功能虛擬化(NFV)、金融科技分析、實(shí)時(shí)視頻轉(zhuǎn)碼等快速變化或高度定制化的負(fù)載進(jìn)行硬件級(jí)優(yōu)化,實(shí)現(xiàn)了性能與靈活性的統(tǒng)一。
統(tǒng)一軟件棧:oneAPI是XPU戰(zhàn)略的靈魂
硬件矩陣只是基礎(chǔ),讓它們協(xié)同工作才是關(guān)鍵。英特爾同期大力推動(dòng)的oneAPI開(kāi)放標(biāo)準(zhǔn)與工具包,正是XPU戰(zhàn)略從硬件堆砌走向系統(tǒng)級(jí)解決方案的「粘合劑」。它提供了跨CPU、GPU、FPGA等架構(gòu)的統(tǒng)一編程模型(Data Parallel C++)和豐富的庫(kù)函數(shù),使開(kāi)發(fā)者無(wú)需為每種硬件重寫代碼,就能高效地利用異構(gòu)算力。這極大地降低了軟件開(kāi)發(fā)和移植的復(fù)雜性,加速了創(chuàng)新應(yīng)用的落地,特別是在需要整合多種計(jì)算資源進(jìn)行復(fù)雜數(shù)據(jù)處理、分析和存儲(chǔ)服務(wù)的場(chǎng)景中。
賦能數(shù)據(jù)處理與存儲(chǔ)服務(wù):構(gòu)建智能、高效的未來(lái)基礎(chǔ)設(shè)施
XPU戰(zhàn)略的實(shí)際成果,正在深刻改變數(shù)據(jù)處理與存儲(chǔ)服務(wù)的技術(shù)面貌:
- 智能數(shù)據(jù)分析與AI服務(wù):在云數(shù)據(jù)中心,CPU處理常規(guī)數(shù)據(jù)管理和業(yè)務(wù)邏輯,GPU和Habana加速器并行處理海量數(shù)據(jù)的機(jī)器學(xué)習(xí)訓(xùn)練與推理,F(xiàn)PGA則可能負(fù)責(zé)實(shí)時(shí)數(shù)據(jù)流的預(yù)處理或加密。這種組合使得從大數(shù)據(jù)分析到個(gè)性化推薦、自然語(yǔ)言處理等AI服務(wù)響應(yīng)更快、成本更低。
- 高性能存儲(chǔ)與內(nèi)存分層:支持CXL(Compute Express Link)互連協(xié)議的至強(qiáng)處理器,結(jié)合傲騰? 持久內(nèi)存等創(chuàng)新技術(shù),正在打破內(nèi)存與存儲(chǔ)的壁壘。XPU架構(gòu)可以更高效地管理數(shù)據(jù)在DRAM、持久內(nèi)存和SSD之間的流動(dòng),實(shí)現(xiàn)更智能的內(nèi)存分層,為內(nèi)存數(shù)據(jù)庫(kù)、快速緩存和大型模型訓(xùn)練提供巨量、高速且經(jīng)濟(jì)的數(shù)據(jù)支持。
- 分布式與邊緣計(jì)算:在邊緣側(cè),低功耗的酷睿處理器、集成了GPU的SoC以及Movidius VPU等,構(gòu)成了輕量級(jí)但能力全面的XPU組合。它們能夠在靠近數(shù)據(jù)源頭的位置,實(shí)時(shí)處理來(lái)自物聯(lián)網(wǎng)設(shè)備的海量數(shù)據(jù),執(zhí)行視頻分析、預(yù)測(cè)性維護(hù)等任務(wù),只將關(guān)鍵結(jié)果傳回云端,大幅降低了帶寬需求與延遲,提升了存儲(chǔ)與處理的效率。
- 云原生與微服務(wù):通過(guò)軟件定義和容器化技術(shù),云服務(wù)商可以利用XPU池化的異構(gòu)算力,為不同的租戶或微服務(wù)動(dòng)態(tài)分配最合適的計(jì)算資源(如為AI微服務(wù)分配GPU實(shí)例,為數(shù)據(jù)庫(kù)微服務(wù)分配大內(nèi)存CPU實(shí)例),實(shí)現(xiàn)資源利用率的極致化和服務(wù)性能的優(yōu)化。
###
從戰(zhàn)略藍(lán)圖到軟硬件成果的全面開(kāi)花,英特爾用三年時(shí)間證明了XPU路徑的前瞻性與可行性。它不再僅僅是一家CPU公司,而是轉(zhuǎn)型為一家提供全方位計(jì)算解決方案的領(lǐng)導(dǎo)者。在數(shù)據(jù)處理與存儲(chǔ)服務(wù)日益成為數(shù)字經(jīng)濟(jì)核心引擎的今天,英特爾的XPU戰(zhàn)略及其成果,正為構(gòu)建更智能、更高效、更靈活的未來(lái)計(jì)算基礎(chǔ)設(shè)施奠定堅(jiān)實(shí)的基礎(chǔ),推動(dòng)各行各業(yè)加速數(shù)字化與智能化轉(zhuǎn)型。下一個(gè)三年,隨著更多創(chuàng)新產(chǎn)品的迭代和oneAPI生態(tài)的繁榮,XPU帶來(lái)的變革將更加深遠(yuǎn)。
AI服務(wù)器需求引爆HBM市場(chǎng) 海外大廠訂單激增價(jià)格暴漲,產(chǎn)業(yè)鏈?zhǔn)芤嫔鲜泄臼崂?/span>