如今,我們正在見證計(jì)算領(lǐng)域巨大的創(chuàng)新階段,全球5G的快速部署與數(shù)據(jù)密集型工作負(fù)載以及生成型人工智能的突破性發(fā)展交織在一起。整個計(jì)算生態(tài)系統(tǒng)對靈活性的需求從未如此強(qiáng)烈,以創(chuàng)新和探索新型加速、新穎的系統(tǒng)架構(gòu)以及滿足不斷增長的數(shù)據(jù)消費(fèi)需求的新方法。半導(dǎo)體設(shè)計(jì)成本上升和全球能源預(yù)算收緊帶來的額外挑戰(zhàn)意味著我們正處于全球計(jì)算基礎(chǔ)設(shè)施轉(zhuǎn)型之中。
5G與人工智能的結(jié)合蘊(yùn)藏著巨大的機(jī)遇。5G技術(shù)可以提供人工智能應(yīng)用收集、傳輸和處理大量數(shù)據(jù)所需的高吞吐量、低延遲和可靠的連接。作為回報(bào),人工智能可以幫助5G網(wǎng)絡(luò)動態(tài)分配資源、管理流量和檢測異常。人工智能還可以利用5G為用戶和設(shè)備提供個性化、情境化的智能服務(wù)。這兩項(xiàng)技術(shù)將共同真正改變我們的溝通、工作和生活方式。
但每個故事都有兩個方面。5G 和人工智能給數(shù)據(jù)中心運(yùn)營商和客戶帶來了重大挑戰(zhàn),因?yàn)閮烧叨紩a(chǎn)生大量數(shù)據(jù),需要以靈活、及時、經(jīng)濟(jì)和節(jié)能的方式存儲、處理和分析。為了充分利用這個機(jī)會,數(shù)據(jù)中心架構(gòu)師需要圍繞計(jì)算的設(shè)計(jì)、構(gòu)建和部署方式尋找變革性方法。
5G虛擬RAN:邊緣數(shù)據(jù)中心的關(guān)鍵推動者
支持5G的關(guān)鍵創(chuàng)新之一是虛擬無線接入網(wǎng)絡(luò) (vRAN)。vRAN 是一種相對較新的部署模型,正在流行。它將蜂窩基帶處理功能與硬件解耦,并將其作為軟件在通用服務(wù)器上運(yùn)行。
這可以在部署和管理5G網(wǎng)絡(luò)時提供更大的靈活性、可擴(kuò)展性和效率。虛擬化5G基礎(chǔ)設(shè)施的規(guī)模經(jīng)濟(jì)可以通過多種方式實(shí)現(xiàn)。第一,結(jié)合相同的計(jì)算基礎(chǔ)設(shè)施來服務(wù)5G連接和邊緣應(yīng)用,使連接和數(shù)據(jù)處理更接近源;其次,軟件驅(qū)動的云原生基礎(chǔ)設(shè)施可實(shí)現(xiàn)動態(tài)資源分配、負(fù)載平衡、更快的配置和自動化網(wǎng)絡(luò)管理,這對運(yùn)營效率產(chǎn)生巨大影響。第三,借助光纖連接,vRAN可以將多個基站匯集到一個集中式服務(wù)器池中,從而降低5G基礎(chǔ)設(shè)施的成本和復(fù)雜性。
通過使計(jì)算能力更接近最終用戶及其設(shè)備,vRAN可以促進(jìn)邊緣計(jì)算,同時減少延遲并提高性能。
但為了充分發(fā)揮其潛力,vRAN需要計(jì)算平臺能夠支持高吞吐量、低延遲和確定性的無線電信號處理,同時保持非常高的計(jì)算效率。它還需要高速網(wǎng)絡(luò)接口來處理服務(wù)器、無線電和終端設(shè)備之間的大量數(shù)據(jù)流量,這進(jìn)一步強(qiáng)調(diào)了對變革性方法的需求。
當(dāng)今的5G數(shù)據(jù)中心:CPU和DPU
傳統(tǒng)通用CPU無法處理5G vRAN堆棧復(fù)雜且多樣化的工作負(fù)載。通過將所有網(wǎng)絡(luò)功能虛擬化為軟件,包括操作系統(tǒng)、網(wǎng)絡(luò)層、應(yīng)用程序和協(xié)議,數(shù)據(jù)中心內(nèi)的流量急劇增加,從而降低了CPU效率。為了應(yīng)對這一挑戰(zhàn),CPU需要一個補(bǔ)充性的專用加速設(shè)備,可以卸載CPU的網(wǎng)絡(luò)任務(wù),以提高性能和效率。當(dāng)今5G數(shù)據(jù)中心最流行的加速設(shè)備之一是數(shù)據(jù)處理單元 (DPU)。
5G 基礎(chǔ)設(shè)施中的人工智能(來源:Arm)
DPU是具有嵌入式處理器或可編程邏輯的網(wǎng)卡,可以執(zhí)行網(wǎng)絡(luò)功能,例如數(shù)據(jù)包處理、加密/解密、壓縮/解壓縮、負(fù)載平衡、防火墻、路由/交換和服務(wù)質(zhì)量 (QoS)。DPU可以通過接管部分網(wǎng)絡(luò)相關(guān)任務(wù)來幫助降低服務(wù)器的CPU利用率和功耗,從而實(shí)現(xiàn)根據(jù)不同場景配置和優(yōu)化網(wǎng)絡(luò)功能的靈活性和可編程性。
異構(gòu)計(jì)算為未來的工作負(fù)載增加了更多靈活性
雖然當(dāng)今的5G數(shù)據(jù)中心已經(jīng)利用CPU和DPU來支持vRAN和其他5G應(yīng)用,但下一代5G數(shù)據(jù)中心將需要在硬件架構(gòu)、軟件平臺和服務(wù)模型方面提供更大的靈活性。例如,數(shù)據(jù)中心可能使用GPU來處理復(fù)雜的數(shù)學(xué)、圖形、視頻或其他大型數(shù)據(jù)集;用于機(jī)器學(xué)習(xí)工作負(fù)載的GPU或TPU;以及用于可編程邏輯的FPGA,以解決更多自定義工作負(fù)載。
這種類型的異構(gòu)計(jì)算有助于提高融合智能邊緣數(shù)據(jù)中心的性能、效率和可擴(kuò)展性,這些數(shù)據(jù)中心可以提供更接近最終用戶的RAN服務(wù)、云計(jì)算能力和人工智能應(yīng)用服務(wù)。最終,將更專業(yè)的計(jì)算移至更靠近設(shè)備和最終用戶的位置,可以改善延遲并實(shí)現(xiàn) 5G 所承諾的許多下一代用例。
軟銀、英偉達(dá)和Arm最近宣布合作,旨在為人工智能和高性能計(jì)算 (HPC) 創(chuàng)建世界上最先進(jìn)的數(shù)據(jù)中心。它是當(dāng)前此類數(shù)據(jù)中心轉(zhuǎn)型的最佳示例之一,具有專門的處理功能。此次合作預(yù)計(jì)將為基于Nvidia GH200 Grace Hopper超級芯片的生成式AI和5G/6G應(yīng)用提供一個開創(chuàng)性的平臺,軟銀計(jì)劃在日本各地新的分布式AI 數(shù)據(jù)中心推出該平臺。與過去使用的數(shù)據(jù)中心相比,新數(shù)據(jù)中心的分布將更加均勻,并可處理人工智能和5G 工作負(fù)載。這將使他們能夠以低延遲更好地以峰值容量運(yùn)行,并大幅降低總體能源成本。
軟銀將與Nvidia合作建立數(shù)據(jù)中心,為在全球范圍內(nèi)快速部署生成式AI應(yīng)用和服務(wù)鋪平道路,該數(shù)據(jù)中心可以在多租戶通用服務(wù)器平臺上托管生成式 AI 和無線應(yīng)用,從而高效節(jié)能、降低成本并提供更多服務(wù)。
此類創(chuàng)新代表了5G和人工智能的重要拐點(diǎn)。整個數(shù)據(jù)中心圍繞專業(yè)處理提供的目標(biāo)性能而構(gòu)建,為運(yùn)營商提供實(shí)現(xiàn)vRAN潛力所需的運(yùn)營效率。此外,專業(yè)處理使運(yùn)營商能夠在同一物理位置共同托管計(jì)算密集型服務(wù),例如人工智能或3D視頻會議 - 更靠近數(shù)據(jù),更靠近用戶。這一點(diǎn)至關(guān)重要,因?yàn)殪`活性、低延遲和性能效率確保了計(jì)算資源及其所需資本和能源成本的最佳利用,從而改變了整個數(shù)據(jù)中心的TCO(總擁有成本)。
當(dāng)我們展望下一代5G數(shù)據(jù)中心時,對靈活高效的計(jì)算平臺的需求至關(guān)重要。為了滿足在 5G 和人工智能的推動下對數(shù)據(jù)中心服務(wù)不斷增長的需求,下一代數(shù)據(jù)中心將被定義為適應(yīng)新技術(shù)和工作負(fù)載的能力,并提供企業(yè)和消費(fèi)者所需的性能和效率。因此,我們將繼續(xù)將高效、專業(yè)的芯片視為該領(lǐng)域創(chuàng)新和轉(zhuǎn)型的基礎(chǔ)。