精品国产av一区二区三区,国产av一区二区三区,丰满少妇大乳高潮在线,9lporm自拍视频区九色

當前位置:首頁 > 最新資訊 > 行業資訊

AI的進一步發展,或將改變超級計算機排名格局?

AI的進一步發展,或將改變超級計算機排名格局?

關注最新一期全球超級計算機榜單的意義在于未來,而非過去。整整六個月以來,榜單位次基本沒有多大變化,而即將于本月公布的最新榜單可能最終打破這死水微瀾的半年。驅動這波變化的,當然要歸功于云系統和AI系統的涌入。兩股新勢力正令超算排名逐漸偏離其最初目標,在高性能計算(HPC)模擬之外開辟出新的算力廝殺戰場。

但這種轉變又在情理之中,甚至可以說是不可避免。畢竟傳統意義上的“高性能計算”就是用Linpack基準測試核查分布式系統的理論算力,但這種簡單粗暴的方式顯然不足以確切反映各國超算系統在商業、學術和模擬/建模任務當中表現出的相對性能。

之前我們已經多次談到,超算500強榜單上經常會有日常處理電信、Web和托管工作負載的高性能機器實例。而隨著商業AI系統的興起,構建這些機器的供應商以及負責托管的企業/國家自然也深為自己掌握的巨量算力而自豪。表面這種自豪的重要方式,就是在機器上運行高性能Linpack基準測試(HPL)。但現實情況是,這些機器很少、甚至幾乎不會運行64位浮點數學運算,就連傳統意義上的HPC負載都接觸不多。全球范圍內存在著成千上萬的超算系統,但榜單只有區區500個名額。HPC社區當然希望在榜單中多引入新選手,借此展示整個生態的蓬勃活力。

當然,從最廣泛的意義上對全球超算系統進行排名也無可厚非。但我們認為AI社區還需要一些門檻更低的選項,比如說多測HPL,這可比AI硬件廠商最喜歡的MLPerf基準測試簡單得多。另外,還應當對基準測試結果做更加嚴格的審核,以證明機器確實在運行HPC或AI負載,而不只是將超大規模服務商、云供應商和電信公司的集群分割出足夠大的一塊,然后粗暴占據Top500榜單中高達三分之一的名額。(HPE和聯想,感謝你們對HPC做出的卓越貢獻,但實際情況就是如此。當然,IBM在2000年左右也有過類似的「霸榜」行為,這里并不是要指責哪家廠商。)

帶著這樣的思考,讓我們一起來看2023年6月的最新一輪Top500超算榜單。雖然很多人確定中國已經建立起了自己的百億億級系統,但其在本次榜單中仍然不見蹤影;Frontier超級計算機的HPL持續性能為1.19百億億次(exaflops),還是目前全球唯一得到認證的百億億級系統。同樣由美國能源部出資建設的勞倫斯利弗莫爾國家實驗室El Capitan系統和阿貢國家實驗室的Aurora系統,也將在今年晚些時候加入百億億級俱樂部。不出意外的話,二者的亮相首秀將是2023年11月的下一次Top500超算排名。

AI的進一步發展,或將改變超級計算機排名格局?

超算系統的性能提升恐怕已經跟不上摩爾定律的預測了。

位列榜首的Frontier系統來自橡樹嶺國家實驗室,是一套由4000多個節點組成的集群,采用定制版“Trento”AMD Epyc CPU和4個AMD“Aldebaran”Instinct MI250X GPU加速器,通過HPE的Slingshot 11以太網實現互連。第二名則是采用富士通A64FX高度矢量化Arm CPU和Tofu D互連系統的“Fugaku”超級計算機。二者的64位浮點運算理論峰值性能分別為1.68百億億次和537.2千萬億次(petaflops)。Fukago比Frontier年長兩歲、發熱量更大,但64位運算的性能只有后者的三分之一強,耗能更高導致其單位計算成本相對更差。作為Fugaku及其身前K超級計算機的所在地,日本RIKEN實驗室掌握著相當全面的超算系統陣容,在Graph500測試和HPCG等高強度工作負載上都把持著最佳能效的桂冠。

芬蘭科學計算中心(CSC Finland)的Lumi系統在本次榜單上位列第三,依靠的就是去年11月升級后獲得的309.1千萬億次持續性能。與Frontier一樣,Lumi系統也是基于HPE架構的Cray EX235a超算,同門師兄弟還有即將亮相的奪冠大熱El Capitan和Aurora。El Capitan將采用Instinct MI300-A的“Antares”混合CPU-GPU計算引擎,該引擎在單一封裝內塞進了2個“Genoa”Epyc小芯片外加6個GPU小芯片。Aurora則擁有2個英特爾“Sapphire Rapids”至強jSP節點,各節點交叉耦合至6個“Ponte Vecchio”Max GPU加速器,CPU與GPU之間使用Xe互連進行對接,再輔以Slingshot 11連接節點。從目前的情況看,HPE顯然特別擅長在準百億億級和百億億級超算中使用Slingshot 11連通各CPU和GPU節點。根據之前的推測,Lumi系統的GPU部分算力應該擴展到了550千萬億次的峰值,但目前還不清楚論斷是否準確。芬蘭科學計算中心只提到,Lumi的GPU部分在Linpack上的持續峰值性能可達到375千萬億次。

來自意大利Cineca超算中心的Leonardo系統由Atos(現更名為Eviden)負責建造,并于去年11月首次上榜。雖然通過升級將設備規模提升了25%,但Leonardo目前在Top500榜單中的排名仍在第四。升級后Leonardo的峰值性能提升19.1%來到304.5千萬億次,而持續Linpack性能則提升36.6%達到238.7千萬億次。

Top500的前十名沒有任何變化,我們也將繼續期待看到更多新的系統和技術發展趨勢。

趨勢和花絮

下面咱們聊聊云計算陣營。微軟Azure提供7個永久(可能是虛擬)集群,負責運行真正的客戶HPC工作負載。這些集群也進入了本輪Top500榜單。這一點非常重要,其中排名第11的Explorer-WUS3系統由48核Epyc 7V12處理器和AMD MI250X GPU組成,服務器節點采用英偉達100 Gb/秒HDR InfiniBand互連,其峰值Linpack性能接近87千萬億次,持續性能則接近54千萬億次。由此可知,其計算效率為62%,跟我們在GPU加速計算系統中常見的65%到70%效率基本持平。而且很明顯,Azure云實例還要配合Hyper-V管理程序運行,所以必然額外消耗一點性能(一切云平臺上的任何管理程序都必然額外消耗性能)。Voyager-EUS2集群自2021年夏季起正式運行,并在當年11月的榜單中位列第十。但其持續30千萬億次的性能很快跌至榜單第16位。微軟的四個Pioneer集群繼續以16.6千萬億次的峰值性能位列40多名;而采用英特爾至強SP CPU加英偉達V100 GPU的HyperCluster設備最初于2019年11月進入榜單,目前仍以2.67千萬億次的持續Linpack峰值性能位列榜單第289位。

微軟的所有HPC集群目前在64位基準測試中的峰值性能在229千萬億次,持續運行性能則為153千萬億次,跟橡樹嶺的“Summit”超級計算機處于同一水平。我們很好奇這7個多云HPC集群到底幫微軟賺了多少錢,目前有沒有收回成本。但唯一可以肯定的,就是全球還沒有哪個國家實驗室的集群能真正創造收入,即使把科研產出算上也不行。如果再加上俄羅斯Yandex的兩個集群和美國亞馬遜云科技Descartes Labs的一個集群,那么6月Top500榜單中全部10個云實例共對應294.1千萬億次峰值性能,在全榜所有超算64位浮點算力總值7.83百億億次中占比3.8%。

雖然看起來比例不高,但請注意:這份Top500榜單只采集主動提交上來的超算系統信息。其他一切已知和未知的HPC設備,無論屬不屬于云基礎設施,都不會被計入進來。這也是我們長久以來最為不滿的點:我們需要一套完整的數據庫,包含對所了解的一切超算設備及其測試性能的全面記錄。如若不然,這樣的榜單反而可能扭曲我們對于現實的認知。(請千萬別誤會,Top500超算榜首提供的數據也很有價值,包括其中的HPCG、Graph500、Green500及其他測試基準。)

我們只是認為HPC集群的云實例其實更多,其中相當一部分屬于云內部設施,且生命周期在三到四年之間。

說到這里,我還想再提點意見。Top500榜單會告訴我們一臺機器排在多少名,每隔半年其成績有何變化,但卻不會直接顯示各位選手在榜單上待了多久。對于傳統超算系統來說,這倒不是個大問題,查詢一下非常方便。但云計算集群就不同了,我們很想知道它們會不會被更快淘汰,至少跟傳統超算相比在生命周期上有何異同。最近一段時間,各大云服務商正在將基礎設施的使用壽命由三年延長到四年、五年甚至是六年——我們強烈懷疑超級計算機的工作周期也在延長,不再一味追求每年定期推出的最新、最強計算引擎。

下面,咱們聊聊在HPC領域重新崛起的AMD和他們的CPU/GPU成果。

AI的進一步發展,或將改變超級計算機排名格局?

在2023年6月榜單上的184位GPU加速選手中,有11位搭載了AMD GPU,167位配備英偉達GPU,另外6位配備其他加速器(例如英特爾Knights協處理器)。AMD在GPU加速系統中的份額為5.9%,英偉達則為90.8%,看來天秤已經徹底傾斜了。但如果具體審視系統中GPU流式多處理器的數量,則AMD的份額為30.3%,英偉達為53.2%——這是因為AMD重回GPU賽道的時間還不長,但目前已經在184位GPU加速選手中占得總體Linpack持續性能份額的49.2%,而英偉達GPU的總和性能反而只有48.6%。

短短幾年間恢復到這樣的水準無疑令人驚嘆,也引得英偉達用Grace-Hopper和Grace-Grace計算引擎施以反擊——前者為CPU-GPU混合引擎,后者則是雙CPU密耦合封裝。

現在我們再看看Top500榜單中的CPU們。以下圖表按時間順序記錄了每一代CPU和各家廠商在榜單中的核心數量:

AI的進一步發展,或將改變超級計算機排名格局?

首先需要注意的是,Top500榜單中各超算系統的總核心數量已接近4000萬,而且過去兩年間一直在迅猛增加。目前AMD的核心份額約在三分之一,而且自2020年來保持著穩步提升。但如果深入研究數據并計算各代CPU核心的性能占比,則AMD在目前這份榜單中的比例僅為24.2%,核心數量占比為35.4%,而各核心帶來的持續Linpack性能份額為51.1%。這些數據均來自Top500數據庫的子列表生成器,但似乎同時計入了CPU和GPU核心的數量和對應性能。不太清楚具體要怎么把純CPU系統剝離出來單獨比較。

在我們看來,如果AMD能在Top500超算榜單的CPU數量上占比超過三分之一,那么這些CPU所對應的性能很可能是榜單總量的40%或者更高一點。自2000年代中后期Opteron達到頂峰以來,AMD在HPC領域從未取得過此等成功。而這一次,AMD不僅要在CPU市場上正面對抗英特爾,還打算在GPU領域跟英偉達一較高下。

最后,Top500超算榜單的守門性能水平為Linpack 1.87千萬億次;要沖擊前100(也就是真正具備HPC承載能力的高容量超算的正式門檻)則為6.32千萬億次。

Top500榜單目前的總算力為5.24百億億次,比去年11月增長了7.8%,較上年同期的4.4百億億次增長了19.1%。

猜你喜歡