美國阿貢國家實(shí)驗(yàn)室近日宣布,其傾力打造的Aurora超級(jí)計(jì)算機(jī)已全面投入使用,并向全球科學(xué)界敞開大門。這臺(tái)備受矚目的超級(jí)計(jì)算機(jī),自2015年首次公布以來,歷經(jīng)多次波折,終于迎來了它的輝煌時(shí)刻。
Aurora超級(jí)計(jì)算機(jī)原本計(jì)劃在2018年完成,然而,由于英特爾Xeon Phi處理器的停產(chǎn),項(xiàng)目遭遇了重大挫折。隨后,英特爾7nm工藝的延遲更是讓Aurora的開發(fā)進(jìn)程一拖再拖,直至2023年才得以完成。盡管硬件在2023年6月便已安裝就緒,但系統(tǒng)直至2024年5月才真正達(dá)到了Exascale級(jí)別的性能,此前僅對(duì)少數(shù)特定研究人員開放。
Aurora超級(jí)計(jì)算機(jī)以其強(qiáng)大的計(jì)算能力脫穎而出,它提供了超過1 FP64 ExaFLOPS的模擬計(jì)算能力,并在人工智能和機(jī)器學(xué)習(xí)領(lǐng)域展現(xiàn)出驚人的性能,達(dá)到了11.6混合精度ExaFLOPS。這一成就得益于其卓越的硬件配置,Aurora由166個(gè)機(jī)架組成,每個(gè)機(jī)架包含64個(gè)計(jì)算節(jié)點(diǎn),總計(jì)擁有10624個(gè)計(jì)算節(jié)點(diǎn)。
每個(gè)計(jì)算節(jié)點(diǎn)都配備了兩個(gè)Xeon Max處理器和64GB HBM2E內(nèi)存,同時(shí)搭載了六個(gè)英特爾數(shù)據(jù)中心Max“Ponte Vecchio”GPU。這些高性能組件通過液冷系統(tǒng)實(shí)現(xiàn)了高效散熱,確保了系統(tǒng)的穩(wěn)定運(yùn)行。Aurora還擁有21248個(gè)CPU和110萬個(gè)x86核心,配備了驚人的19.9PB DDR5內(nèi)存和1.36PB HBM2E內(nèi)存。
Aurora還配備了63744個(gè)針對(duì)AI和HPC優(yōu)化的GPU,總共擁有8.16PB的HBM2E內(nèi)存。系統(tǒng)使用了1024個(gè)節(jié)點(diǎn),配備了高達(dá)220PB的存儲(chǔ)容量和31TB/s的帶寬。為了實(shí)現(xiàn)高效的數(shù)據(jù)傳輸和通信,Aurora采用了HPE的Shasta架構(gòu)與Slingshot互連技術(shù)。
Aurora超級(jí)計(jì)算機(jī)的全面投入使用,標(biāo)志著全球科學(xué)界在計(jì)算能力方面邁出了重要一步。它將為科研人員提供更加強(qiáng)大的計(jì)算支持,推動(dòng)科學(xué)研究的深入發(fā)展。同時(shí),Aurora的成功也展示了人類在追求高性能計(jì)算領(lǐng)域的不懈努力和卓越成就。