在科技浪潮的推動(dòng)下,安徽蕪湖迎來了華為云生態(tài)大會2025的盛大召開。會上,華為常務(wù)董事及云計(jì)算業(yè)務(wù)掌舵人張平安透露了AI基礎(chǔ)設(shè)施架構(gòu)的最新進(jìn)展,并隆重推出了CloudMatrix 384超節(jié)點(diǎn),這一創(chuàng)新成果已在蕪湖數(shù)據(jù)中心成功部署。
CloudMatrix 384超節(jié)點(diǎn)標(biāo)志著華為云在資源供給模式上的重大飛躍,從傳統(tǒng)的服務(wù)器級躍升至矩陣級。該超節(jié)點(diǎn)憑借“高密”、“高速”、“高效”的卓越特性,通過一系列架構(gòu)創(chuàng)新,在算力、互聯(lián)帶寬及內(nèi)存帶寬等多個(gè)維度均實(shí)現(xiàn)了行業(yè)領(lǐng)先。這一突破無疑為AI應(yīng)用提供了更為強(qiáng)大的底層支撐。
華為云在昇騰AI云服務(wù)上的持續(xù)優(yōu)化也備受矚目。目前,該服務(wù)已全面適配超過160個(gè)第三方大模型,其中不乏DeepSeek等重量級產(chǎn)品。這一舉措為大模型的訓(xùn)練與推理提供了堅(jiān)實(shí)保障,加速了行業(yè)應(yīng)用的落地進(jìn)程。華為云盤古大模型已在30余個(gè)行業(yè)、400多個(gè)應(yīng)用場景中大放異彩,特別是在城市治理、智慧金融、醫(yī)療健康及氣象預(yù)測等領(lǐng)域,其廣泛應(yīng)用展現(xiàn)了強(qiáng)大的行業(yè)賦能能力。
與此同時(shí),硅基流動(dòng)攜手華為云,基于CloudMatrix 384超節(jié)點(diǎn)昇騰云服務(wù)與高性能推理框架SiliconLLM,正式上線了DeepSeek-R1服務(wù)。據(jù)硅基流動(dòng)介紹,該服務(wù)在確保單用戶20 TPS處理能力的同時(shí),單卡Decode吞吐量更是突破了1920 Tokens/s,這一性能表現(xiàn)足以媲美H100部署。更為關(guān)鍵的是,經(jīng)過嚴(yán)格的主流測試集驗(yàn)證及大規(guī)模線上盲測,DeepSeek-R1在昇騰算力部署下的模型精度與官方版本保持高度一致,充分驗(yàn)證了其穩(wěn)定性和可靠性。