近期,AMD在ROCm開(kāi)源軟件堆棧方面邁出了新的一步,發(fā)布了備受期待的6.4.0版本。這一消息源自外媒Phoronix的報(bào)道,發(fā)布時(shí)間為當(dāng)?shù)貢r(shí)間4月11日。
此次更新的一大亮點(diǎn)在于,ROCm 6.4.0正式將Radeon PRO W7800 48GB顯卡納入支持范圍。然而,值得注意的是,盡管呼聲很高,新版本尚未全面支持“RDNA 4”架構(gòu)的獨(dú)立顯卡以及“Strix Halo”處理器的大規(guī)模核顯,這對(duì)于部分高端用戶(hù)來(lái)說(shuō)或許稍顯遺憾。
除了顯卡支持方面的更新,ROCm 6.4.0還帶來(lái)了一系列技術(shù)改進(jìn)。其中,Megatron-LM框架在ROCm版本中新增了多項(xiàng)融合功能,包括融合注意力機(jī)制、融合層范數(shù)以及融合旋轉(zhuǎn)式位置編碼RoPE內(nèi)核支持,這無(wú)疑將進(jìn)一步提升人工智能模型的訓(xùn)練效率。
在兼容性方面,ROCm 6.4.0也展現(xiàn)出了強(qiáng)大的實(shí)力,同時(shí)支持PyTorch的2.6和2.5版本,為用戶(hù)提供了更多的選擇空間。新版本中的rocDecode和rocPyDecode還新增了對(duì)VP9編解碼的支持,進(jìn)一步豐富了ROCm的應(yīng)用場(chǎng)景。
對(duì)于使用Instinct加速器的用戶(hù)來(lái)說(shuō),ROCm 6.4.0同樣帶來(lái)了好消息,它新增了對(duì)Oracle Linux 9操作系統(tǒng)的支持,使得用戶(hù)能夠在更多的平臺(tái)上享受到ROCm帶來(lái)的性能提升。
想要了解更多關(guān)于ROCm 6.4.0的信息,用戶(hù)可以前往AMD官網(wǎng)的相關(guān)頁(yè)面進(jìn)行查閱。AMD在官方文檔中詳細(xì)列出了新版本的各項(xiàng)功能和改進(jìn),以及已知的問(wèn)題和解決方案,為用戶(hù)提供了全面的參考。
AMD還預(yù)告將在即將舉行的Advancing AI 2025活動(dòng)中分享AMD ROCm開(kāi)放軟件生態(tài)系統(tǒng)的最新進(jìn)展。這無(wú)疑將吸引更多關(guān)注ROCm的用戶(hù)和開(kāi)發(fā)者的目光,共同期待ROCm在未來(lái)能夠帶來(lái)更加出色的表現(xiàn)。