热门推荐
【硬件资讯】前路阴云笼罩……末代RDNA的AI之路崎岖难行,仍未能加入ROCm生态?
2025-04-29 15:54

AMD宣布,对ROCm软件栈进行了更新,推出了新的迭代版本ROCm 6.4。这一新版本里,AMD带来了多项底层改进,包括更新改进了ROCm的用户空间库和AMDKFD内核驱动程序之间的兼容性,使其更容易在更广泛的Linux内核上运行。可惜的是,这次仍然缺乏对RDNA 4架构GPU的支持。

图片

AMD还扩大了内部测试,以涵盖更多用户和内核版本的组合,这应该会减少高性能计算(HPC)和人工智能(AI)工作负载的集成问题。在框架方面,ROCm 6.4现在支持PyTorch 2.5/2.6开箱即用,开发人员无需从源代码开始构建,就可以使用最新的深度学习功能。Megatron‑LM集成增加了三个新的融合内核,包括Attention (QKV)、Layer Norm和ROPE,通过将多个操作合并到单个GPU通道中来加速训练。

视频解码也得到了提升,在rocDecode和rocPyDecode中都支持VP9。同时现在已正式支持Oracle Red Hat Enterprise Linux 9,Radeon PRO W7800 48GB工作站显卡可在ROCm下进行验证。AMD还在NPS4内存配置下启用了CPX模式,以满足MI Instinct系列加速器上的高级内存带宽需求。

AMD已宣布将于太平洋时间2025年6月12日上午9点30分举行“Advancing AI 2025”活动,将讨论AMD对AI的愿景,带来下一代Instinct系列GPU和AMD ROCm开放软件生态系统的进展,届时可以了解到更多详尽信息。

    

    还记得我们在RDNA 4家族两款显卡刚刚发布的时候说的话,两款显卡都是便宜管饱的大显存显卡,16G显存也刚刚好可以用于部分AI项目的部署,待未来支持ROCm之后,一定会大有作为。然后,截止到现在,到刚刚更新的ROCm 6.4版本RDNA 4仍未得到支持……

    AMD玩AI本就不易,如今官方支持也是迟迟未到,难道这末代RDNA真的会成为遗憾的一代?不过对于大部分游戏玩家来说,这倒是完全没有影响,或许真的会成为AI时代不随大流的游戏死忠?




AMD在今年3月初推出了新一代RDNA 4架构的Radeon RX 9070系列显卡,理论上下一批产品应该就是第二季度的Radeon RX 9060 XT,不过RX 9060 XT用的Navi 44 GPU是128bit显存位宽的,所以只能弄出8GB或者16GB显存的版本,这就让RX 9070和RX 9060 XT之间的性能落差会很大,因此有消息指出AMD可能会面向国内市场推出配备12GB显存的Radeon RX 9070 GRE显卡。

图片

根据benchlife报道,目前Radeon RX 9070 GRE 12GB在AIB合作伙伴的规划中,已经准备进入投产阶段,因此很快就会看到相关显卡在国内市场推出。

目前RX 9070 XT和RX 9070都是用256bit显存位宽和16GB GDDR6显存,而RX 9070 GRE从12GB的显存容量就能看出位宽会削至192bit,如果所用的显存速率依然是20Gbps的话,带宽会降低至480GB/s,降低了四分之一,除此之外流处理器数量也肯定会比RX 9070的3584个更少。

AMD会根据不同地区的市场情况制定不同的SKU,而国内市场是经常会出这类产品的,比如AMD没有在国内推出的RX 7600 XT转而推出了RX 6750 GRE系列,还有最近刚推出没多久的RX 7650 GRE,而RX 9070 GRE有不小可能会在国内取代RX 9060 XT 16GB的地位,说真的128bit的卡出16GB也不是很有必要。

另外AMD对GRE的定义已经从最初的“Golden Rabbit Edition”变成了“Great Radeon Edition”,所以这些GRE显卡也不一定是只面向国内市场的,此前Radeon RX 7900 GRE就在国外有销售。


    接下来,RDNA 4家族的新成员似乎也快来了。根据消息称,RX 9070系列家族还将迎来一款9070GRE,符合之前的传统用以丰富产品线。不过相比于两位哥哥,这哥9070GRE的显存就要小上不少了,显存带宽也会受到同等的影响,游戏表现上可能……另外,12G显存也有些达不到大部分AI项目端侧部署的门槛了,或许这会是更便宜的游戏之选。



AMD宣布,“Advancing AI 2025”活动将于太平洋时间2025年6月12日上午9点30分举行,届时官方的油管频道会有直播。AMD首席执行官苏姿丰博士以及整个AI生态系统的领导者,将讨论AMD对AI的愿景,带来下一代Instinct系列GPU和AMD ROCm开放软件生态系统的进展,并揭示面向超大规模企业、开发商、初创公司等的AI解决方案的详细信息。

图片

外界期待Instinct MI350系列首款产品,也就是Instinct MI355X。其引入了新一代的CDNA 4架构,采用了台积电(TSMC)的3nm工艺制造,搭配HBM3E,总容量进一步提升到288GB,对应带宽提高到8TB/s,TDP也上升到1000W,计划2025年下半年开始发货。按照AMD之前的说法,Instinct MI355X提供了2.3 Petaflops的FP16和4.6 Petaflops的FP8计算性能,相比前代产品的提升幅度约为77%。此外,新产品还将支持新的数据类型,包括FP4和FP6。

除此以外,AMD还可能会对下一代产品进行简要的介绍,比如Instinct MI400系列。

AMD已经在ROCm软件堆栈上耕耘多年,不断地进行更新,不过从目前情况来看,还远远不够。如果AMD想打破英伟达打造的CUDA生态系统,那么必须在软件上取得更大的突破。暂时还不清楚这次ROCm软件堆栈方面的情况,但是Advancing AI作为AMD在AI领域的重要活动,很大程度能看到其在AI领域的发展走向。


    最后,AMD还宣布了一项AI主题活动——Advancing AI 2025,该活动上AMD有望带来下一代Instinct系列专业加速卡。令人在意的是,本代的CDNA4之后,下一代AMD将把专业领域的CDNA与游戏领域的RDNA重新统合为UDNA,这次如果要介绍下一代Instinct系列专业加速卡的话,很可能会带来UDNA相关技术的信息,或许能提前窥见下一代AMD显卡的身影,大家可以关注一下!



欢迎加入

买电脑讨论群:386615430