AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

核心提示作为各家新处理器、新显卡平台中最后一个登场的,AMD RDNA3架构的RX 7000系列显卡终于来了!新品正式解禁上市前,AMD也向快科技分享了诸多细节,包括芯

作为所有新处理器和新显卡平台的最后一款,AMD RDNA3架构的RX 7000系列显卡终于来了!

在新品正式上市之前,AMD也和快科技分享了很多细节,包括芯片设计、架构布局、技术特点等。让我们一起先睹为快吧!

AMD全球高级副总裁、大中华区总裁潘晓明表示,AMD一直致力于为发烧友和游戏市场带来优秀的镭龙显卡,用不断提升的图形能力让用户获得极致体验,用一个又一个优秀的产品引领行业进入高性能新时代。

对于全新的RX 7000系列显卡,潘晓明充满期待和期待,并强调AMD将一如既往的为广大玩家和行业带来优秀的产品,满足时代的需求。

AMD技术部门工程研发高级副总裁王表示,AMD的愿景是为全球数十亿游戏玩家提供更好的游戏体验,包括处理器、显卡、云游戏服务、PS5、Xbox Series X/S、Valve Steam Deck,以及最新的特斯拉电动汽车,从而将游戏体验带入汽车市场。

好,那就进入RDNA3的奇妙世界吧。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

众所周知,如今的高端GPU越来越复杂庞大,晶体管数量以百亿计。尽管有更先进技术的加持,但性能提升的同时功耗却在飙升,所以一定不能设计夸张的散热方案,甚至水冷也是必不可少的,导致能效比(性能每瓦)非常差。

AMD RDNA自诞生以来一直是一个极其节能的GPU架构。相比之前的Vega架构,第一代能效提升高达50%,RDNA2能效提升54%。现在RDNA3又增长了54%,再一次超过了当初的设计目标!

随着三代RDNA架构的发展,能效累计提升超过350% ,这是整个GPU历史上的奇迹。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

RDNA3架构最大的创新之一就是AMD锐龙和EPYC成功的小芯片设计首次引入GPU

AMD将一个完整的大芯片按照功能模块划分成不同的小芯片,每个小芯片采用最合适的制造工艺,然后通过带宽高达5.3TB/s的高性能扇出封装将它们互联起来,组合成一个有机的整体。

RDNA3家族的顶级核心Navi 31包括一个GCD和六个MCD。

其中,GCD,即图形计算管芯,包括计算单元、显示单元、媒体单元等。采用先进昂贵的5nm制造工艺,面积约为306平方毫米

MCD也称为内存高速缓存芯片,包括视频内存和无限高速缓存。采用成熟的6nm制造工艺,单块面积约为37.5平方毫米

Navi 31核心总面积约531平方毫米,共有577亿个晶体管。集成密度约为1.1亿个晶体管/平方毫米。

相比之下,RX 6900系列使用的Navi 21核心是单芯片设计,TSMC有7nm,268亿个晶体管,面积为519平方毫米,集成密度约为5160万个晶体管/平方毫米。

换句话说,Navi 31的总面积几乎不变,晶体管数量和密度增加了一倍。

相比之下,NVIDIA RTX4090A102内核还是单芯片,TSMC 4N工艺(本质上也是5nm),608mm2,763亿个晶体管,集成密度1.26亿个/mm2。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

MCD部分比较简单,64位GDDR6内存控制器,16mb无限缓存,频率2.3GHz

六片384位,96MB规格,总带宽高达5.3TB/s,比RDNA2架构高2.7倍。

其中384位20GHz GDDR6内存提供的带宽高达960GB/s,其余80%以上来自Infinity Cache。

那么,为什么不用更高频率的GDDR6X显存呢?

王指出RDNA 3架构旨在提高能效,而GDDR6X内存需要更高的电源来维持更高的带宽。AMD Infinity Cache等创新技术,配合GDDR6,能够以更低的功耗实现更高性能的显存带宽。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

GCD可以分为三个部分,分别是统一计算单元、显示引擎和双媒体引擎,都是新设计的。

接下来,我们就来逐一看看这三件作品。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

CU计算单元仍然是RDNA3的基本构建模块,但这一次它呈现出新的面貌,有了一个新的名字,叫做“统一计算单元”。

什么是团结?即图形渲染、光线追踪和人工智能可以共享所有计算资源,并在单位功耗和单位面积上提供更高的性能。

计算单元的内部可以分成几个不同的功能模块。首先,是VGPR(通用寄存器),负责资源共享和调度分配。与RDNA2相比,其容量增加了50%,从而提高了所有功能的性能。

顺带一提,计算单元的集成度非常高,单位面积的晶体管数量比上一代增加了165%。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

丢失的处理器模块,RDNA3架构前进了一大步,采用Dual Issue,即双向发射设计,可以同时向Wave32 SMID单元发送两条不同的指令。

根据需要,该指令可以是整数、浮点或AI。

这直接将指令分配的效率提高了一倍,更好地利用了计算单元中的所有功能,实现了更高的性能和能效。此外,混合指令的使用更加灵活和高效。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

RDNA3也大大加强了AI。每个计算单元有两个AI加速器,并加入了新的AI指令来提高AI的吞吐量。整体性能提升超过2.7倍,可以轻松满足当前和未来AI加速场景的需求。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

光线追踪也进化成了新一代。可实时跟踪的射线数量增加了1.5倍之多。还有新的光线跟踪指令集和新的光线盒排序和遍历算法。

最终RDNA3每个计算单元的光学跟踪性能提升了50%之多,虽然不能说超越了竞争对手,但至少已经大大缩小了差距。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

RDNA3架构还设计了新的“解耦时钟”机制,也就是说shader和前端的工作频率是相互独立的,它们都运行在最合适的频率上。

其中前端频率2.5GHz,比上一代提升15%,可以更高效的处理工作量。着色器频率为2.3GHz,更加节能,可节省高达25%的功耗。

这种设计也为整体能效做出了巨大贡献。

总的来说,经过一系列的改进,RDNA3的计算性能提升了整整2.7倍,浮点运算能力达到了61TFlops(每秒61万亿次计算)。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

多媒体一直是AMD GPU的强项,各种新技术新标准总会优先尝试。

RDNA3集成了全新的Radiance显示引擎,不仅支持HDMI 2.1a,还在业界率先支持最新的DisplayPort 2.1视频输出标准,包括UHBR 13.5,现在距离新标准正式发布还不到一个月!

DP 1.2可提供高达54Gbps的显示链路带宽,足以支持8K165Hz、480Hz、2K900Hz超高清高刷显示输出。它还可以渲染惊人的680亿种颜色,每通道12位色深。

支持这样的超高分辨率和超高刷新率,不仅可以显示更丰富、更高质量的视频内容,也更适合超高帧率游戏。

RX 7900系列本来是为了未来的4K游戏,但是在目前主流的2K分辨率下,很多游戏都可以跑出超高的帧率,比如《守望先锋2》超过600FPS,《无畏契约》超过800FPS。使用DP2.1可以让游戏帧率和显示器刷新率匹配的更好,让游戏体验更丝滑。

戴尔、三星、华硕、LG、宏碁等。都是在开发DP 2.1接口的显示器,预计从2013年初开始陆续上市。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

最后,是全新的双媒体引擎,频率提升高达80%。首次加入了对AV1格式的支持,可以编解码8K60。

目前所有GPU方案已经全面支持AV1,随着移动SoC的跟进,硬件平台已经全面到位。

另外,RDNA3还支持AVC和HEVC(H.265)格式的同步编解码,效率更高。介绍了人工智能增强的视频编码,包括码流预分析和码流预滤波。

值得一提的是,RDNA3架构还支持全新的SmartAccess视频协同编解码技术,可以在锐龙处理器和镭龙显卡之间智能划分解码和编码工作负载,在4K分辨率的多流编码中可以提供高达30%的性能提升。

总结一下RDNA3 Navi 31 GPU的主要亮点:

1.小芯片设计首次将频率提升了15%,能效提升了54%。

2.峰值带宽提升2.7倍,浮点性能高达61TFlops。

3.统一计算单元,每个时钟周期发射双指令。升级光学跟踪装置,加入人工智能装置。

4.全新的显示和媒体引擎,完全支持DP 2.1输出和AV1编解码器。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

在游戏功能方面,重点是AMD FSR。

截至10月底,AMD FSR超分辨率技术已经覆盖216款游戏,其中85款为最新的FSR 2.x

下一个“小”版本是FSR 2.2,它专注于进一步提高图像质量,例如减少快速移动物体的重影。也是基于时域放大算法,不需要依赖AI或者专用的AI硬件。极限竞速:地平线5首次支持。

下一个大”版本是FSR 3,它支持全新的AMD Fluid Motion帧技术,与FRS 2相比,预计将带来高达2倍的帧率提升。它于2023年推出,是英伟达DLSS 3的积极基准。

前两种产品,然后审查主要规格:

RX 7900 XTX:

96个运算单元,96MB Infinity缓存,核心游戏主频2.3GHz,最高2.5GHz,配合384位24GB GDDR6内存,等效频率20GHz,全卡功耗355W W。

RX 7900 XT:

84个计算单元缩减1/8,Infinity Cache缓存缩减至80MB,核心游戏和加速频率分别降低至2.0GHz和2.4GHz,内存位宽缩减至320位,容量为20GB,整卡功耗也降低至300W。

值得一提的是,上一次AMD(ATI)以XTX”命名其旗舰显卡,距离2006年的镭龙X1950 XTX和X1900 XTX已经过去了16年。

AMD表示选择让XTX品牌回归,意在向世界宣告RX 7900 XTX将是AMD更强大的显卡。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

RX 7900系列的公版设计基本延续了RX 6900系列的风格,三个风扇,标配2.5槽厚,长度从276mm略微延伸到287mm,不会增加机箱兼容的难度。

辅助电源接口还是两个标准的PCIe 8针,但是为了保证兼容性和安全性,没有使用新的PCIe 5.0 12VHPWR 16针接口,容易莫名其妙烧坏。同时的供电能力从330W提升到355W,可以提供更丰富的/[K0/]。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

业绩方面,先看一些官方数据再解禁。

与RX 6950 XT相比,RX790XTX4K游戏性能最高可提升70%,大量游戏可提升50%。

RX 7900 XT还能带来高达50%的性能提升。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

光学性能也有了很大的进步。凭借4K分辨率和超高的图像质量,赛博朋克2077、消失的光和杀手3等游戏可以带来50-80%的性能飞跃,所有这些都轻松超过60FPS的平均帧率。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

显卡将于12月13日正式上市。RX 7900 XTX售价仅为7999元,比RTX 4090便宜近40%。预计和RTX 4080基本在一个档次,但性能会明显碾压后者。

RX 7900 XT售价7399元,势必会对只有192位显存的RTX 4070 Ti造成很大压力。

王还强调,AMD的理念是让发烧级的、面向未来的显卡以相对接近的价格面世,让更多游戏玩家有全新的体验。

华清、华硕、技嘉、微星、韩勋、蓝宝石、韩凯、景讯、盈通等品牌将在第一时间发布旗下RX 7900系列显卡,同步上市。

备货方面,AMD表示整个团队都在夜以继日的准备货源,预计会比较充足,但不排除玩家热烈追捧,初期供需偏紧。