7nm RDNA架构加持!AMD NAVI RX 5700系列显卡到底有多强?

百家 作者:微型计算机 2019-06-11 13:00:14

除了现在热火朝天的锐龙系列处理器,作为一家历史悠久的传统芯片公司,凭借实力强劲的研发团队、以及像David Wang、Scott Herkelman等大神的领导带领下,AMD近几年在显卡上也为玩家、消费者带来了不少经典的产品。如首款将 HBM 和芯片堆叠技术集于一身的 AMD Radeon R9 和 R7 300 系列显卡、业内首款采用7nm工艺的GPU,即7nm Radeon Vega 架构的专业/数据中心 GPU;率先实现1TB/s显存带宽的 GPU,即面向数据中心的 AMD Radeon Instinct MI60 超快速、高扩展性、双精度的 PCIe 加速器。而在本次“AMD NEXT HORIZON GAMING TECH DAY”游戏技术大会上,倍受关注的AMD NAVI显卡也终于揭开了它神秘的面纱,为玩家带来了巨大的惊喜。


从GCN到RDNA AMD NAVI系列显卡技术解析

▲AMD 全球副总裁Radeon游戏产品部总经理Scott Herkelman

▲AMD技术事业部工程研发高级副总裁David Wang

▲AMD企业院士兼首席GPU架构师Mike Mantor


首先在会上,AMD全球副总裁Radeon游戏产品部总经理Scott Herkelman、AMD技术事业部工程研发高级副总裁David Wang,以及AMD企业院士兼首席GPU架构师Mike Mantor等专业人士为我们对AMD新一代NAVI显卡进行了详细介绍。与上一代产品相比,它主要有以下不同,包括:

1.采用来源于GCN,但做出大幅改进、增强的RDNA架构;

2.采用更快、更小、拥有更多晶体管,但能耗比更高的7nm生产工艺;

3.更快GDDR6显存,相对GDDR5显存,带宽提升2倍;

4.采用PCIe 4.0接口,相对于PCIe 3.0显卡,接口带宽也提升了2倍;

5.采用具有更高解码与编码码率的Radeon媒体引擎

6.可以实现3倍无损压缩的Radeon显示引擎

首先在计算单元组成上,RDNA架构与GCN架构由显著的不同。在GCN架构上原来是一个CU里含有4组16个流处理器(也就是SIMD16),共计64个流处理器,并搭配相应的标量、向量单元、调度器与寄存器;而在RDNA架构中,这64个流处理器被分为了两组,每组32个也就是说实现了SIMD32,并配备两倍数量的标量单元,两倍数量的调度器与向量单元。

这有什么好处呢?简单来说在执行已经在很多游戏中应用的Wave64指令时,GCN架构需将这个Wave64指令拆分为4个SIMD16。由于只有一个调度器,所以需要等待前面一个SIMD16单元完成运算时才能进行下一个,所以完成这条指令需要4个时钟周期,各流处理器在整个运算周期里的利用率只有25%。而如由RDNA架构来执行该指令,它则可以将该指令拆分为两个Waver32即两个SIMD 32,并通过两个调度器将运算同时分配给这两组流处理器单元,这使得这一条Wave64指令只需要一个时钟周期就可完成,流处理器单元在运算单元中的利用率达到了100%。同理在执行Wave32指令时,RDNA架构也只需要一个时钟周期,GCN架构同样需要等待一个时钟周期。因此简单地说RDNA架构具备更高的运算效率。

在缓存方面,RDNA架构也进行了大幅改进,包括加入128KB、16路L1缓存,将L0缓存与流处理器之间的载入带宽提升了2倍,大幅降低了缓存、显存的延迟。同时它还改进了DELTA COLOR COMPRESSION三色压缩技术的算法,着色器可以直接读取或写入压缩色彩数据,显示引擎可以直接读取压缩色彩数据。

此外,RDNA架构还提升了图形流水线的效率,如通过架构的改进来提升性能,通过使用时钟门控技术来达成更高的能耗比,减少逻辑电平来达到更高的工作频率。最终在相同功耗、相同规模(如相同流处理器数量)配置的环境下,RDNA架构能获得50%的性能提升。这50%的性能提升里有60%要归功于每时钟周期的性能提升,如我们前面介绍的Wave64指令运行效率的提升,有25%归功于7nm生产工艺的采用,15%归功于工作频率与能耗的改进。

虽然目前基于RDNA架构的NAVI GPU主要用于取代Vega56这类定位并不是太顶级的产品,但从绝对性能上来看,它相对于上代旗舰Vega64也有14%的领先,在显示核心面积上更从14nm Vega64的495平方毫米大幅缩减到251平方毫米。

在大家比较关注的光追技术上,RDNA架构目前与GCN架构相同,还是通过着色器来实现,在下一代RDNA架构上才会实现硬件级的支持,毕竟当前支持光追的游戏很少,必要性并不高。另外AMD认为未来的云游戏也是体验光追游戏一个好的解决方案,通过远端的云计算来实现光追效果,这样对终端用户的硬件设备要求就不会有多高。


降低延迟、提升画质、拒绝模糊,三大黑科技加身

虽然暂时没有光追效果,但在NAVI架构上,AMD还是带来了三大功能方面的黑科技,首先是ANTI-LAG,它可以降低玩家按下鼠标、键盘后,游戏角色进行相应动作执行的响应时间,其主要原理是减少了处理器执行环节的等待时间。根据AMD的数据《守望先锋》的延迟从30ms降低到21ms、《堡垒之夜》的延迟从54ms降低到36ms,《绝地求生:大逃杀》的延迟从48ms降低到33ms。对于使用这些竞技游戏的玩家来说肯定是一个巨大的好消息,这意味着在对战中,他们有比对手更快的反应,取胜的概率更高。

另外一大改进是AMD带来了RIS Radeon图形锐化功能,这是一个驱动级别的功能,可以支持几乎所有游戏,只要在驱动打开即可实现。该功能通过对对比度的调节、锐化来改善在开启抗锯齿环境下的图像清晰度。如上面这张图中,开启、关闭RIS功能前后的岩石清晰度、表面细节完全是天壤之别。此外开启该功能后,只会带来不到2%的性能损失。

此外,AMD还在寻求在部分游戏中加入FIDELITY FX即高清晰效果的功能,该功能与RIS功能类似,但它将内置在游戏中,通过游戏里的菜单来打开或关闭。与RIS相比,FIDELITY FX的锐化效果被称为CAS对比度适应锐化功能,CAS将带来比RIS更精准的清晰度,毕竟这是AMD与游戏厂商一对一合作的成果,同时还可在专属游戏中加入更多后期效果。目前包括F1 2019、《无主之地3》等游戏大作都实现了对FIDELITY FX的支持。基于NAVI与VEGA架构的显卡都可以开启该功能。

▲需要提醒玩家的是,预计在今年7月7日发布的ADRENALIN 19.7.1版本驱动就可支持以上功能,大家一定要记得去更新驱动哦。


7nm高能耗比,Radeon RX 5700系发布

▲AMD总裁兼首席执行官苏姿丰博士、AMD全球副总裁Radeon游戏产品部总经理Scott Herkelman都在会上展示了Radeon RX 5700XT显卡。


最后还是让我们来看看基于NAVI架构的实际显卡,此次AMD在会上发布了两款产品——Radeon RX 5700XT与Radeon RX 5700,它们分别对标NVIDIA的RTX 2070、RTX 2060。两款显卡的区别在于Radeon RX 5700XT拥有40组CU即2560个流处理器,更高的工作频率。而Radeon RX 5700显卡的CU则减少到36个,流处理器数量为2304个,同时工作频率也要略低一些。此外两款显卡都配备了8GB GDDR6显存,64个ROP光栅处理单元、256个材质单元。

▲Radeon RX 5700XT显卡实物与内部结构图

▲Radeon RX 5700显卡实物图

TDP上,Radeon RX 5700XT为225W,Radeon RX 5700为180W,相对于对标显卡要略高一点,但增加幅度不多。而这也使得显卡对供电的要求并不高,如Radeon RX5700XT仅需一个8pin与一个6pin接口,7相数字供电就能满足对电源的需求。

而在性能上,Radeon RX 5700XT不仅大幅领先上代RX Vega 56显卡,更在大部分游戏中实现了对RTX 2070显卡的领先。同样的结果也出现在了Radeon RX 5700上,根据AMD官方公开的数据,Radeon RX 5700在展示的所有游戏测试中,都取得了对RTX 2060的领先。

目前这两款显卡都将在今年7月上市,价格方面,5700 XT售价449美元,5700售价379美元。《微型计算机》预计其在国内的销售价格也与RTX 2070、RTX 2060相当,甚至略便宜一点,毫无疑问,只要价格合适,而且这两块显卡在性能上的表现还更具有竞争力,那么基于NAVI核心的Radeon RX 5700系列显卡必将成为今年暑期中高端显卡市场上的两大新热门。


关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接