AMD Radeon R9 290x怎么样?r9 270x相当于n卡卡什么

AMD显卡新旗舰Radeon&R9&290X超级评测
第1页:“夏威夷”驾到!决战号角吹响
&&&&1个月前AMD在夏威夷召开了新一代显卡的发布会,推出了新一代Radeon
R系列显卡。本月中旬,延续自上代GCN架构的R9 280X、R9 270X、R7
260X先期登场,也是为采用新“Hawaii”(夏威夷)核心的后续顶级产品做了一个热身。今天,日,搭载Hawaii
XT核心的最新旗舰R9
290X在做了最后的准备之后,终于与大家见面了。
<img STYLE="border-bottom:#333 1border-left:#333 1border-top:#333 1cursor:border-right:#333 1" src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//bd4-4b42-beb9-d1d.jpg"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&距离AMD上一代旗舰——HD7970的发布已经快两年了。HD7970摒弃了自R600以来沿用多年的VLIW架构,引入的全新GCN架构在将
近两年的市场考验中表现优秀。同时HD7970所使用的Tahiti核心又是第一块28nm工艺制造的GPU核心,HD7970可以说是一个里程碑式的存
&&&&随后,NVIDIA推出Kepler架构GPU反击,后来甚至将针对并行计算的Tesla
K20使用的GK110核心下放到游戏显卡中,即GTX
Titan,令游戏显卡的竞争在今年达到了一个新的高度。AMD在以双芯片的HD7990重夺显卡王座的同时,也一直在紧锣密鼓的研发新一代的旗舰级显卡
核心,也就是“Hawaii”。
<img STYLE="cursor:" src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//6e159fdb--a2a7-f.jpg" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
从9月初开始,有关R9
290X的各类消息、参数猜测遍布网络,也让大家提前对AMD的新一代旗舰显卡充满期待。而今天开始,一切都将不是秘密。接下来,我们将从核心、功能、性能等各个方面,一步一步为大家详细解析AMD显卡的新旗舰——R9
第2页:定价锁定直接竞争对手为GTX 780
&&首先来看看大家最关心的售价,R9
290X官方公布的中国地区参考售价为4599元,单纯从数字看这是一个正常的定价,符合大多数旗舰显卡问世时的惯例。在之前的传闻中,R9
290X的欧洲定价为649欧元,按照通常美元与欧元在数字上相等的定价策略(欧洲人民好吃亏),美国定价应该是649美元,折合人民币3950元,加上各种税费,最终4599元的中国区售价还是合理的。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//e84edb36-a9f0-4a7b-9bcd-235d.jpg" STYLE="border-width: 1 border-style: border-color: rgb(51, 51, 51); cursor: display:" HEIGHT="835" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&4599元的定价基本上与竞争对手的GTX 780持平甚至稍低一点,显然R9
290X直接对位的是GTX 780,而不是售价高高在上的GTX Titan。以GTX 780为竞争对手,用4599这一合理的价格推出,说明AMD还是很切合实际的。比起做一个成本高昂的性能标杆,R9
290X从成本上控制在正常范围,也让更多玩家能够用得起。
&&&&不过R9
290X真的只有GTX 780级别的实力吗?根据之前一些泄露的测试成绩来看,R9
290X甚至可能有着与GTX Titan相竞争的性能。这样一来R9 290X的表现就很有看头,若R9
290X的性能表现真能与GTX
Titan抗衡,那么无疑相比直接对手GTX 780性能更强,而要是与GTX
Titan相比又具有巨大的价格优势,无论与谁相比都更吸引人。因此我们在后续的性能测试中,也决定除了GTX 780,将GTX
Titan这个「单核心性能标杆」也加入对比,看看R9 290X是否真有与「巨人」(Titan)对抗的能力。
第3页:最高级Hawaii
XT核心规格分析
Hawaii核心继续使用28nm工艺,AMD称目前28nm在高端GPU上可以获得更高的频率,言外之意就是对20nm工艺已经进行了尝试,但似乎其目前的表现还没有达到AMD的预期。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//6a0a2b6b-cf06-409b-89d2-2884cfa3e2e3.jpg" STYLE="white-space: cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
Hawaii核心的晶体管数量达到62亿个,核心面积提高到438&#13215;。它的一大亮点就是搭载了512bit位宽的显存控制器,但Hawaii核心面积并没有大幅提高,比之前的Tahiti核心仅增加20%,与竞争对手采用的GK110核心(核心面积561&#13215;)相比还要小不少,具体来说Hawaii核心面积只有GK110核心的78%。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//e17aa205-c253-4bb6-abc0-a9ac12b69ebb.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
(关于上面这个比较表格,大家需要重点注意的是,运行游戏负载时,R9
290X的实际工作频率约950~1000MHz;GTX Titan的实际工作频率约920~1006MHz(高于官方宣称的BOOST频率876MHz);GTX
780的实际工作频率约
980~1006MHz(高于官方宣称的BOOST频率902MHz);HD7970GHz则稳定在1050MHz。)
&&&&Hawaii核心分为两个版本,R9
290X采用的是最高档的Hawaii XT核心(低一档的Hawaii Pro核心被用于再晚一周上市的次旗舰产品R9
290),它的光栅单元比Tahiti XT核心多了一倍,纹理单元也增加至176个,流处理器达到了2816个,比Tahiti
XT多出了37.5%。R9 290X采用的Hawaii XT核心基本频率定为800MHz,Boost最高可达1000MHz。
290X的显存频率定为1250MHz,GDDR5等效数据频率为5000MHz,似乎稍低了些,但由于Hawaii
XT内置的显存控制器位宽达到了512bit,最终的显存带宽达到320GB/s!倘若未来的非公版R9
290X采用等效6000MHz的显存,显存带宽甚至可能会高达384GB/s。
第4页:Hawaii——改良的GCN架构新核心
&&&&在南方群岛(Southern
Island)一代,也就是HD7900~HD7700系列,GPU架构有了一次巨大的变动:从R600以来一直沿用的的VLIW(Very
Long Instruction Word,超长指令字)架构,变更为GCN架构(GCN全称Graphic Core
Next,即「次世代图形核心」,并不是一个技术上的名称)。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//813dc0b9-d0ff-47d3-9dba-f.jpg" STYLE="border-width: 1 border-style: border-color: rgb(51, 51, 51); cursor: display:"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&#9650; Tahiti
XT(HD7970)核心逻辑架构图
&&&&第一代GCN架构的Tahiti
XT(HD7970)核心拥有32个计算单元(Computing Units,简称CU),每个计算单元中有4个矢量单元(Vector
Units,简称VU)。一个完整的矢量单元由一个16位矢量SIMD(Single Instruction Multiple
Data,单指令多数据&&&&流)和一个64KB寄存器堆(Register
File)组成。一个矢量单元包含有16个ALU(Arithmetic Logic Unit,算术逻辑单元),即流处理器。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//66417e72-cb1c-45de-bddd-acac5edbaa52.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&#9650; Hawaii XT(R9
290X)核心逻辑架构图
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//505148ba-c794-41e5-9a5f-a11707fff29e.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&&#9650;
Hawaii XT核心内分4组流处理器引擎,每组流处理器引擎包含1个几何处理器、1组光栅单元、4个后端渲染器以及11个CU。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//e1cb1db7-798c-41ba-8d7a-363e6c5b1368.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&#9650; 每个CU的组成
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//1f4f929c--9f5c-b91b8b3342e6.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&#9650; 后端渲染器和二级缓存
&&&&此次Hawaii核心的发布,AMD明确表示是GCN架构的改良。虽然基本构成没有变化,但我们看到变更还是不小的。
&&&&首先是Hawaii
XT的流处理器引擎(Shader Engine)由Tahiti XT的两组变为为4组,RB(Render
Back-ends,后端渲染器)也倍增至16个。每组流处理器引擎的CU数减少,但总数增加,达到44个,比Tahiti
XT多了12个。每个CU依然包含64个ALU,算下来ALU(对于AMD显卡即流处理器)总数达到2816个。几何处理器(Geometry
Processor)、光栅单元(Rasterizer)也都划分到了这4组流处理器引擎里,其中光栅单元每组16个,总计64个。&ACE(异步计算引
擎)达到了8个,是Tahiti XT的4倍。显存控制器是6个64-bit,总位宽达到了512-bit。
&&&&在右侧可以看到,以前的交火合成模块(Crossfire
Compositor)变成了新的交火XDMA(相关内容后续详述)。图的右上角为多媒体加速模块,包含VCE视频编码、UVD视频解码引擎之外,还有新的TrueAudio&DSP。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//f10cd6-b7ac-.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&在增加了768个流处理器、1倍的光栅单元、3倍的几何处理器、两组显存控制器等总共19亿个晶体管之后,Hawaii核心面积仅增加了73&#13215;。通过比例我们可以看出,增加了约45.6%的晶体管数量,但芯片面积仅增大了24%。&这样看来,Hawaii的核心密度应该说有了明显增大。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//6fd83edd-35e6-44d6-a5ec-.png" STYLE="cursor: display:" BORDER="0" WIDTH="650"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
& & 与之带来的运算能力提升也非常高效,R9
290X的几何处理能力和像素填充率相比HD7970 GHz几乎翻番,浮点运算、纹理填充也都达到了1.3倍。
第5页:超大位宽512bit显存控制器再度启用
&#9679;512bit显存控制器再度启用
290X的到来印证了此前各种消息,Hawaii果真搭载了512bit显存控制器。历史上仅R600(2900XT)、GT200(GTX280)搭载过512bit的显存控制器。
&&&&提高显存位宽固然会提升GPU与显存之间的数据交换速度,然而代价却往往是高昂的。提高显存位宽需要提高GPU核心显存控制器的位宽,而提高显存
控制器一般而言需要增加大量的晶体管,这也直接导致以往的R600和GT200的核心巨大,这一次AMD再度将512bit显存控制器装入新的GPU中,
应该会注意这一点。
&&&&而实际上我们意外看到了,得益于Hawaii的高密度再加优化设计,512bit显存控制器占用的芯片面积比上一代HDbit还
要小,瘦身幅度达20%。 可见,在显存位宽的提升上,AMD通过精心设计,让我们看到了在芯片规模控制上AMD喜人的成绩。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//e541e669-e09-fc523f160921.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&与此同时,我们也看到显存的频率有所下降,由目前常见的6GHz(6Gbps)左右降至5GHz。即便如此,总带宽也增加了20%以上,达到了320GB/s。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//e7631626-da86-45df-cab0d0e.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&对于AMD来说,增大显存位宽目标显然是为了应对更高的分辨率。目前分辨率的娱乐级显示器已经很便宜,4K显示设备也不再那么
遥不可及,加之三屏等拼接应用方式,分辨率正在几倍几倍的提高。在上一代,HD7970就曾以384bit的位宽在高分辨率下胜过对手,因此可以看出
AMD很重视高显存位宽在高分辨率上的优势。
第6页:淘汰交火桥
新Crossfire效率更高更灵活
&&&&刚刚在架构图中提到,Hawaii的交火合成模块(Crossfire
Compositor)变更为新的Crossfire XDMA。在搭载Hawaii核心的显卡,即R9 290X和R9
290,以及以后推出的新核心显卡,将不再会看到Crossfire桥接器(简称交火桥)的插槽。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//78c4eeec-b384-432a-9a02-b4873cdb4181.png" STYLE="white-space: cursor: display:"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
让我们简单回顾一下Crossfire(下文简称交火)的连接方式:
第一代,X800和X1800、X1900系列,需要一张很难买到且价格昂贵的主卡,两张显卡之间通过特殊一根DMS线缆,将副卡的DVI输出信号传送到
主卡上的一颗合成芯片中,主卡上的合成芯片将主卡计算出的帧与副卡得到最终的完整帧,通过主卡的DVI接口输出至显示器。
第二代,X1300、X1600系列,无需DMS线,副卡的处理结果通过PCI-E传至主卡,且主副卡为同样的普通显卡,没有Crossfire
Edition,被称为软交火,据称这种方式仅适用于低端显卡,用于高端显卡性能损失严重,因此X1800、X1900依然使用第一代交火方式。
第三代,X1950Pro及以后的高端显卡,采用和SLi类似的「桥」,也是沿用至今的交火连接方式。&
到现在为止,一些支持交火的中低端显卡如HD7750,也使用无桥交火,因为通过PCI-E已经可以满足这类显卡之间的通信需求。对于高端显卡一直需要使用桥的主要原因是多块显卡之间的通信带宽不足,而新的XDMA技术的引入则解决了这一问题。从XDMA的名称看,其中DMA是Direct
Memory Access(直接内存存取)的意思,至于X,应该是Cross(交叉)之意。也就是说,这一代交火技术将改变过去多块显卡分别计算,互相交换大量数据的模式,现在多块显卡的显存资源可以互相直接访问,不再需要彼此之间大量的搬运数据后才能实现协作,自然也就不再需要以往那么大的数据交换带宽了,现在直接通过PCI-E交换少量数据即可满足。
多块显卡之间的直接访问对提升效率是很有帮助的,相比分配→计算→合成,这种更接近对称(不会完全对称)的方式更加高效,尤其在延迟上。我
们知道在此前的交火平台上,虽然整体帧数得到提高,但输出的稳定性却较差,画面偶尔卡顿的问题给玩家带来了不愉快的游戏体验。在今年8月份AMD发布的
Catalyst 13.8 beta版驱动中,加入了一项称为「Crossfire Frame
Pacing(交火帧同步)」的功能,意在解决交火平台帧输出的稳定性问题。经过,Crossfire Frame
Pacing的确有着相当程度上的提升。而新的交火技术也肯定会以稳定性的输出为主要改良方向。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//-99dc-4c17-af6e-383cd9ed2137.png" STYLE="text-align: line-height: 1.5; white-space: cursor: display:"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&多卡平台是高分辨率下流畅游戏的保证,AMD开始更加重视交火平台的使用体验了。在推出Crossfire
Frame Pacing技术之后,我们看到AMD又一次在交火上有了动作。同时新的交火不担同样支持Crossfire Frame
Pacing技术,在交火效率上,AMD称双路R9
290X将得到1.87倍的性能,三路则可以得到2.6倍的性能。对于双路的1.87倍,目前已经基本达成,而三卡的效率如果真的能够达到2.6倍,则是一个不小的突破。
&&&&遗憾的是此次送测的R9
290X仅有一块,我们无法验证新的交火效率有多少程度的提高,只能待日后验证。
第7页:低温/静音自己定!R9 290X控制多样
&&&&第一款支持R9
290X的驱动版本为Catalyst 13.11 beta
V5。在安装了驱动程序之后,我们看到催化剂控制面板在性能选项卡上较以往有了较大的变化。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//23cd5f93-c11b-4d3d-b1ee-be79e60018d1.png" STYLE="cursor: border-width: 1 border-style: border-color: rgb(51, 51, 51); display:"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&核心与显存的频率设置皆由以往以MHz为单位的精确值改为百分比。同时在核心
频率设定上,还增加了功率极限的设置,以一个坐标轴表示两者的关系。在这一点上,与NVIDIA自Kepler开始引入的以TDP控制Boost相似,只
不过NVIDIA是以TDP,AMD是以功率。同时在风扇转速设定上,可调节的选项改为目标GPU温度和最大风扇转速。
&&&&为什么要在此介绍新版Catalyst控制面板?因为R9
290X引入了一种「安静模式」。这是基于以上新散热控制方式的设定。我们可以将目标GPU温度设低,最大风扇转速调高,以获得更好的散热效果;或者将目
标GPU温度设高,最大风扇转速调低,获得更好的静音效果。当然了,想温度又低,噪音又低也不是不可能,那显卡就会自动降低运行频率了。
&&&&最高温度、最高转速、最高频率三个参数都可由用户自己设定,而最终受制于设定的温度和风扇转速,可能会达不到设定的最高频率。当然了,如果将温度限制和风扇转速都拉到最高,理论上就可以达到最高频率,不过届时噪音可能会影响使用体验。
&&&&公版R9
290X默认设定为目标温度95&#8451;,最大风扇转速仅40%,似乎AMD对Hawaii核心可承受的温度比较自信。此前有网友担心R9
290X的核心温度会达到100&#8451;以上,这一担心没有必要。CCC可以设定的最高温度为95&#8451;,因此显卡核心无论如何也不会超过95&#8451;。即在最高风扇转速
设定较高时,可以通过加快风扇转速带走热量,风扇转速设定较低时,显卡会降低频率减少发热。总之无论如何,显卡会在一个安全的温度状态下运行。
&&&&当然,如上文所说的三个条件互相的关系,用户也可以自行降低核心最高温度标准并放宽风扇转速限制,让显卡工作在比默认状态相对「凉爽」的环境。
&&&&不过默认将95&#8451;作为最高安全温度,似乎标准有点高了。对于略熟悉PC的DIY用户,想必会将温度设定为80&#8451;左右,并适当提高最高风扇转速。而
对于不熟悉显卡,买来就是为了玩儿游戏的用户,如果告诉他显卡玩儿游戏时核心会达到95&#8451;,可能会缺乏安全感。95&#8451;的设定是「绝对安全」还是「过于自
信」短时间内我们无法知道,上市一段时间后的用户的稳定性回应才是最具参考价值的。
&&&&Bug注意:这一版本驱动在超频上有一些问题(也许仅出现在R9
每次进入系统后,显卡会在几秒后进入最高频率运行一段时间。同时在超频失败时,驱动不会重置,死机重启进入系统后,显卡同样会在短短几秒后进入最高频率。
由于先前设定的频率无法运行,机器会再度死机。本以为在安全模式下卸载驱动,在重新安装后即会回复默认状态,但驱动会记住先前的错误设定,安装完毕驱动后
依然会进入死机的状态。除非进入安全模式使用完全卸载驱动,才可以回复正常。希望AMD尽快更新驱动避免此问题。
第8页:任意三接口组建三屏
Eyefinity更自由
&&&&多屏拼接方案上,AMD
Eyefinity(中文名为宽域技术)一直处于领先。在HD5000系列开始,Eyefinity打破了传统显卡最多支持双屏输出的模式,实现了单卡
1~6屏输出,可为组建3屏、5屏拼接,为游戏用户实现宽广视角,也可组建4屏、6屏的矩阵,为行业用户提供更多的画面显示,与更高的工作效率,同时减少
组建成本。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//1ff-4eb7-8775-ffedfb1b7217.png" STYLE="cursor: white-space: display:"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&但是在上一代Eyefinity中,必须至少一个显示器连接至DP接口,如果用于组建多屏的显示器没有DP接口,则必须使用一个主动式DP转
DVI的转接器。而且,在普通显卡上,由于一般只有4个输出接口(无论是何种接口),因此最多只能组建4屏幕,需要6屏幕输出则需要购买配备6接口的特殊
版本显卡。
&<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//8cc36c88-acc2-4ba0-aa19-c3fc980db716.png" STYLE="cursor: white-space: display:"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
290X显卡中,我们看到接口全部变为1&DP+1&HDMI+2&DVI。这是因为这代显卡开始,Eyefinity不再必须DP接口,任意三个接口即可实现三屏拼接。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//-afda-4a1d-8fe7-228fc5e17d1a.png" STYLE="cursor: white-space: display:"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&同时,一个DP接口将通过Multi-Stream
Transport(另购)分离,连接三台显示器,这样一来,通过4个接口,即可完成6屏的组建,不再需要特殊的多接口版本。
第9页:详解TrueAudio可编程专用音频处理单元
280X/270X R7 260X的评测中,我们提到了这一代显卡引入的硬件音效处理器TrueAudio。不过当时由于只有R7
260X显卡搭载这一技术,因此文中仅概括地说明了一下。在本文中,我们将对这一技术进行详细解释和分析。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//2ef83-33f36bf5cc.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&AMD的设计工程师Carl
Wakeland提出,由于PC音频的总体水准不高,因此游戏的音效也一直不受重视。现在的音效处理由CPU担任,音效的处理占用了CPU
10%的资源,而且这个比例还在增加。AMD的意图简单明瞭,与一直以来声卡厂商的目的相同,将音频处理从CPU中释放出来,使用专有的硬件进行,实现更
真实、丰富的音效。不过,AMD的解决方案与声卡不同,不是以扩展卡的形式进行增强,而是将音频处理由GPU接纳,不需要额外购买扩展卡的开支。
&#9679;Radeon R9 290X、R7
260X搭载TrueAudio技术
&&&&TrueAudio在这一代一部分GPU中开始使用。支持的型号我们在之前已经知道了,为Hawaii核心的R9
290X、290,和Bonaire核心的R7 260X。这是首次在独立GPU中搭载可编程音频处理器。
TrueAudio被冠以AMD之名,实际上核心技术是来自Tensilica的音频DSP(Digital Signal
Processor,数字信号处理器)。Tensilica是一家主要制造专业性应用程序微处理器的公司,提供嵌入式系统解决方案,今年(2013年)春
季被Cadence Design Systems收购。AMD将Tensilica的「HiFi
EP」音频DSP子系统融入AMD的总线架构,成为TrueAudio。
&&&&如前文架构图所示,R9
290X、290和R7
260X,在die上不仅有GPU核心,还搭载了音频DSP核心。在搭载TrueAudio的平台上,音频并不是由GPU部分处理的,而是交给与GPU同一die上的专用DSP部分。
&#9679;为什么加入专用DSP而不使用GPU流处理器处理音频?
&&&&将音频处理从CPU释放出来,实现高品质与高性能的音效,而且,不需声卡的额外投入,为此、AMD使用了Tensilica的专用DSP。但是AMD既然已经拥有了高性能的GPU,为何不将音频处理作为交由GPU处理呢?
&&&&除了软件层面、GPU资源争抢的问题以外,更重要一点是由于GPU的架构并不完全适合音频处理。
&&&&GPU为了适合高分辨率的图像处理,为并行处理优化的架构设计,以便对大量的顶点与纹理同时高效率地处理。相反,音频处理基本的流程如下面幻灯片所示,对大量的音源进行变调、混音、加入效果,属于一种树型结构。与擅长并行的图形处理器完全不同。
音频信号处理流程
&&&&在音频处理中,傅立叶变换(FFT:Fast
Fourier Transform)与混响(Convolution
Reverb)等一部分处理可以做到高度并行化,而其他的要素却很难做到(但可以多线程并行)。因此GPU核心对于音频处理的大部分内容无法做到高效率执
&&&&Tensilica的HiFi
EP DSP实际上是对对音频特别优化的非常特殊的DSP。下图是2011年的Linley Tech行动技术研讨会(Linley Tech
Conference)上Tensilica的幻灯片。基本理念是,在可使用C语言编程的音频专用DSP上,拥有独立的ISA(指令集架构)。由于具备大
量音频专用的逻辑电路,因此可以在非常低的频率运行,同时带来很低的能耗。
支持的格式
&#9679;成为标准还很漫长
&&&&然而,Tensilica的方案对于PC音频是否是正确的选择,目前还不能确定。由于
TrueAudio 是独立的API,对其的仿问这一点是较高的门槛。预测游戏引擎等应用程序将会通过中间件实现。
数据流与输出支持
支持3D音频
可通过中间件使用
&&&&无论是多么好的硬件,应用程序侧无法使用的话也没有任何意义。因此AMD必须让TrueAudio普及,尽早让AMD所有的GPU/APU搭载这
一功能。AMD此次在游戏方面强调了TureAudio的益处,但不仅是独立显卡上的硬件搭载,也要深入游戏开发者对TureAudio优势的认知,比如
不使用CPU资源即可实现环绕音效等。至今为止的PC历史上,音频DSP的渗透一直是非常不容易的。AMD要想让TrueAudio付诸实用,必须进行大
范围的宣传和渗透,这需要很大的努力。
第10页:并行DirectX 游戏API新标准——Mantle
&&&&AMD除了宣布新显卡之外,还带来了一个欲成为游戏界标准的Mantle
Mantle就像是游戏机的编程模型放到了PC上。Mantle并不是类似DirectX这样中间层的高级软件层,而是更底层的API。开发Mantle的意图在于简化运行库,使PC的图形性能像游戏机那样近乎完全地释放。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//ad471a1d-cd73-4dbc-a4040.jpg" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
Mantle的意思是地幔,AMD拿地球打了个很形象的比方,地幔(Mantle驱动层与Mantle&API)围绕着地核(图形核心),最外面则是地壳(图形应用程序)。
&&&&AMD的全球视觉计算副总裁———拉贾·科杜里(Raja
Koduri)是这样说明的:
&&&&Mantle是新的底层接口。由于与像微软HLSL那样的既存的着色器语言相兼容,因此软件的移植非常简单。Mantle的优点是,比起其他PC上的API,可实现多达9倍的draw-call。这意味着2018年的硬件性能,现在就可以得到。
&&&&至今为止,主机游戏开发者都是more
with less,即在相对低阶的硬件上,可以挖掘出更多的性能。而今天的PC游戏开发者则相反,不得不less and
more。明明PC的硬件规格比主机高很多,但只能获得较低的性能。然而Mantle的到来,可以给PC游戏开发者带来more
with more,即在高性能的硬件上获得更高的性能。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//d520c5c7-3189-4cec-b332-c.jpg" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&游戏机基本上发布之后5到10年都不会变更配置,在到了后一半的生命周期时,配置已经比同期的PC要落后很多了。然而由于软件层面的系统开销较
少,因此可能更多地「榨取」性能。相对来说,PC尽管硬件指标年年增强,但比起主机,由于系统开销大,导致能被游戏程序活用的资源比例却不高。因此总是以
更高的硬件才能达到与家用机相同的表现。
&&&&以上是至今为止的游戏开发常识。不过,AMD将用Mantle把这一切改变。在PC上导入如同游戏机一样的低系统开销,让开发者充分地挖掘硬件性
能。Mantle的宗旨是,让PC平台也能游刃有余地运行游戏。说了这么多好似宣传口吻的话,接下来我们就来看看Mantle的运作原理。
&&&&通过游戏机的图形软件层,可以很好地了解Mantle的理念。比如PS4,基本的构造由下图所示。左端的图形管线控制API由两层构成,上层的
API与DirectX或是OpenGL的API类似。不过PS4将底层API也向开发者公开,底层API的控制权也交给开发者手中。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//9b7162cf-5ef9-480d-80b3-4aaa68a1ff7b.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />&
GPU的情况与CPU不同,需要进行复杂的图形管线控制。PC游戏的API中这一部分相当抽象化,而主机平台则可以更进一步地接近硬件的直接控制。话虽如
此,然而一旦将硬件级公开,后续将会产生问题(安全、稳定性和易于破解的问题),因此最底层的硬件层依然是抽象化。据此,GPU一直延续着不开放硬件层的
做法,完全无法直接触及。
&换言之,游戏机的情况是,着色器核心编程语言,也就是shader语言,是相对简单的软件层。通过轻量的运行库即可编译。尤其底层运行库的编译器接口的公开,可大幅增加实际可用的工程。
&在编译上来看,Mantle与游戏机的软件模型很接近。通过将图形软件轻量化,使得GPU原本的性能得以尽可能地被挖掘。尤其是科杜里强调的,可发行的draw-call得以增加。
&图形编程中的难关之一即是draw-call,即绘图调用与被调用的图形API群之间的指令,由CPU负责执行。绘图引擎执行发行(issue)的
draw-call的增加,会带来API侧的处理加重,占用CPU性能。因此PC的图形API不得不使用patching等方法来减少draw-
call,这样一来,对于开发者来说增加了很多本应不必要负担。在Mantle上,得益于软件层的轻薄化,可发行的draw-call得以增加。
&&&&通过以上分析,可以看出Mantle在战略上的优势,就是容易将游戏机上的游戏移植到PC平台,并且可以获得很高的性能。虽然Mantle是否会
用于PS4、Xbox
One成为底层API还没有得到官方证实,但分析下来可能性很高,因此其可移植性要比过去强很多。在AMD已经将次世代三大主机的图形芯片全部占据的当
下,这一举是不可错过的机会。不过Mantle是依赖GCN架构才能支持的,虽然Wii
U也是使用的AMD图形芯片,但无法使用。在PC显卡上,所有的GCN核心显卡都可以使用,不仅是新推出的Rx-200系列,所有GCN架构的GPU都可
以使用,包含HD7700、HD7800、HD7900系列。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//bceafbc2-f542-44c8-9d3d-db8eccd5c9d8.jpg" STYLE="cursor: display:" BORDER="0" WIDTH="650"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
利用Mantle技术,《战地4》这样的游戏可以用GCN架构的原生语言进行开发,带来更深层次的硬件优化
从AMD的战略来看,Mantle也许是在PC游戏界战胜NVIDIA的妙计。如果游戏开发者在PS4、Xbox
One、PC上利用Mantle交叉渗透真的能够更容易制作出高性能的游戏引擎,那么Mantle将会顺理成章的普及开来。当然了,开发者们不会中止对
11的支持,但一部分很可能逐渐倾向API/驱动层上系统消耗更少的AMD图形平台。以三大主机的完全占有作为背景,AMD借助Mantle,在PC游戏
上从NVIDIA手中夺取更多市场的战略也非常明显了。
第11页:DX 11.2
新特性——硬件画面合成显示
& Windows 8.1带来了DirectX
11.2,以减轻CPU与内存的负荷为目标,在Windows
8.1系统内部进行改良,不仅限于游戏性能,对操作系统整体的响应速度也有提高,也将使用在Xbox One上。
&&&&DirectX
11.2 增加了以下的新特性:&&&&Hardware
overlay support(基于硬件的画面合成显示)&&&&Low-latency
presentation API(低延迟呈现API)&&&&Tiled
resources(平铺化的资源)
& HLSL shader
linking(HLSL着色器链接)&&&&Mappable
default buffers(可分割的默认缓冲区)
&&&&下面我们来对以上的新特性一一进行解释。
Hardware overlay support(基于硬件的画面合成显示)
& & 「Hardware overlay
support是通过硬件将多个画面合成显示的解决方案。比如,「XAML」描绘的UI画面与Direct3D绘制的3D图像相阻和,通过硬件合成使用。XAML是基于XML的显示标记语言。使用C++等编程语言,可直接通过DirectX制作出UI(&#8251;一般PC游戏也是如此),Windows
Store上的程序(指面向Windows8的全屏应用)就推荐使用XAML描绘UI。
&&&&XAML与DirectX的画面合成,目前的Windows
Store应用程序也可以实现。比如,Windows
8预装的地图应用,地图部分使用DirectX绘图,画面上下的菜单、按钮部分则使用XAML。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//924a2a66--93c3-aa.jpg" STYLE="cursor: border-width: 1 border-style: border-color: rgb(51, 51, 51); display:" WIDTH="330"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />&<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//90d13d5e-ee59-4060-8eff-255ead4b2654.jpg" STYLE="cursor: border-width: 1 border-style: border-color: rgb(51, 51, 51); line-height: 1.5; display:" WIDTH="330"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&Windows
Store应用中,XAML与DirectX混合显示一例。左为「Bing
地图」,右为绘画应用「FreshPaint」。红色部分为DirectX,蓝色为XAML描画部分。
&&&&不过在Windows
8中,DirectX与XAML的图形合成有一定限制,必须为「原尺寸」,在此基础上DirectX侧必须在上方(似乎因为之前这种合成无法透明)。而Hardware
Support,则缓和了这种限制,对DirectX与XAML的图形合成提高了自由度,同时处理速度也有所提高。
可能很多读者,包括笔者一开始也对上文中的「原尺寸、DirectX侧必须在上方」等文字无法理解,下面以游戏举一个不完全对应的例子。
& 在支持Hardware
Overlay Support的游戏中, 图形选项会有一项类似「Resolution
Scale(分辨率比例)」的选项。对于可以充分满足需求的中高端配置机器来说,使用100%设定无需变动,即Direct3D图形分辨率=显示分辨率,
这是至今为止绝大多数游戏中的解决方案,也是配合液晶显示器点对点的最优显示方式。但对于配置不足以流畅运行的机器来说,除了降低画面效果,还可以调低这一选项。
&&&&比如将「Resolution
Scale」设定成80%,
此时图像的描绘分辨率会比显示器分辨率有所降低,对于低配机器来说,渲染小一些尺寸的图形,可以提高不少帧数,而UI部分还是以原生分辨率显示,对于文
字、图标来说不会因分辨率不对应造成模糊。虽然降低描绘分辨率并拉伸显示会影响游戏画面内容的晰度,但相比更改游戏全屏分辨率,这种方式下游戏中的UI部
分没有改变,对于操作来说依然维持了一定的舒适性。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//c-41ac-b880-1bb.jpg" STYLE="cursor: display:" BORDER="0" WIDTH="650"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
 &#9650; 类似
Resolution Scale 的选项示意
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//143b-46aa-96ed-0715dab29dfa.jpg" STYLE="cursor: border-width: 1 border-style: border-color: rgb(51, 51, 51); line-height: 1.5; display:" WIDTH="333"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />&<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//7-48ce-a1bc-8b45fd016cf7.jpg" STYLE="cursor: border-width: 1 border-style: border-color: rgb(51, 51, 51); line-height: 1.5; display:" WIDTH="333"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&#9650;左为Resolution
Scale=100%,右为80%
& 在将Resolution
Scale设定为80%后,很直接就可以看出画面变得模糊了,但同时帧数得到了相当幅度的增长,如果是配置较低的机器,就可能从不流畅变成流畅。当然由于是小分辨率的拉伸,画质降低不少,我们截取树叶和枪支部分的100%截图来对比。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//c2--f4.jpg" STYLE="cursor: border-width: 1 border-style: border-color: rgb(51, 51, 51); display:"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&可以看出细节的损失是比较明显的。不过对于无法流畅运行的平台,以画质换取流畅度,也是一种很正常的妥协之策。对于降低特效之后还需要继续提高帧
数的,Resolution
Scale算是一条能走的路。同时我们也看到,显示弹药和生命值的UI部份没有任何变化。由于液晶显示器在非原生分辨率显示质量下降严重,因此这种设定比起调节显示分辨率最终得到的显示效果要好一些。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//a1ce8386-ef9d-4e51-a591-de5.jpg" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&&#9650;
DirectX画面与XAML画面的整合已经没有限制,互相的关系就像是DirectX画面作为XAML的组件,可自由地组合。
& & 这样一来前面所说的「原尺寸、DirectX侧必须在上方」就很好理解了。利 用Hardware
support,Direct3D图形可以是任意的分辨率渲染,然后缩放至显示器分辨率,用于分数、状态显示等的UI画面则以显示器的分辨率描绘,然后将
两者整合得出一帧的游戏画面。同时UI画面与3D图形画面的Z轴(深度方向的位置)可以任意指定,而非前例Windows8地图中的DirectX必须在
上方。实际上在游戏中,UI一定是需要在DirectX内容上方的。这样一来,XAML描绘的UI与DirectX描绘的游戏内容画面,最终可以自由地、
容易地进行合成处理,这就是Hardware overlay support。
第12页:DX 11.2
新特性——低输入延迟呈现API
Low-latency presentation API (低延迟呈现API)
&&&&「Low-latency
presentation API」是对用户操作做出迅素反应的机构,比如提高触摸操作游戏中的反应速度。
&&&&Windows的画面显示中,针对用户鼠标、触摸、键盘等的输入进行反映的行为很多。使用DirectX显示的应用程序需要在内部线程中以「检测输入→处理检测到的输入→面面描绘」这样的过程往复执行。
&&&&DirectX在执行描绘的线程时,是有条件制约的,必须依托DirectX执行线程的执行控制。原因就像刚才接触到的,现在的Windows画
面描绘全部都由DirectX进行最终处理。这与占用全屏幕的DirectX游戏还不一样,桌面上会同时存在多个应用程序,它们的描绘需要DirectX
公平对待,每一个描绘线程需要控制在同样比例、一定的时间内。
&&&&然而控制描绘线程的执行比例,就要增加输入检测的时间间隔,进而可能降低帧数。一般的Windows程序倒是受这方面的影响不大,但有些程序(尤
其是游戏)必须对用户的输入做出迅速的反应。保证一定帧率和输入检测的周期,尽可能地减小输入反应的延迟,这就是Low-latency
presentation API 所要做的。
&&&&Low-latency
presentation
API在已经确定的每秒画面帧率之上,提供尽力保证帧数不改变的输入检测与反应的周期。以此降低输入的反应延迟,提高用户的使用舒适度。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//8fdd123a-86e4-4c06-b5cb-104ab0d75fb5.png" STYLE="cursor: display:" BORDER="0" WIDTH="650"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
魔兽世界的系统设置界面中就有降低输入延迟的选项,从提示中可以看到,过去开启降低输入延迟会有可能明显降低画面帧数,而DirectX
11.2则会解决这一问题。
&&&&下图所示的图像是Low-latency
presentation API演示动画(注)的截图,左边图像未启用Low-latency presentation
API,右面为启用。通过追踪鼠标指针的红色圆形,可以看出延迟的差异。从数字上来看,未启用时延迟为46ms,启用后降低至16ms,这对于触摸操作的游戏来说,可以大幅提高体验。
& 注:动画来自MSDN页面,截取点为38分20秒左右。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//3f9a-4382-ba9b-50fd63e014fa.jpg" STYLE="cursor: white-space: line-height: 15 display:" WIDTH="333"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />&<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//f38-41ed-83c8-e60cce47cb68.jpg" STYLE="cursor: white-space: line-height: 15 display:" WIDTH="333"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&Low-latency presentation API演示图像。左为模拟Windows
8的Low-latency presentation
API未启用状态,右为Windows
8.1的启用状态。鼠标在画面上快速移动,用红色的圆形演示追踪时间差。很容易看出右方的延迟较短。
第13页:DX 11.2
新特性——分割/平铺化贴图资源
Tiled resources(平铺化资源)
&&&&「Tiled
resources」的功能是将多数的小块资源进行组合,生成一个大的贴图。
&&&&用游戏来举例,以高品质表现天空、平原这种宽广地域时,一种手段就是使用大张的贴图。然而大张的贴图会占用大量的显存,Tiled
resources的目的就是减少这样大张贴图对显存的占用。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//4d5ddc28-b7bb-45e8-b450-b7ea7c95d7b7.png" STYLE="cursor: border-width: 1 border-style: border-color: rgb(51, 51, 51); display:"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&比如说天空,天空的贴图绝大多数部分都是一样的,细节部分并不多,在显存中存储这样一张贴图无疑是很低的空间利用率。在利用了Tiled
resources的情况下,巨大的贴图会分割成很多小块,于是会有很多同样的内容,将这些同样的内容仅一个小块放在显存中,另外在显存中记录哪些地方需
要该小块。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//b9e51a79-f7-0f5a0544ed41.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&但是在GPU的规格要求上,一张贴图的正确处理方式是必须使用连续的数据。因此Tiled
resources使用Windows的虚拟内存管理功能,在系统内存内将贴图小块组合成连续的整张帖图形式的数据,递交给GPU。这样一来,贴图所占用
的显存容量得以减少,游戏内可以更容易地使用高品质贴图了。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//655af4f4-c539-4bf5-a035-46ba5a2708b7.jpg" STYLE="cursor: white-space: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&#9650;&Tiled
resources的概念图。左为系统内存上配置好了的,分割之后的小块纹理,通过Windows内存管理的硬件分页表功能重新配置,得到一张巨大的贴图之后,递交给GPU的纹理单元。
第14页:DX 11.2
其他利于开发者的新特性
&&&&另外两个与开发者相关,与最终用户关系不大,我们就简要说明一下:
HLSL shader
linking(HLSL着色器链接)
&&&&「HLSL
shader linking」是指由HLSL(High Level Shader
Language,高级着色器语言)编写的着色程序,或者说是动态链接库(DLL)更合适一些。Windows系统文件夹和应用程序文件夹中通常会看到很
多以「.dll」为扩展名的文件。这些DLL文件的内部实际上是程序,虽然本身不可执行,但可供其他的可执行应用程序调用。善于利用DLL,对于开发者来
说可以节省很多重复工作。
linking的工作方式与Windows的DLL相似。在HLSL中,应用程序执行时,绘制程序动态调用已经做好的「库」代码,实现需要的功能。游戏使
用的主绘制程序与通用的绘制程序分别独立管理、使用,因此「库」的整备、扩展比较直观、简便。
&&&&另外,对于NVIDIA和ATI/AMD两种不同硬件所使用的不同绘制程序之间相切换的情况,HLSL
linking也可以发挥作用。通过对不同GPU优化的部分存入「库」中,在需要的时候直接调取即可。提高GPU利用率的工作也简单化了。
Mappable default
buffers(可分割的默认缓冲区)
 「Mappable default buffers」是GPU执行通用计算时,为GPU与CPU共同处理提高效率的功能。
&&&&迄今为止,在Windows内部,CPU向GPU传送数据时,系统内存的中间缓存(Staging
buffers)上的数据必须复制至GPU侧的默认缓冲区(Default
buffers)。GPU向CPU传送数据时,也需要反过来这一套程序。这样一来,不但需要各个缓冲区都有剩余容量,而且读写次数的增加导致性能低下。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//3a1d5fec-d9f9-43d4-a745-e9.jpg" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
& & 在DirectX
11.2上,放置数据的中间缓存地址,将可以分割给GPU作默认缓冲区使用。这样一来,不需要进行上述的复制,GPU即可直接使用中间缓存上的数据,节省了时间,提高了处理速度。
第15页:喷发的火山——R9 290X 外观赏析
&&&&新一代显卡对应火山岛的系列名称,散热器采用寓意火山岩的红色放射线条。这一散热器在R9
280X、270X已经见过了,观感不错。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//6e159fdb--a2a7-f.jpg" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
& & &#9650; 散热器风格与R9
270X完全一样,但整体稍长,为28cm。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//1e0147cc-0b39-47b5-a2a1-6ed7edb295a6.jpg" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
& & &#9650;
原厂高端卡爱用的涡轮风扇。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//9fe257d8-89f4-4dbb-04a0b.jpg" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
& & &#9650;
显卡PCB背面,此次旗舰原厂卡没有背板。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//b8e5e6f2-cef2-4bfc-98b4-8dfbaa2fba1e.jpg" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&&#9650;&输出接口如前文所述,为1xDP、1xHDMI、2xDVI。需要注意的是,两个DVI皆为DVI-D,无法转接VGA。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//55e85bb7-46f2-4aba-8801-bdae6f4a33a8.jpg" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
& &#9650; 交火桥的位置,现在已经没有金手指了。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//ae-4d53-9d36-04e9e45de401.jpg" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&&#9650;
6+8pin外接供电。
第16页:用料规矩——R9
290X 原厂卡拆解
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//08d1440c-ec83-4737-b0ea-e9cc.jpg" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&&#9650;
由于使用了512bit显存位宽,因此使用16颗显存颗粒。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//8c721f5e-076c-4e7f-71018.jpg" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
& &#9650; 对显存颗粒有提供散热垫,帮助显存散热。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//33a32d6b-4f7d-4eba-b99e-514bbd22b6c4.jpg" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
& &#9650; 拆下风罩的散热器。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//0-476a-534d3c.jpg" STYLE="white-space: cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&&#9650;
Hawaii XT 核心
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//34d04e52--8ae8-6dda1a99f254.jpg" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//a14d7841-a9da-49be-a998-550cb5f9a3e2.jpg" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
& &#+1项数字供电。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//121dbc3a-ea-6e25b89bc3cb.jpg" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&&#9650;
尔必达的W2032BBBG-6A-F,理论频率1500MHz,等效数据频率6000MHz。
第17页:见证R9
290X真实性能 测试说明一览
&#9670;测试平台
测试平台配置表&<img STYLE="margin:0padding:0" ALIGN="absmiddle" HEIGHT="20" WIDTH="21"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
处理器&CPU
英特尔&Core&i7-4770K 主频3.5GHz
主板&Motherboard
微星 Z87芯片组主板
内存&Memory
宇瞻捷豹战神&DDR3-2400 8GB(4GB&2)
浦科特&M5S&128GB&SSD(两块)
显卡&VGA&Card
Radeon R9 290X
Radeon&HD7970
GeForce GTX Titan
GeForce GTX 780
声卡&Audio
主板集成声卡
散热器&Cooler
猫头鹰散热器
电源&Power
振华冰山旗舰&600W
操作系统&OS
Windows&7&64bit&旗舰版
主板驱动&MB&Drivers
Intel芯片组驱动程式&V9.2.0.1021&WHQL
显卡驱动&VGA&Drivers
NVIDIA&ForceWare&331.65
AMD 催化剂
13.11Beta v7
&&#9670;平台介绍
&&&&&&&&本次测试平台使用了Intel
酷睿i7-4770K与微星Z87芯片组主板的配套组合。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//4-4c92-bc76-.JPG" STYLE="cursor: display:" BORDER="0" WIDTH="650"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
我们还使用了来自宇瞻的捷豹战神系列内存,这款内存的规格为DDR3-2400
CL-11,容量为4GB&2。这款内存专为超频玩家而生,在覆盖黑化散热片的同时还通过纯铜导热管连接有一组红色散热鳍片,从而确保内存在长时间高频率
条件运行下的稳定状态。
& 显卡选择上,除了本次的主角R9 290X外,还加入了NVIDIA的旗舰产品GeForce GTX
Titan与GTX 780以及AMD上一代旗舰Radeon HD 7970GHz。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//6a0a2b6b-cf06-409b-89d2-2884cfa3e2e3.jpg" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&#9679;测试项目
测试项目包括3款基准测试软件、11款主流游戏以及3项GPU加速测试,最后还有基于待机/游戏/Furmark三种形态的功耗对比。
第18页:基准测试——3Dmark Fire Strike
英文名称:3Dmark
制作厂商:Futuremark
发行时间:2013.02
发行公司:Futuremark
3Dmark系列是Futuremark公司出品的显卡测试软件,是一款在行业以及消费者心目中具备标杆意义的软件。新版3DMark通吃
Windows、Windows
RT、iOS、Android四大操作系统,横跨桌面和移动设备,不同平台上的成绩也是可以直接对比的。这次发布的是3DMark For
Windows版本,移动版本将在随后发布。
新版3DMark由Ice Storm、Cloud
Gate和Fire
Strike三个测试组成,分别适用于“移动设备和入门级电脑”、“笔记本电脑和家用电脑”以及“高性能游戏电脑”。
软件指定设置下运行,多次测试取平均值。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//a68f7a08-f35e-45f1-9d7a-e2dabc5de66d.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//f3a99a0c-d93f-45ef-bef4-2bddfe9dc17d.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//4f3e451c--8b8e-12bb7b455a62.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//d9e3cebe-e5ec-49e6-a197-8971d2cfe465.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
第19页:基准测试——Unigine Valley V1.0
英文名称:Valley
制作厂商:Unigine
发行时间:2013.1
发行公司:Unigine
这款测试程序除了支持最新的DX11显示特效还兼容之前的DX9、DX10和OpenGL。
测试程序中还大量使用了Hardware
Tessellation(硬件细分曲面)和高级SSAO(屏幕空间环境光遮蔽)技术,使显示画面有了比较明显的提升。
见图表所示
软件指定设置下运行,多次测试取平均值。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//790dcd30-b4fb-4a8a-97b5-1d8a.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//9c1daebd-df50-fa.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
第20页:基准测试——Unigine Heaven V4.0
英文名称:Heaven
制作厂商:Unigine
发行时间:2009.10
发行公司:Unigine
这款测试程序除了支持最新的DX11显示特效还兼容之前的DX9、DX10和OpenGL。值得一提的是它还支持ATI
HD5000系列显卡的“ATI Eyefinity”多屏显示技术,使已经拥有多屏显示系统的玩家也能轻松完成测试。
测试程序中还大量使用了Hardware
Tessellation(硬件细分曲面)和高级SSAO(屏幕空间环境光遮蔽)技术,使显示画面有了比较明显的提升。
DX11,质量高,曲面细分正常
软件指定设置下运行,多次测试取平均值。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//d8c5ed26-fa73-4fcf-a6c9-4b6d4422c4aa.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//8ff45c6d-87c7-4c84-b0c8-08cf11a19e1a.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
第24页:DX11游戏测试——孤岛危机3
英文名称:Crysis 3
制作厂商:Crytek Studios
发行时间:2013.02
发行公司:Electronic Arts
《孤岛危机3》展现了自由的沙盒模式+可垂直作战的大都市环境,并创造出一个真真正正的有丛林,沼泽,草地,峡谷等各种丰富元素的都市雨林。在《孤岛危机3》中,我们还会遇到新的Ceph敌人与全新武器,如早前登场的机械弓。
孤岛危机3配置的处理器方面,推荐四核处理器或更多核心/超线程产品;孤岛危机3配置的内存方面,建议保证4GB容量或更高;孤岛危机3配置的显卡方面...[]
测试设置见测试表格。
测试选定的游戏场景,利用Fraps软件记录帧速度,多次测试取平均值。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//d-4d8f-aa35-91ada6dae25e.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//a4a201c2-55d4--e8bff0c59a1e.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//f3-415c-899d-bd34f9e6605b.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//a23ebd15-4cf6-47fe-acf3-95cdc21e73fe.png" STYLE="cursor: font-size: 15 font-family: 宋体; white-space: color: rgb(34, 34, 34); line-height: 24 background-color: rgb(255, 255, 255); display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
第25页:孤岛危机3帧生成测试——1080P
帧生成时间图展示
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//b8216c57-fd39-4f73-9554-f1fbefa46a66.png" STYLE="cursor: display:" BORDER="0" WIDTH="508"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//bdcb0fb3-ea45-474c-fa60076.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
GeForce GTX
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//e43-da.png" STYLE="border: 0 cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//b19-4d6d-a9c1-dcf74250d87e.png" STYLE="cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
GeForce GTX
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//13f7f079-ec3f-4ac8-b00a-1c1e69206c2e.png" STYLE="border: 0 cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//d14-4763-ae8d-c969dcca40c1.png" STYLE="cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//d45cdb22-5e8d-48a3-b5ac-dd8bc60f7f8f.png" STYLE="border: 0 cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//6db263e5-c201-42b8-92cf-d.png" STYLE="cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
第26页:孤岛危机3帧生成测试——1600P
帧生成时间图展示
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//17a3677c-a403-4e66-972b-eeb8e0b6bded.png" STYLE="line-height: 1.5; cursor: display:" BORDER="0" WIDTH="508"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//4b4f-40f1-957c-05f8c048e2c0.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
GeForce GTX
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//07-4a6f-93e4-d55e7f5ab9aa.png" STYLE="border: 0 cursor: display:" HEIGHT="362" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//b0-43bd-afbb-1e071c07cc25.png" STYLE="cursor: display:" HEIGHT="362" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
GeForce GTX
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//bd-4bc8-96c9-ce325bcff151.png" STYLE="border: 0 cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//2dbb--fb.png" STYLE="cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//9e6ee821-60a8-40f5-befb-b10be9ee7521.png" STYLE="border: 0 cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//2dadb12-87a0-8bc.png" STYLE="cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
第33页:DX11游戏测试——孤岛惊魂3
英文名称:Far Cry 3
制作厂商:Ubisoft Montreal
发行时间:2012.12
发行公司:Ubisoft
在《孤岛惊魂3》中,玩家将会扮演Jason
Brody。在这个没有法律、暴力才是真王道的原始天堂中,玩家将决定整个故事的发展。在游戏中,玩家扮演的Jason
Brody将在这个人性已经泯灭了的孤岛上杀出一条血路。
孤岛惊魂3配置的处理器方面,建议采用四核处理器,主频保证在2.4GHz以上;刺客信条3配置的内存方面,建议保证2GB以上容量;刺客信条3配置的显卡方面...[]
测试设置见测试表格。
测试选定的游戏场景,利用Fraps软件记录帧速度,多次测试取平均值。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//cc20cb81-d6c0-44bb-81d6-0c4dd15ea193.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//-ace6-d.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//aaaa7e70-5fdc-4e15-b8e7-f8a36e73ea79.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//f6baf3fd--b7e4-709b.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
第34页:孤岛惊魂3帧生成测试——1080P
帧生成时间图展示
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//27d8db83--adaf-494119eee003.png" STYLE="cursor: display:" BORDER="0" WIDTH="508"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//ba47eb8b-d-56f56a0.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
GeForce GTX
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//fa322ae8-9a46-4bd3-3ad7d.png" STYLE="border: 0 cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//e2247eb3-afe4-40e6-9a58-5e8ce7326484.png" STYLE="cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
GeForce GTX
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//940e6f60-d053-489d-9e44-ec9d22be4d64.png" STYLE="border: 0 cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//c7b2e814-18c9-44d5-9291-be2bf8897313.png" STYLE="white-space: cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//326246cb-908b-4aff-8955-deeac5ee00c1.png" STYLE="border: 0 cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//524e3609-ed57-4bde-491f71.png" STYLE="white-space: cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
第35页:孤岛惊魂3帧生成测试——1600P
帧生成时间图展示
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//9-4ad8-b54f-2d9055f8fae3.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//f633f731-e39f--c.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
GeForce GTX
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//df9-408b-941a-cef.png" STYLE="border: 0 cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//1a882ddf-eb3e-4b3a-a5ba-ed805afd8cfc.png" STYLE="cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
GeForce GTX
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//aa1d1f1b-a7b4-4342-96ed-.png" STYLE="cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//e3cd-408a-a049-3fbaeddc8840.png" STYLE="border: 0 cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//770e1c6e-0efa-4fcb-b74f-3fb1b2a4dc8d.png" STYLE="border: 0 cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//e261c1c9-b3df-41dc-b284-6b385e3fb51a.png" STYLE="cursor: display:" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&&&&&测试软件:50Miner
第一个GPU加速测试是之前一段时间比较火爆的挖矿测试。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//0ae43e69-c-9cd6-b222da5adad0.png" STYLE="border-width: 1 border-style: border-color: rgb(51, 51, 51); padding: 0 margin: 0 display:" BORDER="0" WIDTH="500"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
&&&&&&&&测试方式:
&&&&&&&&由于矿池本身存在一定的不稳定性,所以速率选取的是硬件开始计算后1分钟、3分钟、5分钟的速率平均值。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//-536f-4e07-9f18-e7.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
& 由于AMD显卡的架构相比NVIDIA更适合挖矿这类数据量较大的通用计算,所以R9
290X与HD7970GHz在挖矿测试的表现中都大幅度领先与N卡,即使是开启了双精度计算的GTX
Titan也被甩开了很远。由此也可以体现出A卡在大数据量的通用计算中的优势地位。
第55页:GPU加速性能测试——ComputeMark
&#9670;测试软件:ComputeMark
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//b370ef0b--987a-704f2f3774e7.jpg" STYLE="padding: 0 margin: 0 display:"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
ComputeMark由捷克硬件和游戏网站的Robert Varga开发完成,技术上基于Jan
Vlietinck的Fluid3D Demo,号称是“第一个百分之百的DX11 Compute
Shader基准测试工具”,一般情况下能够调动99%的GPU资源,CPU占用率只有0-1%,因此在考察GPU通用计算性能的同时,也能考验显卡的稳
定性,对超频亦有所帮助,另外测试的时候还可以自行选择运行时间(单位秒)。
&#9670;测试结果:
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//df17170b-d367-4d0c-a02c-0f8bcd3af16f.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
ComputeMark的结果虽然没有50Miner那种挖矿软件的结果明显,但是AMD最新的这款旗舰R9
290X还是领先两款N卡一定程度的。至此,GPGPU加速测试AMD已经领先两项了。
第56页:GPU加速性能测试——SisoftWare Sandra
&#9670;测试软件:SisoftWare Sandra
&&&&&&&&SisoftWare
Sandra是一款集成多种硬件测试方式的软件。今天我们利用它来检验一下AMD新旗舰R9
290X的浮点数运算能力。测试接口选择为基于DX的DX-CS。
&#9670;测试结果:
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//0a4b5c25-142e-4030-b8aa-6145cbba665c.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
天的最后一项通用计算考验的是几款显卡双精度以及浮点运算这类的性能。从结果上看依旧是AMD显卡占据上风,即使是一组中综合性能最弱的
HD7970GHz在双精度与浮点运算中依旧可以占据一定优势,更不用说大幅度领先其余三款产品的R9
290X。至此,三项GPGPU加速测试就全部结束了,最终以R9 290X全部胜出告终。
第57页:效能测试——待机/游戏/Furmark能耗对比
测试工具:功耗测试仪
&&&&测试工具我们选择了专用的功耗测试仪进行测试,该测试仪可以测试一段时间内整套系统的平均功耗。
功耗的测试部分,笔者特意选择了三种不同的显卡负载状态检测产品的功耗表现:桌面待机、游戏负载(包括《地铁:最后的曙光》、《尘埃3》、《孤岛危机3》三款大作)以及Furmark烤机。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//71283cff-57ed-4636-bce9-2c.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
在桌面待机时,几款产品运行的实际频率基本保持在300~340MHz左右,它们的功耗表现如上图,总的来说相差不大,仔细看起来两款NVIDIA显卡稍好一点。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//8de0afca--a688-ec4da8546bc6.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
& 运行游戏负载时,R9
290X的实际工作频率约950~1000MHz;GTX
Titan的实际工作频率约920~1006MHz(远高于官方宣称的BOOST频率876MHz);GTX
780的实际工作频率约&980~1006MHz(也明显高于官方宣称的BOOST频率902MHz);HD7970GHz则稳定在1050MHz。功耗表现上,R9
290X比两款NVIDIA显卡高一些,不过相对幅度并不算大。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//1ad50f7a-edd3-48af-bc0a-26dbc22f793c.png" STYLE="cursor: display:" BORDER="0"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
& 在Furmark拷机时,两款N卡实际上运行的频率比游戏时还低,GTX
Titan运行频率约为820MHz,GTX 780约为860MHz。GTX Titan在Furmark拷机时表现出的功耗似乎并不高,确切地说普遍比我们测试的高负载游戏时还低。另外,R9
290X实际上在Furmark烤机时运行的频率大致在900MHz左右,也比运行高负载游戏时低,但是功耗却比游戏时高。至于HD7970GHz,在运行Furmark时工作频率为1000MHz,功耗比运行游戏时稍高,但是出入不大。
鉴于Furmark测试的“有趣”情况,其结果似乎已经缺乏直接的对比参考意义,大家还是应该以上面的三款实际游戏大作的功耗测试对比情况为参考更加准确。
第58页:总结——性价比颇高的新一代旗舰
&&&&我们将所有测试成绩汇总一下,对比R9
290X与GTX 780、GTX TITAN的表现情况。成绩最高的用粉色标注。由于HD7970 GHz的出场只是为了让大家了解R9
290X与它相比提升的幅度,并非大家关注的焦点,因此不出现在表格中。
<img src="/blog7style/images/common/sg_trans.gif" real_src =".cn/article//d1b1f569-a08c-4d17-aca3-004b65a45d0e.png" STYLE="cursor: display:" BORDER="0" WIDTH="589"
ALT="AMD显卡新旗舰Radeon&R9&290X超级评测"
TITLE="AMD显卡新旗舰Radeon&R9&290X超级评测" />
经过大量的测试,首先值得肯定的是,AMD显卡在通用计算上的优势较大,R9
290X再次证明了这一点。我们随后排除通用计算项目和三款测试软件的成绩,仅统计实际游戏帧数对比结果:R9
290X有25项获得最高成绩,GTX
TITAN有19项获得最高成绩。计算所有游戏项目的胜负比例,R9 290X胜出GTX 780约8.3%,胜出GTX
TITAN约3.1%。
& & 纵观全部游戏测试结果,R9
290X并不全是在高分辨率下才能胜出,因此512bit显存位宽的作用并不是决定性的。经过优化的GCN架构加上更多的流处理器与像素、纹理单元应该是它决定胜利的之处。而且我们要注意,R9
290X在顺利战胜直接竞争对手GTX 780,甚至挑战GTX TITAN成功的前提下,R9
290X的Hawaii
XT核心在规模上远比对手要小(仅为GK110核心面积的78%)。
另外值得再次提请大家注意的是,一直以来,一些网友认为 GTX
TITAN运行游戏时的最高工作频率就是官方宣称的BOOST频率876MHz,而GTX
780运行游戏时的最高工作频率就是官方宣称的BOOST频率902MHz,但实际上运行游戏负载时,GTX Titan和GTX
780的实际工作频率经常可达1006MHz;而R9
290X的实际工作频率则最高被限制在1000MHz。这意味着,实际上在运行高负载游戏导致显卡全力运作时,GTX Titan、GTX
290X的实际工作频率是基本相同的,已经基本实现了曾有部分网友希望看到的同频测试。因此某些网友认为GTX
Titan和GTX 780工作频率较低,而R9 290X工作频率较高占了频率优势的观点是不准确的。
较 小的核心是成本和良品率的优势,R9 290X现在4599元的定价如果与直接竞争对手GTX
780相比,显然性能优势明显;就算是与GTX TITAN相比,R9 290X虽然性能优势不大,但价格优势太大了。因此无论是相比GTX
780,还是你一定要去对比GTX TITAN,R9 290X都能给你足够选择它的理由。
& 不过我们也要看到,尽管核心规模较小,却 没有给R9
290X带来功耗上的优势。它在实际游戏时的功耗比竞争对手还要稍高一些,好在相对幅度确实不大,在它具备性能优势的前提下是可以接受的。而散热方面,过
于保守的运行噪音设定结合新的散热控制方式,让R9
290X默认的核心温度显得比较高,其实适度放宽运行噪音设定或者更换更高效的风扇都可以很好改善这一状况,这也让非公版或更换第三方风扇的版本会引起不
少“温度控”消费者的期待。此外,R9
290X在少数相对较老(去年甚至更早期)游戏中的帧生成稳定性仍旧比竞争对手略逊一筹,而今年问世的游戏大作则基本不存在这一不足,反映出今年以来
AMD通过改进驱动以及加强和游戏厂商的合作,已经在这方面有了明显的进步,未来应该会越来越好。
综合来说,R9 290X 作为第二代GCN——火山岛系列的第一作,这样的表现是比较令人满意的。从AMD新显卡的市场布局情况看,在完成了旗舰显卡的交接之后,下一步就是推出Hawaii Pro核心的R9
290,来填充3000元价格带的空缺。
后记:与此同时,关于竞争对手的GTX
780Ti的消息也开始出现,NVIDIA宣称将在11月份某个时间发布这款新产品,用以应战R9 290X。从目前的消息来看,GTX
780Ti的性能肯定会高于GTX 780,和GTX TITAN之间相比则情况不明。另外,GTX
TITAN最强单芯的王位已经动摇,高高在上的价格不知道会不会有所下降。在GTX TITAN与GTX
780本来性能差距不是很大的前提之下,又有一款GTX
780Ti加入,在这一性能区间会不会造成产品重叠,这就要看NVIDIA的排兵布阵情况了。
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

我要回帖

更多关于 r9 290相当于n卡 的文章

 

随机推荐