cpu10nmcpu性能 知乎提升多少 知乎

&figure&&img src=&/v2-8d6c4268becbb5dee8c5f96b16e28c4b_b.jpg& data-rawwidth=&560& data-rawheight=&284& class=&origin_image zh-lightbox-thumb& width=&560& data-original=&/v2-8d6c4268becbb5dee8c5f96b16e28c4b_r.jpg&&&/figure&&p&2核,4核,8核,16核。。。核竞赛硝烟弥漫,各个芯片厂商摩拳擦掌,不停的向CPU中塞入更多的内核。吃瓜群众越来越疑惑,“为什么我就不能做个安静的美男子,那么多核我用的上吗?”。本番外篇为你介绍Intel提高单线程处理能力的利器:睿频技术。&/p&&h2&&b&原理篇&/b&&/h2&&p&2核,4核,8核,16核。。。核竞赛硝烟弥漫。我们都知道操作系统调度的最小单位是线程(Thread),我们要使用这么多内核,必须对应用程序作出极大优化,将任务并行化处理交给不同线程。任务并行化有很大的难度,稍不小心就会造成死锁,调试起来也相当麻烦。事实上现在很多应用程序和游戏,在大多数情况下都是只有一个线程在运行,在个别内核极度繁忙时,其他内核却无事可做,可谓忙的忙死,闲的闲死。如何才能把闲置资源调动起来,让这个内核处理速度加快呢?&/p&&p&还是举我们在Cstates文章中的那个例子。想象一下,我们的那个有八个大车间的新工厂,厂房干净漂亮,传送带笔直干净,各个厂房之间有宽阔的道路,到处照明充足。这次我们有了上次的经验,在需求不足时关闭不用的车间,节省了电力。但是这次我们有了新的烦恼:有些产品只能在特定的车间组装,而这些产品需求量非常大,简直是供不应求。看着工厂各处忙闲不均,你陷入了沉思,如何才能利用起来空闲的产能呢?你灵机一动,你找人安装了一套电力转换器,可以随意调度各个车间的电力分配,并给生产机器人也加入了超频装置。这样你把空闲车间的电力转入这个忙碌车间,新注入的电力让生产线加速运转,机器人也像打了鸡血般疯狂运行,产出快多了!你一边盘算着年底的加薪,一边小心控制着电力注入,毕竟变电器爆掉或者产线过热着火就得不偿失了。睿频几乎也是一样的道理。&/p&&p&&br&&/p&&h2&&b&历史&/b&&/h2&&p&一个提高CPU主频的办法就是超频。热管,水冷,甚至液氮都向CPU上面招呼,各个论坛上超频爱好者们都在讨论如果榨出CPU所有的潜力,超频也是不少主板厂商的卖点。但是超频要适可而止,当水冷系统忽然坏掉,你的CPU和主板变成一堆昂贵的砖头,就欲哭无泪了。Intel一直在研究如何能在CPU运转不超过TDP (Thermal Design Power,散热设计功耗)的情况下,提高CPU主频。睿频(Intel Turbo Boost )技术随之诞生,有人叫它“官超”(很不准确)。&/p&&p&&b&1.
睿频1.0&/b& &/p&&p&第一代睿频,在Nehalem 引入。核心功能是当部分内核空闲,进入CStates。内置的电能控制模块会把它们的电力转入忙碌内核,提高他们的电压和频率,使之超过标称主频,一般都有超过10%-20%的加速效果。这样做的前提是整体功耗不超过TDP。如下图:&/p&&figure&&img src=&/v2-848ec9ce8ffe0cbf0aa977_b.jpg& data-caption=&& data-rawwidth=&500& data-rawheight=&378& class=&origin_image zh-lightbox-thumb& width=&500& data-original=&/v2-848ec9ce8ffe0cbf0aa977_r.jpg&&&/figure&&p&&br&&/p&&p&&b&2.
睿频2.0&/b&&/p&&p&在Sandy Bridge 引入。在这一代,主要的提高是将GPU也纳入了整体调节范围,在GPU不太忙碌的情况下,其电能也会被转入忙碌内核,反之亦然。另外一个很重要的改进是不再受TDP的硬约束,可以短暂的超过TDP运行,直到温度传感器达到特定阈值才缓慢回落。这样可以更好地处理突发任务。新加入的功能带来了复杂性,Intel也提供了应用程序方便用户查看状态,后文有详细介绍。&/p&&p&&b&3.
睿频MAX 3.0&/b&&/p&&p&在Skylake引入。主要是识别处理器中速度最快的内核,并将最关键的任务引导至此,进而达到最佳化的效能。必须要指出它不是睿频2.0的替代品,它旨在提供灵活性和弹性,让处理器发挥更大效能。它的实现比较复杂,需要安装特别的驱动程序和软件,BIOS也需要做不少改动。它不在本文的讨论范围里。&/p&&p&以上都可以在Intel的官网上找到相应资料和软件,大家可以自行搜索睿频即可。&/p&&p&&br&&/p&&h2&&b&实现&/b&&/h2&&p&除去睿频 MAX 3.0外,睿频2.0和1.0都不需要安装特殊的驱动程序,OS只要支持EIST (Pstates)即可,它对OS是透明的。如前文介绍EIST中报告Pstate时说明的,我们在支持睿频时需要将P0留给Turbo Mode也就是睿频模式使用。CPU在睿频打开时,在收到进入P0的请求后,会自动根据算法将进入Cstate的内核的电力转移到P0的内核上,加压和提高频率。&/p&&p&这里需要指出的是在Sandy Bridge 之前,单个处理器内所有的内核都是在一个ACPI的Power Domain里,意味着睿频要工作,内核要不在P0,要不在Cstate,没有中间状态。&/p&&p&&br&&/p&&h2&&b&常见问题&/b&&/h2&&p&Q:我如何知道我进入了睿频模式呢?&/p&&p&A:安装Intel Turbo Boost Technology Monitor。当睿频还没启动而且比较空闲,显示这样:&/p&&figure&&img src=&/v2-d489c0eaa6bc3a35e86fbfea00fe29fb_b.jpg& data-caption=&& data-rawwidth=&378& data-rawheight=&400& class=&content_image& width=&378&&&/figure&&p&&br&&/p&&p&当EIST开始工作,但睿频还没启动时:&/p&&figure&&img src=&/v2-696dda5e05bc431f3d10e0_b.jpg& data-caption=&& data-rawwidth=&378& data-rawheight=&400& class=&content_image& width=&378&&&/figure&&p&&br&&/p&&p&睿频1.0启动时(原频率1.73GHz,睿频到2.93GHz):&/p&&figure&&img src=&/v2-64c3d04ae02f299fa101c866a1a4809a_b.jpg& data-caption=&& data-rawwidth=&378& data-rawheight=&400& class=&content_image& width=&378&&&/figure&&p&&br&&/p&&p&睿频2.0启动时(原频率2.2GHz,睿频到3.0GHz):&/p&&figure&&img src=&/v2-7eec56be638cda_b.jpg& data-caption=&& data-rawwidth=&378& data-rawheight=&400& class=&content_image& width=&378&&&/figure&&p&&br&&/p&&h2&&b&后记&/b&&/h2&&p&线程融合技术,即CPU能自动将任务分解给各个CPU线程来运行,现在是各个研究机构的热点。在这个技术获得突破之前,睿频技术是我们提高单线程运算能力的得力工具。&/p&&p&其他CPU电源管理文章:&/p&&p&&a href=&/p/& class=&internal&&CPU省电的秘密(一):EIST - 知乎专栏&/a&&/p&&p&&a href=&/p/& class=&internal&&CPU省电的秘密(二):CStates - 知乎专栏&/a&&/p&&p&欢迎大家关注本专栏和用微信扫描下方二维码加入微信公众号&UEFIBlog&,在那里有最新的文章。同时欢迎大家给本专栏和公众号投稿!&/p&&figure&&img src=&/v2-45479ebdd2351fcdcfb0771bd06fff3a_b.jpg& data-rawwidth=&344& data-rawheight=&344& class=&content_image& width=&344&&&figcaption&用微信扫描二维码加入UEFIBlog公众号&/figcaption&&/figure&
2核,4核,8核,16核。。。核竞赛硝烟弥漫,各个芯片厂商摩拳擦掌,不停的向CPU中塞入更多的内核。吃瓜群众越来越疑惑,“为什么我就不能做个安静的美男子,那么多核我用的上吗?”。本番外篇为你介绍Intel提高单线程处理能力的利器:睿频技术。原理篇2核,…
&figure&&img src=&/v2-9f3f539baccf58e6f4f6c0_b.jpg& data-rawwidth=&650& data-rawheight=&365& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-9f3f539baccf58e6f4f6c0_r.jpg&&&/figure&&h2&前言:&/h2&&p&&br&&/p&&figure&&img src=&/v2-ed801e0a2c2c1805fbc0af87b8e87071_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&650& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-ed801e0a2c2c1805fbc0af87b8e87071_r.jpg&&&/figure&&p&&br&&/p&&p&今年锐龙处理器的全线出击让一直以来缓慢推进的Intel中了“混乱”,策略、路线图、产品甚至发稿时间都有让人摸不到头脑的地方。但毕竟只是“混乱”而不是“麻痹”,招式还是能出的。混乱中Intel移动端祭出了使用14nm+的Kaby Lake Refresh,桌面端今年初刚改的PAO策略似乎也泡了汤,推出了使用14nm++的Coffee Lake,两者都是在第七代酷睿处理器的基础上增加了两个物理核心。将于10月5日正式面市的第八代桌面版酷睿处理器“Coffee Lake”其实规格什么的在网上已经曝的差不多了,到正式发布时只剩下价格这么一个悬念而已。&/p&&p&与之前全套处理器都会一起亮相、只是Core i3晚些才会面市不同,这次第八代桌面版酷睿处理器首发Core i7/Core i5/Core i3每个系列都只有两款,一款无锁一款有锁:&br&Core i7-8700K,6核心12线程,12MB缓存,基础频率3.7GHz,全核最高睿频4.3GHz,单核最高睿频4.7GHz,95W TDP,无锁,售价359美元&br&Core i7-8700,6核心12线程,12MB缓存,基础频率3.2GHz,全核最高睿频4.3GHz,单核最高睿频4.6GHz,65W TDP,有锁,售价303美元&br&Core i5-8600K,6核心6线程,9MB缓存,基础频率3.6GHz,全核最高睿频4.1GHz,单核最高睿频4.3GHz,95W TDP,无锁,售价257美元&br&Core i5-8400,6核心6线程,9MB缓存,基础频率2.8GHz,全核最高睿频3.8GHz,单核最高睿频4.0GHz,65W TDP,有锁,售价182美元&br&Core i3-8350K,4核心4线程,6MB缓存,基础频率4.0GHz,无睿频,91W TDP,无锁,售价168美元&br&Core i3-8100,4核心4线程,6MB缓存,基础频率3.6GHz,无睿频,65W TDP,有锁,售价117美元&/p&&p&八代酷睿处理器在多出两个核心后,对比七代酷睿处理器,有睿频的Core i7/Core i5频率受功耗限制设定的更灵活一些,基础频率降低、单核心睿频提高,全核心频率变化不大。而Core i3变成4核心后主频变低,TDP提升要比Core i7/Core i5大的多。&/p&&p&价格在截稿前只知道Intel在PPT上公布的美元售价,对比Intel数据库里的售价看,只有两颗无锁版的Core i7/Core i5处理器价格分别涨了20美元和15美元,其余售价未变,还好。&/p&&p&&br&&/p&&figure&&img src=&/v2-aeba_b.jpg& data-caption=&& data-rawwidth=&645& data-rawheight=&526& class=&origin_image zh-lightbox-thumb& width=&645& data-original=&/v2-aeba_r.jpg&&&/figure&&p&&br&&/p&&p&“Coffee Lake”Core i7-8700K与前几代的规格对比&/p&&p&&br&&/p&&figure&&img src=&/v2-ea1cd1fae8b58e_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&376& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-ea1cd1fae8b58e_r.jpg&&&/figure&&p&&br&&/p&&p&首批第八代酷睿处理器“Coffee Lake”与第七代酷睿处理器“Kaby Lake”(标准电压版)规格对比&/p&&p&&br&&/p&&figure&&img src=&/v2-67d4c4b0d7cf7c5bfa32_b.jpg& data-caption=&& data-rawwidth=&365& data-rawheight=&642& class=&content_image& width=&365&&&/figure&&h2&有关Coffee Lake处理器:&/h2&&p&&br&&/p&&figure&&img src=&/v2-612c7a2e846f860cba28a2a_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&355& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-612c7a2e846f860cba28a2a_r.jpg&&&/figure&&p&&br&&/p&&p&6核心的Coffee Lake处理器核心图,布局没什么变化&/p&&p&&br&&/p&&figure&&img src=&/v2-1f8ca1e6db703fefcfd71f3b60fe1cc5_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&365& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-1f8ca1e6db703fefcfd71f3b60fe1cc5_r.jpg&&&/figure&&p&&br&&/p&&p&第八代桌面酷睿处理器Coffee Lake采用了改良再改良的14nm++工艺,Intel号称较2015年的14nm 在同样的功耗水平上性能提升26%或性能相同功耗降低52%。处理器规格上最大的变化也是这代处理器最重要的卖点就是多了两个核心,Core i7、Core i5、Core i3分别升级成了6核心12线程、6核心6线程、4核心4线程,三级缓存也顺应增大。其余的改变亮点不多,核芯显卡更名为UHD 630,单元数量不变,频率略有提升。默认支持内存频率只有Core i7和Core i5小幅提升到DDR4-2666MHz。&/p&&p&&br&&/p&&figure&&img src=&/v2-42bc59bda219c0b8c4bff4fe82414a90_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&450& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-42bc59bda219c0b8c4bff4fe82414a90_r.jpg&&&/figure&&p&&br&&/p&&p&Core i7-8700K的顶盖形式和背部针脚布局完全没变,只有电容排布有区别&/p&&p&&br&&/p&&figure&&img src=&/v2-781eb9cd80f55f019ae2_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&450& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-781eb9cd80f55f019ae2_r.jpg&&&/figure&&p&&br&&/p&&p&PCB的厚度也没什么变化&/p&&h2&有关Z370芯片组:&/h2&&p&&br&&/p&&figure&&img src=&/v2-0fdd2dd132_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&365& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-0fdd2dd132_r.jpg&&&/figure&&p&&br&&/p&&p&&br&&/p&&figure&&img src=&/v2-72b2e1c13adaeecd65a037c_b.jpg& data-caption=&& data-rawwidth=&497& data-rawheight=&376& class=&origin_image zh-lightbox-thumb& width=&497& data-original=&/v2-72b2e1c13adaeecd65a037c_r.jpg&&&/figure&&p&&br&&/p&&p&搭配第八代桌面酷睿处理器的是300系列芯片组,虽然同样是LGA1151接口,但Intel给出了一些诸如供电、走线等理由让其并不向下兼容:300系芯片组没法使用第六代和第七代酷睿处理器,第八代酷睿处理器也没法用在100/200系芯片组主板上,这我也测试过了。另外,随第八代桌面酷睿处理器发布的只有Z370一款芯片组,规格和Z270几乎没差。有锁版的处理器也被迫要搭配高阶芯片组的主板,让人完全无法理解,至于其他的300系芯片组以及传说中功能更丰富的Z390那都是后话了。&/p&&h2&技嘉Z370 AORUS GAMING 7解析:&/h2&&p&这次收到的测试套装由技嘉提供,搭配Core i7-8700K ES处理器的主板是Z370 AORUS GAMING 7,技嘉高端子品牌“雕牌”AORUS GAMING首发6款Z370主板中的旗舰型号,也基本可以代表技嘉Z370的设计水平。&/p&&p&&br&&/p&&figure&&img src=&/v2-983ca82e076f105172abc2c8f977c970_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&450& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-983ca82e076f105172abc2c8f977c970_r.jpg&&&/figure&&p&&br&&/p&&p&技嘉从Z170开始,主板上的装饰元素就开始走“机甲风” ,不过当时“塑料模型”的感觉会明显一些。Z370 AORUS GAMING 7依然是这个路数,但装饰元素就明显更有战斗载具的感觉,看上去更带感一些。&/p&&p&主板采用的是标准的ATX板型,尺寸30.5厘米x24.4厘米,9个安装孔位。主板上提供了多8个4pin风扇接口(有一个被I/O风扇占用),数量充足、位置也比较合理。这些接口都支持技嘉的Smart Fan 5功能,可以通过软件自行设定风扇模式及转速曲线,同时这些接口可以支持除水泵外更多的水冷件,比如带测温的堵头、水流计等。&/p&&p&&br&&/p&&figure&&img src=&/v2-cb764e41a45efa1a5fe03776b6acd213_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&450& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-cb764e41a45efa1a5fe03776b6acd213_r.jpg&&&/figure&&p&&br&&/p&&p&Z370 AORUS GAMING 7的RGB Fusion灯效&/p&&p&&br&&/p&&figure&&img src=&/v2-d245bd31c265c3b11e6fa_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&450& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-d245bd31c265c3b11e6fa_r.jpg&&&/figure&&p&&br&&/p&&p&Z370 AORUS GAMING 7搭配AORUS自家显卡的RGB Fusion灯效&/p&&p&主板依然支持技嘉的RGB Fusion灯效,通过同名软件可以调节灯光效果,支持RGB Fusion的自家显卡或其他品牌配件可以光效同步。Z370 AORUS GAMING 7上可亮的部分很多,散热片和I/O装饰罩上的灯光配合装饰图案很是和谐,侧边灯带也同样支持3D打印。主板上有两组灯带插座,形式是5针RGBW插头+3针插头,可以接驳12V和5V的数字灯带(可以指定每颗LED的颜色)。&/p&&p&&br&&/p&&figure&&img src=&/v2-a2dcab26c2e4f_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&450& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-a2dcab26c2e4f_r.jpg&&&/figure&&p&&br&&/p&&p&主板的背部接口提供了1个PS/2、2个带DAC-UP 2的USB 3.0(黄色,拥有独立电源线路,可手动设置USB防掉压级别、强调支持大功率USB设备及更好的USB音频滤波)、DisplayPort、HDMI 2.0、2个RJ45、3个普通USB3.0、USB 3.1 Type-A(红色)及Type-C各一、1个S/PDIF光纤输出接口和5个带镀金的音频接口。在接口后面还能看见一个小风扇,主动给MOSFET散热片进行散热。&/p&&p&&br&&/p&&figure&&img src=&/v2-79cab541af7c7eb519a2f_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&450& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-79cab541af7c7eb519a2f_r.jpg&&&/figure&&p&&br&&/p&&p&CPU依然采用的8pin外接供电,LGA1151插座只支持Coffee Lake处理器。CPU插座旁设计有CPU_FAN和CPU_OPT两个风扇插座,CPU供电的两组散热片中间有热管相连。&/p&&p&&br&&/p&&figure&&img src=&/v2-b8b4bf07c431f7d71a3eab77ce0a13dd_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&450& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-b8b4bf07c431f7d71a3eab77ce0a13dd_r.jpg&&&/figure&&p&&br&&/p&&p&主板提供了1条PCI-E 3.0 x16、1条PCI-E 3.0 x8、1条PCI-E 3.0 x4插槽及3条PCI-E 3.0 x1插槽,前两条支持SLI及CrossFire。三条PCI-E x16插槽依然带有金属保护罩(金属罩下面有7个粗焊点),主要作用是提高插槽强度,防止高端超重显卡导致PCI-E插槽断裂(靠下方的焊脚),同时兼有接地防静电功能。&/p&&p&在PCI-E插槽旁之间主板提供了多达3个M.2插座,支持安装Intel Optane Memory,全都支持PCI-E 3.0 x4模式,可以组建Triple NVMe SSD RAID 0(当然受PCIe通道数量限制,PCIe通道接口共用问题需要仔细看看说明书)。&/p&&p&&br&&/p&&figure&&img src=&/v2-245fb62d01aaa5d2b9341d_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&450& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-245fb62d01aaa5d2b9341d_r.jpg&&&/figure&&p&&br&&/p&&p&最上面那条M.2插槽提供了金属散热片&/p&&p&&br&&/p&&figure&&img src=&/v2-1bc1ae586af113d6a851_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&450& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-1bc1ae586af113d6a851_r.jpg&&&/figure&&p&&br&&/p&&p&主板下方提供了前置音频插座、RGBW数字灯条插座、TPM插座、两组USB 2.0插座、DeBUG灯、3个4pin风扇插座及前面板跳线。&/p&&p&&br&&/p&&figure&&img src=&/v2-dd495faa6ddea4d11c72d7e56baa21f6_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&450& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-dd495faa6ddea4d11c72d7e56baa21f6_r.jpg&&&/figure&&p&&br&&/p&&p&6个Z370芯片组原生SATA 6Gb/s&/p&&p&&br&&/p&&figure&&img src=&/v2-728efcebc770_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&450& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-728efcebc770_r.jpg&&&/figure&&p&&br&&/p&&p&同样带有金属防护罩的四条DDR4内存插槽,最大支持容量64GB,最高支持频率4133+MHz,内存插槽中间带有灯条。&/p&&p&内存插槽外侧、PCB边缘还是有装饰灯条设计,两端的LED打光到透明亚克力条上,有条件的玩家可以自行设计更换这个亚克力条。&/p&&p&&br&&/p&&figure&&img src=&/v2-7e456b32314eff08b0be32cc34b85415_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&450& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-7e456b32314eff08b0be32cc34b85415_r.jpg&&&/figure&&p&&br&&/p&&p&内存插槽外设提供了OC超频按键、电源按键、重启微动、CMOS清空微动,在两个按键旁有PCB的内存X.M.P状态指示灯。&/p&&p&&br&&/p&&figure&&img src=&/v2-827d9c2ce92fa_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&450& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-827d9c2ce92fa_r.jpg&&&/figure&&p&&br&&/p&&p&拆掉所有散热片和装饰罩之后的主板全貌&/p&&p&&br&&/p&&figure&&img src=&/v2-79713bbc370bb8057cda2_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&450& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-79713bbc370bb8057cda2_r.jpg&&&/figure&&p&&br&&/p&&p&&br&&/p&&figure&&img src=&/v2-6c158d5a9ab5a2b42ddb6f82dadf229f_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&450& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-6c158d5a9ab5a2b42ddb6f82dadf229f_r.jpg&&&/figure&&p&&br&&/p&&p&&br&&/p&&figure&&img src=&/v2-1b2f8dd439b9_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&450& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-1b2f8dd439b9_r.jpg&&&/figure&&p&&br&&/p&&p&Z370 AORUS GAMING 7采用了8+2相CPU供电,主控是一颗可控制X+Y ≤ 7)相的&a href=&/?target=https%3A///content/dam/Intersil/documents/isl6/isl69138.pdf& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&internal ISL69138&i class=&icon-external&&&/i&&/a&,通过背面的倍相芯片ISL6617A完成8+2相的控制。这10相供电每相的MOSFET用的是之前没见过的&a href=&/?target=https%3A///content/dam/Intersil/documents/isl9/isl99227-27b.pdf& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&intersil Smart Power Stage ISL99227B&i class=&icon-external&&&/i&&/a&,最大60A DC,表面的裸露设计似乎是用来加强散热。搭配黑化版FPCAP固态电容和库柏封闭式电感。在供电设置上Z370 AORUS GAMING 7规模够、料件档次也高,足够应付6核心处理器超频使用。&/p&&p&&br&&/p&&p&&br&&/p&&figure&&img src=&/v2-2be2a60f8527cdc9342dbf_b.jpg& data-caption=&& data-rawwidth=&325& data-rawheight=&224& class=&content_image& width=&325&&&/figure&&figure&&img src=&/v2-76bf2b2ffb28a23bad1c34_b.jpg& data-caption=&& data-rawwidth=&325& data-rawheight=&224& class=&content_image& width=&325&&&/figure&&p&&br&&/p&&p&双网卡,Killer E2500和Intel I219V&/p&&p&&br&&/p&&figure&&img src=&/v2-cef9a8e9fc7ffa8e5a20e_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&450& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-cef9a8e9fc7ffa8e5a20e_r.jpg&&&/figure&&p&&br&&/p&&p&&br&&/p&&figure&&img src=&/v2-eb7c33dcc7d_b.jpg& data-caption=&& data-rawwidth=&325& data-rawheight=&224& class=&content_image& width=&325&&&/figure&&figure&&img src=&/v2-df62dab33edf80d7affd85_b.jpg& data-caption=&& data-rawwidth=&325& data-rawheight=&224& class=&content_image& width=&325&&&/figure&&p&&br&&/p&&p&&br&&/p&&figure&&img src=&/v2-ee6cdcde2f8d13c90d705_b.jpg& data-caption=&& data-rawwidth=&325& data-rawheight=&224& class=&content_image& width=&325&&&/figure&&figure&&img src=&/v2-92d7d3d163d06b9bd71ff2ff91fb2de3_b.jpg& data-caption=&& data-rawwidth=&325& data-rawheight=&224& class=&content_image& width=&325&&&/figure&&p&&br&&/p&&p&主板的声卡硬件上主控用的是Realtek ALC1220,搭配ESS SABRE9018 Q2C DAC、L49720运放、WIMA 2700pF/100V音频电容及尼吉康音频电容等。软件上使用的则是创新方案,Creative Sound BlasterX 720°及Creative Scout Radar。&/p&&p&&br&&/p&&figure&&img src=&/v2-982e9ac7e934a3cfe9c4a8_b.jpg& data-caption=&& data-rawwidth=&325& data-rawheight=&224& class=&content_image& width=&325&&&/figure&&figure&&img src=&/v2-f23beeca133aa_b.jpg& data-caption=&& data-rawwidth=&325& data-rawheight=&224& class=&content_image& width=&325&&&/figure&&p&&br&&/p&&p&admedia ASM1442K HDMI信号转换芯片;asmedia ASM3142,第三代USB 3.1主控&/p&&p&&br&&/p&&figure&&img src=&/v2-86c022cb523cee5e43e98a1f_b.jpg& data-caption=&& data-rawwidth=&325& data-rawheight=&224& class=&content_image& width=&325&&&/figure&&figure&&img src=&/v2-6e341e41e00f9fee49ce9c20eb664f57_b.jpg& data-caption=&& data-rawwidth=&325& data-rawheight=&224& class=&content_image& width=&325&&&/figure&&p&&br&&/p&&p&ITE IT8795E,用途未知;ITE IT8686E,I/O及监控芯片&/p&&p&&br&&/p&&figure&&img src=&/v2-ddb6f91fe39c24be9f60a_b.jpg& data-caption=&& data-rawwidth=&325& data-rawheight=&224& class=&content_image& width=&325&&&/figure&&figure&&img src=&/v2-f919f48bf8bb_b.jpg& data-caption=&& data-rawwidth=&325& data-rawheight=&224& class=&content_image& width=&325&&&/figure&&p&&br&&/p&&p&Intel Z370芯片组;Realtek RTS5411,USB 3.0 HUB&/p&&h2&测试平台说明:&/h2&&p&&br&&/p&&figure&&img src=&/v2-64bd435d1e44c6bdb2fa3e_b.jpg& data-caption=&& data-rawwidth=&569& data-rawheight=&1062& class=&origin_image zh-lightbox-thumb& width=&569& data-original=&/v2-64bd435d1e44c6bdb2fa3e_r.jpg&&&/figure&&p&&br&&/p&&p&开始CPU的测试环节。这次测试使用三颗处理器,Intel平台是Core i7-8700K和Core i7-7700K,两颗都是ES版。AMD平台按定位应该选择Ryzen 7 1700X,不过由于找不到所以拿Ryzen 7 1800X代替。内存统一使用芝奇Trident Z DDR4-3200 16GB套装,测试时跑在X.M.P.频率3200MHz下,时序14-14-14-34。&/p&&p&由于时间限制,测试只提供这几颗处理器原始频率的成绩、开节能+睿频+只调节内存频率的默认状态对比。&/p&&p&特别说明:时间和精力有限,测试项目不能涵盖过多,测试环节中终会有一些疏漏,测试数据里涉及主板初期BIOS的影响,会有一些“看起来不合理”的部分,望大家多指正见谅。&/p&&h2&CPU性能测试项目说明:&/h2&&p&PCMARK 10:最新的整体平台性能基准测试软件,只测试标准测试场景,分数大为佳。&/p&&p&3DMARK:常用的3D图形基准测试软件,测试内都包含应用CPU的物理模拟场景,分数大为佳。&/p&&p&Super PI/Fritz Chess Benchmark/wPrime:常用的单线程/多线程性能基准测试,Fritz分数大为佳,SuperPI和wPrime时间短为佳,wPrime手动设定为处理器对应的线程数量。&/p&&p&SiSoftware Sandra Lite:分别算数处理器测试、多媒体处理器测试、加密解密性能测试(AES256+SHA2-256),分别考验处理器整数浮点数运算性能、AVX和AES指令结合浮点性能,分数高为佳。&/p&&p&AIDA64:内存测试部分测试内置的Cache&Memory Benchmark,提供内存的读、写、复制和延迟数据,读写高为佳,延迟低为佳。&/p&&p&7-Zip/RAR:常用的压缩解压缩软件,测试直接跑内置的Benchmark,分数高为佳。&/p&&p&Microsoft Office:使用PCMARK 8测试,Office版本2016,Word/Excel/PowerPoint三个子项都跑,总成绩大为佳。&/p&&p&Adobe PhotoShop CC:使用网上下的Driverheaven PS Benchmark 3.0,对一张图片进行15步的图像模式切换、滤镜等操作,记录总体时间,时间越短越为佳。&/p&&p&TrueCrypt:热门的加密软件,跑内置Benchmark,Buffer size 50MB,Sort Method Mean Speed,成绩越大为佳。&/p&&p&Dolphin Benchmark:基于Dolphin模拟器的测试,Benchmark模拟Wii游戏复杂3D场景,主要考验CPU的单核心处理能力,时间越短越好。&/p&&p&3ds Max 2012 x64:渲染一个我在网上下载的室内装饰图,时间越短越好。&/p&&p&CINEBENCH R15:常用的渲染测试软件,只跑CPU渲染测试部分,成绩越大越好。&/p&&p&Blender:轻量级的三维动画软件,测试使用AMD当初提供的Ryzen CPU测试素材,渲染时间越短越好。&/p&&p&POV-Ray:使用光线跟踪绘制三维图像的开放源代码免费软件,测试采用软件自带的渲染一张图片的Benchmark,成绩越大越好。&/p&&p&x265 HD Benchmark:H.265/HEVC的简单编码性能测试,时间短为佳。&/p&&p&MediaCoder x64:将875MB的4K测试视频“烤鸭”,输出为1080p的MP4-AVC,时间短为佳。&/p&&p&SVPmark 3:视频平滑插帧性能测试,只记录Synthetic CPU成绩,分数高的为佳。&/p&&p&SunSpider/Kraken:针对Javascript性能的测试,测试统一使用Chorme 60,成绩小为佳。&/p&&p&WebXPRT HTML5:针对HTML5性能的测试,测试统一使用Chorme 60,成绩小为佳。&/p&&h2&游戏性能测试项目说明:&/h2&&p&&br&&/p&&figure&&img src=&/v2-96d754d43efb081fd10283_b.jpg& data-caption=&& data-rawwidth=&435& data-rawheight=&880& class=&origin_image zh-lightbox-thumb& width=&435& data-original=&/v2-96d754d43efb081fd10283_r.jpg&&&/figure&&p&&br&&/p&&h2&Core i7-8700K CPU性能对比测试:&/h2&&p&&br&&/p&&figure&&img src=&/v2-349a304f1e1fa86f3b1c8e7832b0abda_b.jpg& data-caption=&& data-rawwidth=&627& data-rawheight=&1063& class=&origin_image zh-lightbox-thumb& width=&627& data-original=&/v2-349a304f1e1fa86f3b1c8e7832b0abda_r.jpg&&&/figure&&p&&br&&/p&&p&Core i7-8700K不出意外架构上并没有太大变化,虽然基础频率较Core i7-7700K大幅降低了500MHz,但单核最高睿频还是要高200MHz。以SuperPI、单线程的Fritz、wPrime、WINRAR、CINEBENCH、Dolphin为例的单核性能对比测试结果和基础频率关系不大,基本和单核睿频频率相关,Core i7-8700K有较Core i7-7700K不到5%的优势。Ryzen虽然性能进步明显,但在架构和频率双重影响下和Core i7-8700K的单核性能差还是高达30%以上。&/p&&p&Core i7-8700K最大的提升还是在多了双核心四线程,Core i7-8700K全核心满载频率只比Core i7-7700K低100MHz,频率上的差距其实并不明显。在挑出来的多线程测试中,多了两个核的Core i7-8700K较Core i7-7700K性能优势超过30%。实际应用测试中,只有Office和Photoshop对多线程支持不好,前者在PCMARK 8的测试里Core i7-7700K分数还要高一些,其余诸如渲染、转码、压缩、加密等测试Core i7-8700K较Core i7-7700K性能优势都比较大。Core i7-8700K变成了6核心12线程后,对比原来优势明显的Ryzen 7线程数量上差距有所降低,但Ryzen 7 1800X毕竟还是要多两个核心四个线程,渲染类测试依旧有优势,其他诸如内存带宽,7-Zip解压缩、TrueCrypt加密、x265编码和SVPmark 3等项目Ryzen 7 1800X成绩也会好一些。&/p&&h2&Core i7-8700K CPU游戏对比测试:&/h2&&p&&br&&/p&&figure&&img src=&/v2-f7ea6a2b400a_b.jpg& data-caption=&& data-rawwidth=&549& data-rawheight=&979& class=&origin_image zh-lightbox-thumb& width=&549& data-original=&/v2-f7ea6a2b400a_r.jpg&&&/figure&&p&&br&&/p&&p&&br&&/p&&figure&&img src=&/v2-29a60dd375c80cd79c1969_b.jpg& data-caption=&& data-rawwidth=&536& data-rawheight=&353& class=&origin_image zh-lightbox-thumb& width=&536& data-original=&/v2-29a60dd375c80cd79c1969_r.jpg&&&/figure&&p&&br&&/p&&p&Core i7-7700K原本就是在游戏测试中表现顶尖的一颗处理器,多出的两个核心后Core i7-8700K的3DMARK总成绩会高些,在游戏测试中只有《HITMAN》和《DOTA 2》帧数提升稍微明显点,但最大也不超过10%,其他游戏两者差距微乎其微。Ryzen的游戏表现之前就和Intel处理器有差距,Ryzen 7 1800X对比Core i7-8700K,3DMARK总成绩两者差不多,但在游戏测试里大多Ryzen 7 1800X帧数都会差一些,还有像《HITMAN》和《DOTA 2》这样差距比较明显的,平均下来差11%左右。&/p&&p&&br&&/p&&figure&&img src=&/v2-bb06c5aaecc_b.jpg& data-caption=&& data-rawwidth=&534& data-rawheight=&420& class=&origin_image zh-lightbox-thumb& width=&534& data-original=&/v2-bb06c5aaecc_r.jpg&&&/figure&&p&&br&&/p&&p&&br&&/p&&figure&&img src=&/v2-b462bdf401ea7d67ced2e92_b.jpg& data-caption=&& data-rawwidth=&536& data-rawheight=&351& class=&origin_image zh-lightbox-thumb& width=&536& data-original=&/v2-b462bdf401ea7d67ced2e92_r.jpg&&&/figure&&p&&br&&/p&&p&Core i7-8700K的UHD630核芯显卡从纸面规格上看依然是24个EU单元,只是较HD630最高频率从1.15GHz提升到了1.2GHz,基本上就是马甲。不过简单测了测,无论是3DMARK还是实际游戏表现,UHD630能看出明显好一些,提升都在10%左右,这可比当初HD530升级到HD630性能基本没差强多了。&/p&&h2&功耗测试:&/h2&&p&功耗测试使用三种方式记录功耗,一种是监控平台在电参数测量仪上的功耗值,记录整个平台的输入功耗;一种是通过万用表和钳表测量CPU 8pin供电的电流值和电压值之后相乘取得CPU自己的输入功耗,一种是计算AIDA64记录的CPU Package功耗值的平均值。第一种方法受平台其他配件影响较大,第二种方式因为主板24pin供电也会给CPU一定的电流而受影响。&/p&&p&测试时,两颗CPU都是在BIOS默认设置下进行测试(CPU默认频率无其他调节,内存读取X.M.P.),Windows 10的电源计划也都是默认的“均衡”。测试平台除参与测试的CPU和相应的主板外,测试时还有其他一些计入整体平台功耗的配件,如键盘鼠标,影响不大不赘述。&/p&&p&功耗测试的项目说明如下:&/p&&p&桌面待机:Windows桌面下待机10分钟,不进入任何休眠模式&br&
高清播放:拿完美者解码Potplayer播放奇美的4K测试片&烤鸭&&br&3ds Max 2012:与CPU性能测试一样,找了一个简单的室内设计效果图进行渲染&br&Mediacoder转码:将4K测试片&烤鸭&,用H264编码压制为1080p MP4视频&br&Rise of Tomb Raider:,VeryHigh,Benchmark“Geothermal Vally”&br&Prime95满载:In-place large FFTs满载测试,取测试10分钟后的数值&/p&&p&另附之前测试过的、同是6核心12线程的Ryzen 5 1600X功耗数据,仅供参考。因测试使用的显卡不同导致差异的Rise of Tomb Raider的整体平台功耗数据和当时没有的AIDA64功耗对比数据就不出现了。&/p&&p&&br&&/p&&figure&&img src=&/v2-2f99bbe8ccc42_b.jpg& data-caption=&& data-rawwidth=&533& data-rawheight=&634& class=&origin_image zh-lightbox-thumb& width=&533& data-original=&/v2-2f99bbe8ccc42_r.jpg&&&/figure&&p&&br&&/p&&figure&&img src=&/v2-c470f23bccdef6ba9a887b_b.jpg& data-caption=&& data-rawwidth=&530& data-rawheight=&633& class=&origin_image zh-lightbox-thumb& width=&530& data-original=&/v2-c470f23bccdef6ba9a887b_r.jpg&&&/figure&&p&&br&&/p&&p&&br&&/p&&figure&&img src=&/v2-8caede59399ba48bbc07e6a4_b.jpg& data-caption=&& data-rawwidth=&534& data-rawheight=&590& class=&origin_image zh-lightbox-thumb& width=&534& data-original=&/v2-8caede59399ba48bbc07e6a4_r.jpg&&&/figure&&p&&br&&/p&&p&Core i7-8700K的官方TDP从Core i7-7700K的91W提升到了95W,纸面数据差距并不大。看8pin的实测结果,日常的高负载应用Core i7-8700K的功耗略高于Core i7-7700K,但差距不超过5W,Prime95烤机时功耗反而会低一些(频率还维持在全核心4.3GHz)。其余两种测试在CPU高负载时的情况也类似,渲染和转码用Core i7-8700K功耗略高,Prime95烤机则比Core i7-7700K低一些。&/p&&p&对比AMD平台,Core i7-8700K的功耗每项高负载测试都要高同是6核心12线程的Ryzen 5 1600X几瓦,但整体看要比Ryzen 7 1800X低不少。&/p&&h2&温度测试:&/h2&&p&温度测试时散热器的NF-A15风扇通过调速器统一调节成全速运行。&/p&&p&&br&&/p&&figure&&img src=&/v2-be47746adc06cadc2dedc5_b.jpg& data-caption=&& data-rawwidth=&588& data-rawheight=&608& class=&origin_image zh-lightbox-thumb& width=&588& data-original=&/v2-be47746adc06cadc2dedc5_r.jpg&&&/figure&&p&&br&&/p&&p&Ryzen 7 1800X由于AIDA64记录下的温度数据有问题,所以温度测试只有Core i7-8700K和Core i7-7700K的数据。结果是高负载测试中除了渲染测试两者差不多,其余的转码、游戏和Prime95烤机Core i7-7700K温度都要高一些。无论是功耗还是温度表现,都和Core i7-8700K和Core i7-7700K的电压有一定关系,前者的高负载电压基本都在1.2V以下,而后者大多在1.285V左右。&/p&&h2&超频测试:&/h2&&p&Coffee Lake架构理论可以支持更高频的内存,像测试的Z370 AORUS GAMING 7纸面数据就支持DDR4-4133MHz。但手上没有高频内存,加上时间关系还是只简单超一下CPU看看。就我手里这颗ES处理器来看,应该是得益于14nm++工艺的功劳,Core i7-8700K并没有因为核心变多而较Core i7-7700K风冷超频上限降低反而更高,5.0GHz/4.5GHz可以过Prime95烤机,5.2GHz/4.5GHz可以跑基准测试,使用主板BIOS自带的超频档也可以顺利5GB进系统、进行一些低负载操作。&/p&&p&&br&&/p&&figure&&img src=&/v2-8bda941d3bcd_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&504& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-8bda941d3bcd_r.jpg&&&/figure&&p&&br&&/p&&p&我这颗处理器能过Prime95 29.2第二项In-place large FFTs测试1小时的频率是核心5.0GHz,Uncore 4.5GHz(技嘉的BIOS依然是Uncore设定x45以上不生效),内存就X.M.P DDR4-3200MHz。BIOS内设定CPU VCore=1.4V,CPU VCCIO=1.15V,CPU SA=1.1V,防掉压等级Turbo。超频1小时后CPU六个核心的温度在72℃-80℃,测试中最高温度已经达到99℃。&/p&&p&&br&&/p&&figure&&img src=&/v2-ddfcfb15b9d8b75_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&409& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-ddfcfb15b9d8b75_r.jpg&&&/figure&&p&&br&&/p&&p&核心电压加到1.415V后,Core i7-8700K可以5.2GHz/4.5GHz进系统跑CINEBENCH R15和Fritz Chess Benchmark,测试结果较默认频率CINEBENCH R15的多核心和单核心成绩分别提升18.95%和11.39%,Fritz Chess Benchmark的多核心和单核心成绩分别提升20.26%和11.42%。&/p&&p&&br&&/p&&figure&&img src=&/v2-13e271567cfaf_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&487& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-13e271567cfaf_r.jpg&&&/figure&&p&&br&&/p&&p&&br&&/p&&figure&&img src=&/v2-11bfbdfce798c5_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&487& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-11bfbdfce798c5_r.jpg&&&/figure&&p&&br&&/p&&p&&br&&/p&&figure&&img src=&/v2-d33c32ef188bdde80a42_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&487& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-d33c32ef188bdde80a42_r.jpg&&&/figure&&p&&br&&/p&&p&&br&&/p&&figure&&img src=&/v2-fbc05f8165_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&487& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-fbc05f8165_r.jpg&&&/figure&&p&&br&&/p&&p&核心5.0GHz,Uncore 4.5GHz测试时的BIOS设定&/p&&h2&总结:&/h2&&p&&br&&/p&&figure&&img src=&/v2-9f3f539baccf58e6f4f6c0_b.jpg& data-caption=&& data-rawwidth=&650& data-rawheight=&365& class=&origin_image zh-lightbox-thumb& width=&650& data-original=&/v2-9f3f539baccf58e6f4f6c0_r.jpg&&&/figure&&p&&br&&/p&&p&托AMD Ryzen的福,按照今年初Intel全新的PAO(工艺Process、架构Architecture、优化Optimization)策略,应该就直接是10nm的第八代酷睿处理器被生挤进来一个Coffee Lake:架构基本没变,工艺使用改良再改良的14nm++,核心线程数量全面提升。&/p&&p&单从处理器看,Coffee Lake通过更灵活的频率设定,单线程性能小幅提升并对Ryzen保有明显优势;多出的两个核心使得多线程性能较前代有超过30%的提升、有了和相近价位Ryzen较量的能力;14nm++工艺让核心变多的同时无锁版处理器的可超频幅度并未下降而还有所提高。同时在测试中Core i7-8700K的功耗温度并不比Core i7-7700K高,整体表现很不错。&/p&&p&核心数量升级后,像Core i7-8700K可以接过最佳高端游戏处理器的王座,Core i5和Core i3的规格看起来也很有诱惑力,只是Core i3的TDP提升不少。官方价格较上代变化并不大,对于很多使用几代前酷睿处理器、每年都会喊再战三年的玩家来说,可以升级或换词了。&/p&&p&当然,处在“混乱”状态的Intel还是那个Intel,并不会让你一爽到底,首发配合Coffee Lake的芯片组只有高端Z370一款,自己是马甲不说还没得选。如果购买的是65W有锁版处理器配Z370主板,整体平台成本并不低。其他300系芯片组诸如H370、H310、B360有消息称明年初才会发布,传说中高端还有替代者Z390,略显混乱的产品路线会不会影响Coffee Lake平台的销售前景似乎要被打上一个问号。&/p&&p&再说下测试用的Z370 AORUS GAMINGZ 7这片主板,全新的装饰造型搭配RGB Fusion灯效给我留下了深刻的印象,音频网络和接口配置也都符合其定位。针对六核心处理器超频,主板采用了新形式+高档次的用料,同时还加了把小风扇主动给散热片降温,在测试中取得了令人满意的超频结果。&/p&
前言: 今年锐龙处理器的全线出击让一直以来缓慢推进的Intel中了“混乱”,策略、路线图、产品甚至发稿时间都有让人摸不到头脑的地方。但毕竟只是“混乱”而不是“麻痹”,招式还是能出的。混乱中Intel移动端祭出了使用14nm+的Kaby Lake Refresh,桌面端今…
&figure&&img src=&/v2-aeab534fba934_b.jpg& data-rawwidth=&1000& data-rawheight=&625& class=&origin_image zh-lightbox-thumb& width=&1000& data-original=&/v2-aeab534fba934_r.jpg&&&/figure&&p&经常有朋友问我:“Intel为什么不出个100核的CPU”,“AMD单核干不过Intel,怎么不堆出个巨无霸和Intel竞争呢?”。“质不够,量来凑”似乎是个好主意,顿时感觉摩尔定律有希望了,我们相关行业又可以混几年了。&/p&&p&幻想美妙,现实残酷。CPU制程不变的情况下,堆砌内核必定造成CPU核心Die尺寸的增大,而其对于产品的良率有极大的影响。产品的良率影响到产品的价格,谁也不想看到自己的钱包缩水。下面我们来看一下Die的大小对于良率的影响。&/p&&h2&&b&Die的大小与良率(yield)&/b&&/h2&&p&在前文(&a href=&/p/& class=&internal&&CPU制造的那些事之一:i7和i5其实是孪生兄弟!?&/a&)中我们介绍了CPU的制造过程,也顺便提到了晶圆Wafer。我们都知道CPU的制造过程,一定会用到晶圆Wafer。每个CPU内核Die都是从一个完整的Wafer上面切割下来的:&/p&&figure&&img src=&/v2-daa2a39874fff7e59db77_b.jpg& data-caption=&& data-rawwidth=&351& data-rawheight=&274& class=&content_image& width=&351&&&/figure&&p&CPU成本的一个重要考量是每个Wafer能制造多少个Die,并尽量减少浪费。我们就以目前主流的300mm晶圆为例。先假设我们的晶圆出自上帝之手,没有任何缺陷(Defect)。因为Die一般是长方形或者正方形,所以圆形的Wafer边缘部分被浪费了,如下图:&/p&&figure&&img src=&/v2-7d1eaf42df8ea9a0f8d08632_b.jpg& data-caption=&& data-rawwidth=&640& data-rawheight=&291& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&/v2-7d1eaf42df8ea9a0f8d08632_r.jpg&&&/figure&&p&从图中我们可以看出随着Die的缩小,浪费的比例也从36%缩小成为12.6%。根据极限知识,我们知道如果Die的大小足够小,我们理论上可以100%用上所有的Wafer大小。从中我们可以看出越小的Die,浪费越小,从而降低CPU价格,对CPU生产者和消费者都是好事。&/p&&p&回过头来,晶圆在制造过程中总是避免不了缺陷,这些缺陷就像撒芝麻粒,分布在整个Wafer上:&/p&&figure&&img src=&/v2-94d49f09475bcdbbc732770_b.jpg& data-caption=&& data-rawwidth=&290& data-rawheight=&294& class=&content_image& width=&290&&&/figure&&p&如果考虑缺陷,Die的大小会严重影响良率:&/p&&figure&&img src=&/v2-7aeb4eb32432fdee013b6e_b.jpg& data-caption=&& data-rawwidth=&3000& data-rawheight=&1000& class=&origin_image zh-lightbox-thumb& width=&3000& data-original=&/v2-7aeb4eb32432fdee013b6e_r.jpg&&&/figure&&p&上图大家可以点开看(图比较大),其中不太清楚的红色小点是晶圆的缺陷,在Die很大时,有很大概率它的范围内会缺陷,而只要有缺陷该Die就报废了(简化处理);在Die比较小的时候,它含有缺陷的可能性就大大降低了。如图中,随着Die的减小,良率从第一个的35.7%提高到了95.2%!我们举个极端的例子,整个Wafer就一个Die,那么良率只有0%了,生产一个报废一个。谁还干这么傻的事!&/p&&h2&&b&制程、Die的大小与良率&/b&&/h2&&p&22nm-&14nm-&10nm,每一步前进都会消耗大量的投资,芯片生产厂家还乐此不疲,有很大的原因就是制程提高了,Die也小了(或者同样大小可以塞入更多的晶体管),良率提高了,也就省钱了。制程提高还能带来另外的好处,譬如更加省电了,性能更好了等等。&/p&&p&但是更好的制程在最初往往会让晶圆的缺陷更容易造成严重问题,反过来会降低良率。频率也可能上不去,不得不binned到低频。同时漏电流的增加会让待机功耗增加,这也是为什么最初的14nmCPU比22nm待机功耗更高的原因。&/p&&h2&&b&结论&/b&&/h2&&p&100个内核的CPU是行不通的,至少目前行不通。现在Die尺寸最大的据我所知就是Intel的Knight系列和N的人工智能板卡,成本非常高。而它们能做那么多核是因为每个核都很简单,占地很小,加起来Die的面积也在可控范围内。&/p&&p&也有同学好奇为什么不采用更大的Wafer呢?那将我们下一篇的内容。&/p&&h2&&b&补充&/b&&/h2&&p&AMD在猪队友工艺落后Intel的前提下,又想要堆核怒怼。另辟蹊径,采取一个Package封装4个独立Die的做法,推出了EPYC服务器芯片,即不影响良率,又可以核心数目好看,可谓一举两得。&/p&&figure&&img src=&/v2-7d77aafe79ad_b.jpg& data-caption=&& data-rawwidth=&1234& data-rawheight=&694& class=&origin_image zh-lightbox-thumb& width=&1234& data-original=&/v2-7d77aafe79ad_r.jpg&&&/figure&&p&并在刚不久发布了ThreadRipper &/p&&figure&&img src=&/v2-9aecfff0ba87_b.jpg& data-caption=&& data-rawwidth=&1344& data-rawheight=&742& class=&origin_image zh-lightbox-thumb& width=&1344& data-original=&/v2-9aecfff0ba87_r.jpg&&&/figure&&p&可惜连接四个Die的片外总线终归没有片内总线效率高,在好些benchmark中败下阵来,可见没有免费的午餐。他也似乎忘记了自己在2005年双核口水大战中调侃Intel是“胶水粘”的双核,自己这次可是“拼积木”式的,为了数据好看也够“拼”的了。&/p&&p&我们来看看四个Die是怎么连接的。我们来看一个双路EPYC服务器:&/p&&figure&&img src=&/v2-ce7b6f2b4dfbceef66fa8a9_b.jpg& data-caption=&& data-rawwidth=&768& data-rawheight=&471& class=&origin_image zh-lightbox-thumb& width=&768& data-original=&/v2-ce7b6f2b4dfbceef66fa8a9_r.jpg&&&/figure&&p&注意这里的双路之间互联和每个CPU Package(MCM)里面4个Zeppelin Die都是Infinity Fabric连接的,本质上Package的四个Die和四路CPU没有什么不同。是四个NUMA的Node(&a href=&/p/& class=&internal&&NUMA与UEFI&/a&)。&/p&&p&而Intel的Pakcage内部是一个Die, Core之间原来是Ring Bus,在Skylake后改为Mesh:&/p&&figure&&img src=&/v2-eae22170dedf8fa5cc1fbf8a_b.jpg& data-caption=&& data-rawwidth=&1342& data-rawheight=&923& class=&origin_image zh-lightbox-thumb& width=&1342& data-original=&/v2-eae22170dedf8fa5cc1fbf8a_r.jpg&&&/figure&&figure&&img src=&/v2-0cc5d3e5b9dba5f999bd6e3f5252d4df_b.jpg& data-caption=&& data-rawwidth=&921& data-rawheight=&591& class=&origin_image zh-lightbox-thumb& width=&921& data-original=&/v2-0cc5d3e5b9dba5f999bd6e3f5252d4df_r.jpg&&&/figure&&p&而与Infinity Fabric对应的QPI和UPI只用到了socket互联:&/p&&figure&&img src=&/v2-424aacf72af926d43d48fe55ac76de77_b.jpg& data-caption=&& data-rawwidth=&884& data-rawheight=&567& class=&origin_image zh-lightbox-thumb& width=&884& data-original=&/v2-424aacf72af926d43d48fe55ac76de77_r.jpg&&&/figure&&p&它们的延迟不在一个数量级上。&/p&&p&&b&AMD这样做,在增加灵活性之外,主要的目的是:省钱!!AMD每个Zeppelin Die都比Intel的小,这对良品率提高很大,节约了生产费用。&/b&&/p&&p&欢迎大家关注本专栏和用微信扫描下方二维码加入微信公众号&UEFIBlog&,在那里有最新的文章。同时欢迎大家给本专栏和公众号投稿!&/p&&figure&&img src=&/v2-45479ebdd2351fcdcfb0771bd06fff3a_b.jpg& data-rawwidth=&344& data-rawheight=&344& class=&content_image& width=&344&&&figcaption&用微信扫描二维码加入UEFIBlog公众号&/figcaption&&/figure&
经常有朋友问我:“Intel为什么不出个100核的CPU”,“AMD单核干不过Intel,怎么不堆出个巨无霸和Intel竞争呢?”。“质不够,量来凑”似乎是个好主意,顿时感觉摩尔定律有希望了,我们相关行业又可以混几年了。幻想美妙,现实残酷。CPU制程不变的情况下,…
&figure&&img src=&/v2-ee06e7dfdf002c711a8a406dddba3519_b.jpg& data-rawwidth=&1588& data-rawheight=&894& class=&origin_image zh-lightbox-thumb& width=&1588& data-original=&/v2-ee06e7dfdf002c711a8a406dddba3519_r.jpg&&&/figure&&p&作者:Finch&/p&&blockquote&前段时间刚重金攒了一台 3.1GHz 四核第七代酷睿 i7 处理器、2TB SSD、16GB 内存、Radeon Pro 560 GPU 顶配 15 英寸 MacBook Pro 的小伙伴已哭瞎……&/blockquote&&p&“英特尔一屁股坐在了牙膏上。”很多人这么调侃英特尔刚刚发布的第八代酷睿处理器。&/p&&figure&&img src=&/v2-9c6b160cd5a77dd5e34b_b.jpg& data-rawwidth=&750& data-rawheight=&339& class=&origin_image zh-lightbox-thumb& width=&750& data-original=&/v2-9c6b160cd5a77dd5e34b_r.jpg&&&/figure&&p&&i&配备 3.1GHz 四核第七代 Intel Core i7 处理器的顶配版 2017 MacBook Pro,你猜它还可以再战几年?&/i&&/p&&p&这一次,新一代处理器性能提升多达 40%,堪称十年来最有诚意的一次升级,英特尔直接喊出了“比 5 年老旧电脑提升 2 倍”的口号。主要体现在多任务处理和 4K 视频上,而往年每一代酷睿的性能升级要“克制”得多,一般也就 15% 左右,实际体验中可能还要再打一个折扣。&/p&&p&对于第八代酷睿的性能升级,英特尔在台北 5 月底的台北电脑展上就有暗示,更是发布了发烧性能的顶级 i9 产品线。&/p&&p&当时积弱多年的 AMD 打磨出来的 Ryzen 正在收割多方的膜拜,大有翻身农奴做主人的势头,多核多线程、全新的缓存系统,终于逃脱了被酷睿 i3 秒全家的命运,&a href=&/?target=https%3A//www.cpubenchmark.net/high_end_cpus.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&在评分榜上开始占有一席之地&i class=&icon-external&&&/i&&/a&。而 AMD 处理器还有着巨大的价格优势,这种情况下,老大哥英特尔的压力可想而知。&/p&&figure&&img src=&/v2-a51e7bb2813e_b.jpg& data-rawwidth=&750& data-rawheight=&660& class=&origin_image zh-lightbox-thumb& width=&750& data-original=&/v2-a51e7bb2813e_r.jpg&&&/figure&&p&&i&别高兴太早,文末有更长的截图。&/i&&/p&&p&&b&这代酷睿有点特殊,三代架构同堂&/b&&/p&&p&特殊之处不仅在于性能上的大跃进,而是英特尔为此打破了多年铁律。此前它基本上保持着同一代处理器,使用相同架构和相同制程的原则,这点在第八代上不复存在。官方的解释是,现有制程技术难突破,同一制程很难同时满足高中低端三条产品线,之后的「第几代」处理器将变成时间上的划分,而非技术。&/p&&p&将在同一代产品使用三种工艺(或者说两种工艺)、三种架构,分别是 14nm+ Kaby Lake Refresh、14nm++ Coffee Lake 和 10nm Cannon Lake。&/p&&p&这么多 Lake,看不懂没关系,你就记住越靠后越好就是了,伴随着加工工艺、架构和性能的提升。当然,价格也可能水涨船高,毕竟处理器同样需要消费升级。&/p&&p&新的处理器家族依旧分为面向轻薄无风扇设计的 Y 系列(参照 12 英寸 MacBook)、面向便携笔记本的 U 系列(大部分超极本采用该系列处理器)、面向高性能笔记本和移动工作站的 H 系列(多见于游戏本)和面向台式机、一体机和迷你主机的 S 系列。&/p&&p&前期公布的是四款 TDP 15W 的 U 系列,采用和第七代相同的 14nm+ 制程工艺,Kaby Lake Refresh 架构: Core i7-8550U、Core i7-8650U、Core i5-8350U 和 Core i5-8250U。四款处理器全部为四核心设计,增加两个核心带来的性能提升多达 25%,其余 15% 的升级则来自于制造工艺和核心设计。&/p&&p&以最高规的 i7-8650U 为例,四核八线程,1.9~4.2GHz 的频率,而对应的上一代产品 i7-7660U 则是双核四线程,2.5~4.0GHz 的频率。新品初始主频更低,但是睿频会更高,可应付的场景更多一些,同时还能降低日常使用下的能耗。&/p&&p&集成的核心显卡升级到了 620 UHD Graphics,最大可输出 Hz 画面,这也是英特尔强调的 4K 编辑能力的需要。&/p&&p&更多详细参数可以&a href=&/?target=https%3A///content/www/cn/zh/products/compare-products.html%3FproductIds%3DCCC124968& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&查看完整表格&i class=&icon-external&&&/i&&/a&(依旧不支持 LPDDR4 内存):&/p&&figure&&img src=&/v2-293ec2e5b7dcea345645_b.jpg& data-rawwidth=&750& data-rawheight=&394& class=&origin_image zh-lightbox-thumb& width=&750& data-original=&/v2-293ec2e5b7dcea345645_r.jpg&&&/figure&&p&&b&换电脑可以等一等了&/b&&/p&&p&官方的演示文档里,除了跟上一代产品对比外,英特尔特意标注了第八代处理器同场景下的比你家里 5 年前甚至更久远的年代攒的电脑快了多少倍:&/p&&blockquote&在 Adobe Lightroom 中编辑,速度提升两倍&br&创建 4K 视频时,速度提升 14.5 倍,从 45 分钟缩短至 3 分钟&/blockquote&&p&而在全世界,有 4.5 亿人还在使用超过五年以上的老旧电脑。这部分用户恰恰是英特尔极力想撬动的。&/p&&p&首批第八代智能英特尔酷睿 i5/i7 处理器的设备将在今年 9 月上市,目前有 60 余款在京东上开启了预售模式。官方表示,到年底总计会有超过 145 款产品上市。首个台式机处理器将在秋季推出。&/p&&figure&&img src=&/v2-c4b80f9b107f46e2bfd79bb9_b.jpg& data-rawwidth=&750& data-rawheight=&563& class=&origin_image zh-lightbox-thumb& width=&750& data-original=&/v2-c4b80f9b107f46e2bfd79bb9_r.jpg&&&/figure&&p&&i&现场展示的搭载第八代酷睿处理器的戴尔笔记本。&/i&&/p&&p&所以,准备把你家里积了几层灰的台式机、键盘缝隙里塞满各种碎屑的笔记本换掉的同学,可以缓一缓了。虽然多出来的性能你不一定会用到,但飙升 40% 听着就刺激。&/p&&p&最后,感谢农企。要知道,自 2006 年 AMD 用 Athlon X2 施压英特尔祭出 Core 2 Duo(酷睿前身)之后,英特尔已有十年没有迈过这么大的步子,这一次可以说是活力全开了。&/p&&p&当然,10nm 制程加持的 Cannon Lake 更值得期待。&/p&&figure&&img src=&/v2-0e9d0cd33e5d_b.jpg& data-rawwidth=&750& data-rawheight=&1241& class=&origin_image zh-lightbox-thumb& width=&750& data-original=&/v2-0e9d0cd33e5d_r.jpg&&&/figure&&p&&i&农企要继续努力啊。&/i&&/p&&p&--题图为英特尔在预热视频中秀出的未知型号 Surface Book。--&/p&&p&-----------------------------------------&/p&&p&更多精彩请关注我们的微信公众号:PingWest品玩&/p&&p&&/p&
作者:Finch前段时间刚重金攒了一台 3.1GHz 四核第七代酷睿 i7 处理器、2TB SSD、16GB 内存、Radeon Pro 560 GPU 顶配 15 英寸 MacBook Pro 的小伙伴已哭瞎……“英特尔一屁股坐在了牙膏上。”很多人这么调侃英特尔刚刚发布的第八代酷睿处理器。配备 3.1GHz…
&figure&&img src=&/167eda4c92406eeb0dfabf5_b.jpg& data-rawwidth=&1587& data-rawheight=&1080& class=&origin_image zh-lightbox-thumb& width=&1587& data-original=&/167eda4c92406eeb0dfabf5_r.jpg&&&/figure&随着智能设备的广泛普及,这几年媒体上越来越多的出现关于“架构”“ARM vs x86”“芯片研发”的相关内容。很多消费者和爱好者面对这些以往不太常见的信息时就会迷惑甚至产生误解。其中一组比较容易被混淆的概念就是CPU、架构、指令集与芯片。本文试图用较浅显的文字阐明它们的关系与区别,纠正一些常见的错误认识与观点。&p&学过计算机基础知识的朋友都知道CPU的含义,亦即中央处理器,是负责计算机主要运算任务的组件。一般习惯把CPU比喻为人的大脑。而了解略深的用户会听说CPU有x86、ARM等分类,前者主要用于PC而后者主要用于手机平板等设备。那么这里的x86、ARM指的是什么呢?&/p&&p&CPU执行计算任务时都需要遵从一定的规范,程序在被执行前都需要先翻译为CPU可以理解的语言。这种规范或语言就是指令集(ISA,Instruction Set Architecture)。程序被按照某种指令集的规范翻译为CPU可识别的底层代码的过程叫做编译(compile)。x86、ARM v8、MIPS都是指令集的代号。指令集可以被扩展,如x86增加64位支持就有了x86-64。厂商开发兼容某种指令集的CPU需要指令集专利持有者授权,典型例子如Intel授权AMD,使后者可以开发兼容x86指令集的CPU。&/p&&p&CPU的基本组成单元即为核心(core)。多个核心可以同时执行多件计算任务,前提是这些任务没有先后顺序。&/p&&p&核心的实现方式被称为微架构(microarchitecture)。微架构的设计影响核心可以达到的最高频率、核心在一定频率下能执行的运算量、一定工艺水平下核心的能耗水平等等。此外,不同微架构执行各类程序的偏向也不同,例如90年代末期Intel的P6微架构就在浮点类程序上表现优异,但在整数类应用中不如同频下的对手。&/p&&p&常见的代号如Haswell、Cortex-A15等都是微架构的称号。注意微架构与指令集是两个概念:指令集是CPU选择的语言,而微架构是具体的实现。i7-4770的核心是Haswell微架构,这种微架构兼容x86指令集。对于兼容ARM指令集的芯片来说这两个概念尤其容易混淆:ARM公司将自己研发的指令集叫做ARM指令集,同时它还研发具体的微架构如Cortex系列并对外授权。但是,一款CPU使用了ARM指令集不等于它就使用了ARM研发的微架构。Intel、高通、苹果、Nvidia等厂商都自行开发了兼容ARM指令集的微架构,同时还有许多厂商使用ARM开发的微架构来制造CPU。通常,业界认为只有具备独立的微架构研发能力的企业才算具备了CPU研发能力,而是否使用自行研发的指令集无关紧要。微架构的研发也是IT产业技术含量最高的领域之一。&/p&&p&数年前国产龙芯CPU获得MIPS授权的消息曾引起一阵风波,龙芯相关负责人还曾出来解释。龙芯是兼容MIPS指令集,微架构部由中科院自主研发的CPU系列。过去中科院资金不足所以没有MIPS指令集授权,但是指令集的实现方式是公开的,因而中科院可以在研发时选择兼容该指令集。待资金充足买下授权后,龙芯就可以合法在市面销售。从这里我们可以知道,厂商研发CPU时并不需要获得指令集授权就可以获得指令集的相关资料与规范,指令集本身的技术含量并不是很高。获得授权主要是为了避免法律问题。然而微架构的设计细节是各家厂商绝对保密的,而且由于其技术复杂,即便获得相应文档也难以山寨。不同厂商的微架构设计水平也有较大差异,典型如Intel与AMD的对比,前者在最近几年明显技高一筹。&/p&&p&微架构研发完成,或者说核心研发完成,接下来就是将其组装为芯片了。过去的芯片仅仅包括CPU部分,如今大量的芯片集成了CPU、GPU、IO等多种不同的功能组件,此时这种芯片就不是传统意义上的“CPU”了。将各种功能组件组装为芯片的技术含量相比微架构研发来说是较低的,因而业界能做此类工作的企业也数量较多。&/p&&p&在PC时代,几大主要的CPU研发厂商都只是自己研制微架构自己用。到了智能设备时代,ARM公司的微架构授权模式兴起。ARM自己开发微架构后将它们上架出售,其他厂商可以拿这些核心组装为芯片来使用或销售。由于这种模式对第三方的技术能力要求很低,加上ARM的微架构在低功耗领域表现优异,这种模式获得了广泛成功。如果你发现某款芯片标明使用了Cortex系列核心,则一定是这种模式的产物。如前所述,仅仅从ARM购买微架构来组装芯片的厂商是不能被称作CPU研发企业的,这些芯片也不能被称为“xx厂商研发的CPU”。典型如华为的海思920、三星Exynos 5430,只能说是“使用ARM Cortex-A15核心的芯片”。但是如果一款兼容ARM指令集的芯片使用了厂商自主研发的微架构情况就不同了。高通骁龙800、苹果A7就是这样的例子--它们分别使用了高通、苹果自主研发的CPU。&/p&&p&随着智能设备市场不断扩大,ARM阵营也不断壮大。占领智能设备领域后,ARM阵营开始进入PC、服务器与高性能计算领域。先是ARM发布了ARM v8 64位指令集规范,接着是各大厂商纷纷开始研发基于ARM v8的高性能微架构。有人会问,ARM指令集不是为低功耗设备研发的吗?怎么现在又开始做高性能CPU了呢?多年以前这样的怀疑是很有道理的,因为彼时不同指令集对微架构的影响还比较大,ARM适合低功耗,x86适合PC,Power适合小型机……这类区分是存在的。但是随着技术进步,指令集对微架构的影响已经小到可以忽略,任何指令集都可以做出适合不同领域的优秀微架构来。因此用户看到x86指令集的手机cpu或是ARM指令集的服务器CPU都无需惊讶,这是技术发展的自然结果。&/p&&p&那么,现在各家CPU研发厂商选择指令集的标准又是什么呢?业界除了x86和ARM、MIPS,其实还有一大堆各种各样的指令集。比如小型主机领域的Sparc、Alpha、Power等。国内几家研CPU的科研机构就分别选择了x86、MIPS、Sparc、Alpha、ARM指令集,早年甚至有机构选择Intel没落的Itanium使用的EPIC指令集的。一般来说大家倾向于选择软件生态较好的指令集--前面说过,软件必须编译后才能在某种指令集平台上运行,而编译是很复杂的事情,绝大多数闭源软件仅仅会对少数一两个平台编译。因而支持某种指令集的软件应用越多,这种指令集也就越有市场优势--新开发的微架构只需要兼容某种指令集,那么就可以很容易运行大量为其开发的软件。早年因为微软的强势与Wintel联盟的推动,x86指令集成了最受欢迎的角色,帮助Intel用彼时性能相对落后的微架构在PC平台挤跑了一众对手。后PC时代由于苹果谷歌的两大操作系统平台的推动,ARM指令集又取得了绝对的市场优势。但对于新的CPU研发单位来说,他们想获得热门指令集的兼容授权是很困难的事情。以前x86与ARM的指令集授权是拿钱买不到的,想要得到都需要进行高水平专利交换。拿到x86授权的几家厂商要么是拿的早(AMD、Cyrix、IDT),要么是有高水平技术与Intel交易(Transmeta,以功耗控制技术同Intel交易)。后来Nvidia想要研发自己的CPU,找Intel软磨硬泡后者就是不给,搞得Nvidia相当无奈。国内的研发单位当年开始研究时自知不可能拿到x86授权,于是各自去找关系好些的其他授权方解决问题了。ARM这边也一直对指令集授权卡的很死,之前只有高通、博通和Intel得到,也是通过技术交换的形式。08年苹果乔帮主被Intel甩脸色后决定自己搞CPU,最后也拿到了ARM的许可,想来彼时老乔也是威逼利诱,硬是让ARM屈服了(毕竟指令集多授权一家就多个对手啊)。后来ARM对指令集授权也放松了,去年三星与华为也分别得到了授权,他们的自研CPU预计也将在未来一两年面世。&/p&&p&本文总结下来的内容很简单:指令集与微架构是不同的概念,不可混淆;CPU研发指的是微架构研发;如今指令集不再有“最适合领域”的说法。希望这篇文章能帮助被这些问题困扰的朋友,也希望媒体在提及这些概念时多做一些科普与澄清。&/p&&p&版权保留,转载需本人许可。&/p&
随着智能设备的广泛普及,这几年媒体上越来越多的出现关于“架构”“ARM vs x86”“芯片研发”的相关内容。很多消费者和爱好者面对这些以往不太常见的信息时就会迷惑甚至产生误解。其中一组比较容易被混淆的概念就是CPU、架构、指令集与芯片。本文试图用较…
谢邀,3D晶体管其实是个噱头,其实质是FinFET(&i&FinField-effecttransistor,&/i&鳍式场效晶体管),技术发明人是加州大学伯克利分校的胡正明教授,并非什么大的革新,作用类似补丁。&br&&b&&/b&&br&在Intel的宣传图片中,我们看到的3D晶体管是网状的,而传统的晶体管则是条状的 ,因此,3D晶体管只是一个包装词汇而已,原本的晶体管也并不是2D的! &br&&br&&figure&&img src=&/0a95e019e77fdb87cff50_b.jpg& data-rawwidth=&600& data-rawheight=&343& class=&origin_image zh-lightbox-thumb& width=&600& data-original=&/0a95e019e77fdb87cff50_r.jpg&&&/figure&&br&&b&Intel对3D晶体管的优势概括为几个方面:更高的能耗比、更快的切换速度、更高的驱动电流,以及比SOI工艺更低的成本增加幅度。但是,加大栅极控制力度的FinFET总归只是个补丁而已,漏电问题依然是存在的,并且随着晶体管密度的增大,另一个重要因素——发热量也越来越集中,这也是IVB相比SNB核心发热量更大的一个主要原因。&/b&&br&&b&&br&&/b&&br&&b&以下进入术语时间,可以不看,直接去看喜闻乐见总结:&/b&&br&&b&&br&&/b&&b&先是一些常识:&/b&&br&&b&&br&&/b&晶体管的开关状态决定着电流通过与否,也就是计算机0、1信号的来源,活动状态的电流决定了CPU的功耗,关闭状态下的漏电流决定了CPU的功耗效率,而开关速度决定了CPU的频率,也就是性能。&br&&br&理论上开关速度越快越好,漏电流越低越好,但是随着工艺的进步,晶体管之间的间隔越来越小,不可避免产生 Short-channel effect (短沟道效应)漏电流也越来越大,过多的浪费会导致CPU的功耗和发热不易控制,晶体管频率也提不上去。&br&&br&&figure&&img src=&/0f65b52a67d528fc795f4ecf3f02fa4c_b.jpg& data-rawwidth=&541& data-rawheight=&166& class=&origin_image zh-lightbox-thumb& width=&541& data-original=&/0f65b52a67d528fc795f4ecf3f02fa4c_r.jpg&&&/figure&&br&&b&源极(Source)漏极(Drain) 以及栅极(Gate,控制开关)&/b&&br&&b&&br&&/b&FinFET以及另外一项技术UTBSOI (Ultra Thin Body Silicon-On-Insulator,超薄绝缘体上硅),都是为了解决以上问题。&br&&b&&/b&&br&FinFET详解&br&&br&&b&&/b&&b&&/b&&b&&figure&&img src=&/ece78fcfae34_b.jpg& data-rawwidth=&600& data-rawheight=&338& class=&origin_image zh-lightbox-thumb& width=&600& data-original=&/ece78fcfae34_r.jpg&&&/figure&&/b&&b&&br&&/b&&br&&b&图一
3D晶体管和之前晶体管的不同(右为3D,&/b&上图中黄色带状成为“Drain”,左侧的图中它与Gate只是底部接触,在之前45nm工艺时代,为了减少漏电流,Intel使用的HKMG(高K金属门)就是填充在Drain漏极与Gate栅极之间的。在3D晶体管上,Drain看起来就是拔高了位置,立起来了。&b&)&/b&&br&&b&&br&&/b&&br&&b&&figure&&img src=&/be09fa7a0da442e8ef948_b.jpg& data-rawwidth=&391& data-rawheight=&341& class=&content_image& width=&391&&&/figure&&/b&&b&&/b&&b&图二
3D晶体管的细节(&/b&传统的晶体管只有一个电流通过方向,3D晶体管多了一个Fin(鳍片),与栅极接触的就是三个方向,电流可以从Fin上方以及左右两侧通过,这也是为什么称之为3D立体的原因。&b&)&/b&&br&&b&&br&&/b&&b&晶体管中源极(Source)和漏极(Drain)之间存在着绝缘层,以确保在晶体管关闭的时候两极间“几乎”没有电流流过。但是随着制造工艺越来越先进,单个晶体管的尺寸就变得越来越小,原本在Source和Drain两级间的绝缘层也越来越小,“电阻”也会越来越小,原本“几乎”没有电流流过的绝缘层的绝缘效果下降,漏电就越来越严重。漏电通常发生在远离Gate(栅极)的一侧,当漏电达到一定程度的时候,就相当于晶体管一直处于开启状态,这些漏电的电流是会全部转换成发热量的,因此漏电变大也就直接导致了CPU发热量的上升。&/b&&br&&b&&br&&/b&&b& 漏电流主要发生在远离GATE的那一面,属于GATE控制不到的部分,那要减小漏电流要怎么处理呢?其一,加大GATE的控制力度和范围;其二,让漏电流无处可流。 &/b&&br&&br&FinFET就是减少漏电电流的一种方式——加大Gate的控制范围,也就是把原本平面的Source和Drain加高——这样在第三个维度上就能看到它们的身影,与Gate交叉,这样相当于Gate可以从三个方向夹着Source和Drain,从三个方向控制着晶体管。&br&&br&&b&喜闻乐见不恰当的总结:&/b&&br&&b&&br&&/b&&b&我们来把电流看做水流,源极漏极是房间(晶体管)中两个储水单元,不同储水状态代表有无(0,1),栅极当作阀门,阀门周围用混凝土(绝缘的填充物)来隔离,但是随着房间做的越来越小(制程进步),混凝土也越来越薄,漏水现象越来越重,但是因为没有阀门控制因此我们无能为力,3D晶体管加大了阀门,在加大水流(电流)流量,提高性能同时,可以更有效的控制水流(电流),减少发热。&/b&&b&&/b&
谢邀,3D晶体管其实是个噱头,其实质是FinFET(FinField-effecttransistor,鳍式场效晶体管),技术发明人是加州大学伯克利分校的胡正明教授,并非什么大的革新,作用类似补丁。
在Intel的宣传图片中,我们看到的3D晶体管是网状的,而传统的晶体管则是条状…
&p&&strong&在AMD发布新一代Zen处理器之前,说它打造的桌面处理器不算特别成功也并不为过。&/strong&&/p&&p&2011年发布的推土机(Bulldozer)的设计最多也只能说 很有特点 。AMD在推土机身上下了三个赌注:通用计算会继续向多线程发展;浮点计算会越发倾向GPU驱动;巨幅提升时钟速度是可行的。 &/p&&p&据此,AMD制造的处理器具有大量的同时多线程,较长的管线,较窄的管线和较少的浮点资源。这里的原理在于时钟速度和GPU会弥补管线较窄和浮点计算力较低的缺陷。那么AMD就得祈祷所有的线程都能不停地工作才行。 &/p&&p&每个推土机模块能够同时运行两个线程,每个模块内有两个独立的整数线程和一个共享的浮点线程。已发布的桌面处理器版本有搭载两个、三个或四个模块的,分别共有四个、六个或八个线程。与上一代K10相比,推土机每个整数管线都很窄:两个算术逻辑单元(ALU)和两个地址生成单元(AGU),而K10各有三个。浮点管线也是一样,两个128位的乘法累加单元(FMA)配对执行单个256位的AVX FMA指令集。AMD设计的处理器的基础时钟速度为4.4GHz. &/p&&h2&&strong&推土机?都是扯淡吧&/strong&&/h2&&p&AMD的赌注最终仍是失败。搭载四个模块八个线程的高级桌面处理器有大量的整数线程富余。但大多数用户的工作量仍然没法被平均分配到八个线程上去。单线程的运行依旧是重头戏。另一方面,浮点单元的共享意味着充满浮点算术的应用程序就没有足够的运行资源。虽然基于GPU的计算在一些特定工作中非常重要——比如科学超级计算——但主流应用程序还是更依赖CPU来做浮点运算。 &/p&&p&若是时钟速度能够达标的话,这些问题也算可以勉强忍受。每时钟周期指令完成数(IPC)低的处理器如果能以足够高的时钟速度运行那也还凑合,但是AMD连它的基础目标4.4GHz都没有做到。搭载四个模块的最高配置处理器的基础速度仅为3.6GHz. 在工作量减少的情况下也只能冲上4.2GHz。这与设计目标还差得十万八千里。 &/p&&p&结果,第一代推土机处理器在很多工作上都比它的前辈K10处理器运行得更缓慢,而且价格更高。这和同时期的英特尔处理器完全没法比。 &/p&&p&AMD的确做了产品迭代。推土机的第二代打桩机(Piledriver)最高配置版本把基础时钟速度提至4.7GHz,最高速5.0GHz. 再结合一些内部改良,打桩机比最高配的推土机要快上40%。然而这也带来了更高的能耗成本:为了时钟速度的达标,打桩机处理器的功率为220W,而推土机只要125W。&/p&&p&第三代处理器压路机(Streamroller)在IPC上有了进步,比打桩机高出9%。第四代处理器挖掘机(Excavator)又在压路机的IPC基础上提高了15%。然而,不管是压路机还是挖掘机,谁也没有被用在高级桌面处理器上。桌面市场依然是英特尔的地盘。 &/p&&p&AMD的确在一些加速处理单元(APU)上使用了压路机和挖掘机,也就是说,CPU与GPU的集成。但就算是在这块领域,推土机家族还是能力有限。面向移动端的APU在10-25W区间只有一个挖掘机模块(两个线程)。它的性能比同功率的英特尔芯片要差很多,而且英特尔成功在它的低功率处理器上挤进了四个线程(尽管只有双核)。 &/p&&p&至于在超低功率3-7W区间,AMD的推土机家族更是没有任何对应的产品。他们曾经的确有过超低功率芯片,但那些用的都是山猫(Bobcat)处理器的衍生品。这是一种完全不一样的处理器设计,是专门为了移动操作和低功率操作而开发的。山猫的衍生版本还被用在PlayStation 4, PlayStation 4 Pro, Xbox One 和 Xbox One S上。 &/p&&p&相比之下,英特尔的处理器实现了全领域覆盖(尽管发布日程很磨蹭);它的Broadwell产品线包含从双核四线程3.5W超低功率的移动处理器,一直到22核44线程145W的服务器芯片(或时钟速度更高的12核24线程160W处理器)。&/p&&p&&strong&是时候新起炉灶了&/strong&&/p&&p&2013年,AMD终于放弃了对推土机处理器的希望。他们必须开发出一种新的架构。AMD的目标是:新的处理器架构必须在高端桌面市场有足够的竞争力,而且至少要比挖掘机的IPC高40%。 &/p&&p&就像之前的英特尔一样,AMD也希望打造全领域覆盖的产品线,从无风扇的移动端到服务器和高端桌面。所以改良后的IPC需要与同样经过改良的功率效率结合。但AMD还不打算彻底抛弃推土机:公司依然坚信未来是属于大量同时多线程的,而且AMD的一些设计决策也暗示了它仍把GPU当做浮点运算的核心。 &/p&&p&经过四年的闭门造车,Zen处理器作为该理念指导下的成果终于浮出水面。关于推土机没有达成的IPC目标,AMD说Zen已经远远超出了提高40%的预设指标。在单线程运行速度3.4GHz的Cinebench R15测试中,Zen跑分比挖掘机高出58%,比打桩机高出76%。就IPC提高而言,与挖掘机相比Zen进步了52%。而且这一切是在大幅降低的功率下做到的:在多线程Cinebench R15测试中,Zen的效能功耗比是打桩机的两倍还多。 &/p&&p&与推土机家族相比,Zen有了全方位地提升,如果说不完全算是公平竞争的话,至少英特尔现在有了一个有趣的对手。跟完全不在一个量级上的英特尔比性能是AMD以前想都不敢想的事情,这么多年过去了,AMD凭借Zen终于可以与之媲美。 &/p&&h2&&strong&引爆点&/strong&&/h2&&p&Zen的基本构件是核心复合体(CCX):四核为一个单元,同时跑八个线程。恰好印证了AMD在桌面处理器的设计上对多核多线程的信仰的是,第一代锐龙Ryzen 7系列处理器搭载两个CCX,共八核十六线程。有三个版本即将发布:1800X,速度3.6-4.0GHz, 售价 $499/?490; 1700X,速度3.4-3.8GHz ,售价 $399/?390,以及1700, 速度3.0-3.7GHz,售价 $329/?320 .&/p&&p&&figure&&img src=&/v2-98d9ccd2c5cb49dceca9b9d_b.jpg& data-rawwidth=&640& data-rawheight=&301& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&/v2-98d9ccd2c5cb49dceca9b9d_r.jpg&&&/figure&Zen的核心复合体&/p&&p&第二季度中,锐龙Ryzen 5也将面世。R5 1600X是六核十二线程的芯片,以3.6-4.0GHz运行(两个CCX各关闭一核),1500X是四核八线程的芯片,以3.5-3.7GHz运行(只有单个CCX)。 &/p&&p&Zen也会扩大规模。今年某些时候,AMD将会发布服务器处理器,代号“那不勒斯(Naples)”,搭载八个CCX,32核,64线程。 &/p&&p&不同的设计决策已经让AMD和英特尔分道扬镳了。英特尔的处理器性能分布被岔开得很奇怪,它最新的处理器是Kaby Lake,但Kaby Lake只有双核和四核,有些有同时多线程(SMT)而有些没有。四核以上你又不得不回到前一代处理器架构了:Broadwell。 &/p&&p&2014年9月首次面世的Broadwell是英特尔14纳米工艺的芯片,上一代Haswell架构的微缩版。目前,任何大于四核八线程的主流桌面或移动处理器都是基于Broadwell。这不仅包括面向发烧友的Broadwell-E处理器,搭载了六核、八核或十核以及12、16或20线程;还包括Broadwell-EP服务器处理器,直到两周前刚发布的Xeon E7-8894V4。这是8个插口24核48线程的芯片,定价在9000美元且不会有过多浮动。 &/p&&p&第一代锐龙处理器刚好横跨英特尔产品线的断裂点。R7 1700多多少少会和Kaby Lake i7-7700K正面竞争。后者利用了英特尔14纳米工艺以及最佳单线程性能的最新架构,运行速度为4.2-4.5GHz. 但X将迎击Broadwell架构,分别是六核12线程3.6-3.8GHz的i7-6850K处理器(约$620/?580 ),以及八核16线程3.2-3.7GHz的i7-6900K处理器(约$1,049/?1,000)。到了更高核数,英特尔就会迫使你放弃最新的核和最高的电源效力,从而不得不换回更老的、更新频率比较低的芯片集(目前的X99早在2014年底就发布了)。 &/p&&h2&&strong&更大更强悍的内核&/strong&&/h2&&figure&&img src=&/v2-d18d8f452a404acdfc09f_b.jpg& data-rawwidth=&640& data-rawheight=&639& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&/v2-d18d8f452a404acdfc09f_r.jpg&&&/figure&&p&这些新的核都比推土机搭载了更多的运行资源。在整数管线上,Zen有4个算术逻辑单元(ALU)和两个地址产生单元(AGU)。浮点管线上,共享浮点单元的概念被废弃了:现在每个核都有一对独立的128位乘法叠加运算单元(FMA)。浮点单元内有分开的加法和乘法管线,用于在不进行乘法累积运算时应对更多样的混合指令。但256位AVX指令集还是得分开在两个FMA单元上执行,并动用所有的浮点单元。&/p&&p&这是推土机之后的巨大飞跃,从本质上讲,每个核可动用的整数和浮点运算资源都翻了个倍。然而与Broadwell和Skylake相比就不好说了。AMD的四个ALU虽然相似但不完全一样,所以有些指令必须在特定单元内处理(只有一个会算乘法,另一个会算除法),就算有其他的闲置单元也不能跨界运行。英特尔的就更加多样化,所以对于一些混合指令来说,英特尔的四个ALU实际上可能比AMD的要少。&/p&&p&更加复杂的是,AMD说总共六个指令可以在每周期中被发送到核的十个管线中(4个ALU,2个AGU,4个FP)。而Broadwell和Skylake都可以每周期发送八个指令。其中4个发送到AGU——Skylake有两个通用AGU和两个专用的。另外四个运算一些算数,要么整数要么浮点。&/p&&p&英特尔把所有功能单元分组分到四个发送端口下,编号0,1,5,6. 所有四个端口都包含一个普通的整数ALU,但端口0还含有一个AVX FMA单元、一个除法单元和一个分支单元。端口1有另一个AVX FMA单元但没有除法单元。端口5和6既没有FMA也没有除法单元。这意味着在一个周期内,处理器可以同时安排两个AVX FMA操作或是一个除法和一个AVX FMA操作,但没法同时做一个除法和两个FMA。&/p&&p&大体上,这说明在一个周期内,Zen可以发送四个整数运算和两个浮点运算。Skylake可以发送四个整数运算,但这需要动用所有四个端口,导致没法进行任何浮点运算。另一方面,Skylake和Broadwell都能在一个周期内同时发送四个整数运算和四个地址操作。Zen只能容纳两个地址操作。 &/p&&h2&&strong&推土机的弱点依旧如影随形&/strong&&/h2&&p&撇开区别不谈,我们就没法直接衡量这些设计的好坏。尽管如此,还是有些设计在个别方面的优势极其显著。英特尔的两种芯片都具备两个能同时启用的全256位AVX FMA单元。对于可以利用这一优势的代码来说,Skylake和Broadwell的性能都应该可以做到Zen的两倍。多年以来,AMD一直在尽力让GPU成为运行这种高强度浮点并行运算的最优选。所以某种意义上说这种差距也可以理解——但重度依赖AVX指令集的程序就会毫不犹豫地选择英特尔芯片了。 &/p&&p&比如这在Geekbench的浮点测试SGEMM中就非常明显。这是一个矩阵乘法测试,为了最佳性能会调用AVX和FMA指令集。在单线程上,6900K管理着大约每秒900亿单精度浮点指令(90 gigaflops)。相比之下,1800X的处理速度只有53 gigaflops。虽然1800X相对更高的时钟速度有点用,但英特尔芯片在每个周期内能完成其两倍的工作量。高出来的几百兆赫不足以抵消架构区别带来的劣势。&/p&&p&当然,这种工作量从某种角度证明了AMD的观

我要回帖

更多关于 cpu 知乎 的文章

 

随机推荐