| 第2代智能CPU核芯显卡性能测试 |
| 作者: 出处: 更新时间: 2011年01月06日 |
英特尔的集成显卡似乎总是个笑话,但这次确实不一样了。第二代智能处理器的CPU性能相比现在提升了10-30%,进化到第六代的“核芯显卡”图形性能则会轻松翻好几番。上代Westmere芯片虽然也自带了图形核心,但与CPU是双内核封装,只是通过45(网购最低价 1108元)纳米工艺、更多着色硬件、更高频率提升了性能。第二代智能处理器则将CPU、GPU封装在同一内核中,且全部都采用32纳米工艺,特别是显著提高了每时钟周期执行指令数(IPC)。
“核芯显卡”有着自己的电源岛和时钟域,同时也支持睿频加速技术,可以独立加速或降频,并共享三级缓存。显卡驱动会控制访问三级缓存的权限,甚至可以限制“核芯显卡”使用多少缓存。将图形数据放在缓存里就不用绕道去遥远而“缓慢”的内存了,这对提升性能、降低功耗都大有裨益。不过这么做并没有说起来这么简单。NVIDIA设计Fermi核心费了九牛二虎之力,英特尔的“核芯显卡”其实也差不多,同样进行了全新设计。
说到这里,我们想顺便提一下英特尔已经搁浅的独立显卡工程Larrabee。它的重点是广泛使用全面可编程硬件(除了纹理硬件),第二代智能处理器则是全面使用固定功能硬件,功能特性和硬件单元相对应,这样的好处是性能、功耗、核心面积都大大优化,损失则是缺乏弹性。显然,英特尔世界的中心仍旧是CPU,不能让GPU过分强大,这和GPU世界的NVIDIA的理念正好相反。说到这里,不知道既有CPU又有GPU的AMD会怎么想。
可编程着色硬件被称为EU,包含着色器、核心、执行单元等,可以从多个线程双发射时取指令。内部ISA映射和绝大多数DX10 API指令一一对应,架构很像CISC,结果就是有效扩大了EU的宽度,IPC也显著提升。抽象数学运算由EU内的硬件负责,性能得以同步提高。英特尔表示,正弦(sine)、余弦(cosine)操作的速度比现在的HD Graphics提升了几个数量级。第二代智能处理器的“核芯显卡”共分为两大版本,分别拥有6个和12个EU。
英特尔此前的图形架构中,寄存器文件都是即时重新分配的。如果一个线程需要的寄存器较少,剩余寄存器就会分配给其他线程。这样虽能节省核心面积,但也会限制性能,很多时候线程可能会面临没有寄存器可用的尴尬。在芯片组集成时代,每个线程平均64个寄存器,Westmere HD Graphics提高到平均80个,“核芯显卡”则每个线程固定为120个。所有这些改进加起来,每个EU的指令吞吐量都比现在的HD Graphics增加了一倍。
(本文已被浏览 1032 次)
|
|
|
|
|
| | | |
|