通过之前的新闻,我们对Intel最新的32nm六核处理器性能有了一定的了解(参考:超强24线程! Intel 32nm六核性能曝光),不过上面文章中的测试环境为服务器主板,并采用双颗六核对比Xeon,测试项目较少,对我们玩家而言没有任何意义,不过今天文章中所测试的为单颗六核Gulftown搭配X58来进行比较完整的测试,让我们可以近距离的了解下代Intel最强处理器的威力。之前一直有消息表明:这颗最新32nm六核处理器Gulftown将会命名为Core i9,但现在看来可能依旧沿用i7系列,预计将会在明年第二季度发布。
目前,这款核心代号为「Gulftown」基于全新32nm的Intel处理器已经准备就绪,尽管在微架构上没有大幅改动,但在32nm工艺的辅助下,凭着工艺上的进步,在相同的芯片大小下能容纳更多的物理核心,而且核心频率提升空间又进一步扩大,同时功耗表现也得到改善。Intel计划于2010年第二季中推出首款六核心DT处理器,香港著名IT网站HKEPC首先抢先找来了号称全港首颗Gulftown六核心工程样本,并与Bloodfield四核处理器作了详细的对比测试:
1、回顾Nehalem架构处理器的技术进步
为拉开与对手之间的技术距离,2006年下半年Intel宣布推出全新规则律动工艺年与架构年(Tick-Tock)的发展战略,于每年推出新处理器技术时,皆具备改良微架构的全新制程,全新或大幅改良的微架构设计,以迎合未来十年甚至更远的处理器市场。每个代表推出具有增强微架构的新一代矽制程技术,与代表推出全新微架构,而每个工艺年/架构年周期大约为2年。
按照Tick-Tock规划,Intel在去年第四季发布了代号为Nehalem全新微架构处理器,这名字来自美国俄勒冈州波特兰市的一个小小的卫星城,它是基于Core 微架构作出大幅改良,加入了更多有关提高性能,节能控制,多处理器扩展能力以及效能均衡的设计,主要分为运算内核及非运算内核部份:
运算内核改动方面:
1.再次加入HT技术,第三代超线程技术,可让四核多达8个线程。
2.支持VT虚拟化技术,增加虚拟化输入/输出设备,并提高虚拟机效率。
3.加入Turbo Mode ,在相同功耗下,提升较简单线任务的执行效率。
4.新增SSE 4.2指令集,提升XML 、字串及文本处理能力。
非运算核心改动方面:
1.采用了三级缓存设计,二缓采用了超低延迟设计,而三缓采用共享设计。
2.内建内存控制器,3通道设计并支持DDR3规格,频率提升最高达3倍。
3.全新QPI取代传统的FSB,最高可达25.6GB/s带宽。
4.模块化设计,可按需要新增及减少核心元件,以迎合不同市场。
2、改良Nehalem架构,全新32nm处理器
Nehalem微架构是最近的一次架构年改变,当然紧接着即将登场的是下一代工艺年的改变 ,具备改良的微架构的全新制程,代号为Westmere的32nm处理器,基本上它的架构沿自Nehalem处理器并加入了7条全新的指令,但改用了入第二代high-k的32nm制程,采用全新的193浸没式微影技术于重要的金属层并配搭193nm或248nm干式微影技术于非重要的金属层,处理器采用9层内部连结层,并辅以无铅和无卤素封装,而芯片尺寸将约为45nm产品的70%而已。
据Intel总裁Paul Otellini指出,全新32nm不仅有效降低所需功耗,同时也能提升核心频率,而且也缩小处理器核心面积,令处理器能容纳更多的运算核心或者内置GPU核心、PCI-E接口及内存控制器,并且令芯片组简化为单芯片,可进一步缩小PC体积,可切换GPU支持功能,能在内置显示核心及独立显卡之间作出实时切换,达至节能省电效果。
为迎接32nm工艺的来临,Intel将会把美国制造设施升级,采用新一代32nm芯片技术,2009至2010年间,预计投入约70亿美元于32nm工艺技术上,美国境内32nm工艺投资总额,在该期间内将达到约80亿美元,并可提供7000个工作岗位。现时位于Oregon的Fab D1D已经在试产32nm处理器,同样位于Oregon的Fab D1C将会于2009年第四季正式投产32nm制程,紧接位于Arizona的Fab 32及New Maxcico的Fab 11X ,将会于2010年完成32nm制造设施升级,预计将会于2010年下半年进行制程世代交换。
根据Intel处理器最新规划,32nm Westmere处理器将会于2009年第四季开始量产,核心代号为Clarkdale的32nm入门至主流级处理器,将会于2010年第1季初出货,紧接2010年第二季中推出代号为Gulftown的32nm高端六核处理器,2010年第四季将会再推出全新微架构的32nm处理器代号Sandy Bridge,延续工艺年发展战略。 3、改良45nm High-K + Metal Gate电晶体技术
2007年Intel首次在代号为P1266的45nm工艺中使用上High-K配搭Metal Gate技术,令芯片漏电情况大幅降低,因此Intel 45nm处理器在功耗及发热表现上,拥有很高水平,而直至目前为止,也只有Intel把45nm High-K + Metal Gate电晶体技术用于量产之中。由于High-K材料配搭Metal Gate电晶体技术带来优秀表现,Intel 45nm研发至量产是Intel历史中最快完成的,所需的研发时间仅为65nm的一半。
代号为P1268的全新Intel 32nm工艺,主要基于现有的45nm High-K + Meta Gate电晶体技术,并作出了大幅度的改良,包括High-K的等效氧化层厚度,由45nm制程的1nm降低至32nm制程只有0.9nm,并且闸极长度缩少至只有30nm,闸极距离继续以每两年缩少0.7x的目标发展中,Intel的32nm是现时所有相同制程中其闸极距离最窄小的。
透过了降低High-K的等效氧化层厚度及闸极距离,Intel 32nm的NMOS及PMOS电晶体性能相较上45nm提升14%及22% ,漏电比较上代45nm制程,NMOS电晶体减少超过5x,PMOS电晶体减少漏电超过10x,以上的改善令处理器工程师在电路设计时规限大幅减少,也令核心可以更小,当然处理器核心频率及功耗表现也能大幅减少。
Intel 32nm制程同时改用了第四代应变矽技术,用矽锗、双应力应变矽以及先进的应变记忆技术,能够有效提高晶体管的开关速度和电源效率,此一改变将可在运作频率及功耗表现在获益重大改善。
4、针对加密/解密运算全新AES指令集
Intel Westmere处理器是代表推出具有增强微架构的新一代矽制程技术,因此技术改良主要集中于矽制程上,而微架构设计完全则基于Nehalem微架构,今代在微架构改良仅加入了六组针对加密及解密运算,即AES指令集。
Intel AES指令集提供了快速及保密的资料加密及解密运算功能,AES是block cipher(块密码)运算的最主流规格,因此全新Intel AES指令集能应用十分广泛并能为不少应用程序进行加速。
Intel AES指令集共有六组指令提供硬体AES运算加速,包括四组AES加密及解密(AESENC、AESENCLAST、AESDEC、AESDECLAST) ,另外两组为AES金钥产生(AESIMC、AESKEYGENASSIST) ,相较单纯以软体运算效能可高出4倍以上。 此外, Intel AES指令集不仅支援3种AES官方规格金钥长度(ASE128、ASE192、ASE256)及所有AES官方规格运算模式,并支持数种AES非官方定义规格。
除了性能上的提升外,采用Intel AES指令集让资料以data-independent time运算及不需要采用lookup Table,Cache Attacks的攻击无法再成功,而且难以采用Software Side Channel Attacks破解,大大提高了资料的安全性及保密性。
此外,Intel Westmere处理器还加入了一组Carryless multiply指令(PCLMULQDQ) ,让处理器可以在一个周期内处理两个64Bit Carry-less Multiplication(无携带乘法) ,它是大部份加密标准所必要处理的元件,采用伽罗瓦计数器模式(GCM) 。
GCM模式在2006年4月得到美国政府批准及支持,与AES规格混及使用,并成为NSA Suite B.的一部分,它也是IEEE 802.1ae标准,并建议使用于转发率高于10 Gbps的应用中,包括IPsec (IPsec RFC 4106)协定及ISO T11标准光纤通道存储标准的P1619安全协定。
有了Intel AES指令集,日后PC的OS Level Disk可完全加密形以提升保安性,而且不会把系统效能拖垮,不仅在商业应用上令保密性大幅提高,一般PC用户的个人资料亦得到更好的保障。