AMD今天正式发布了全新一代Opteron 6100系列服务器处理器产品,这也是全球首批8核心以及12核心x86处理器,主要面向双路和四路服务器市场。
一、新的封装形式
Opteron 6100系列处理器开发代号“马尼库尔”(Magny-Cours),基本上可以看作是两颗六核心“伊斯坦布尔”(Istanbul)采用多芯片模块(MCM)方式封装在一块硅片上而来,并采用新的1944针Socket G34封装接口,不过非核心(Uncore)部分发生了很大变化:内存控制器升级支持标准DDR3-1333和低压LV-DDR3-1333,并且为了控制缓存一致性做了多方面的增强。
内存方面,Opteron 6100内部的节点拥有两个DDR3通道,整个处理器支持四通道内存,理论峰值带宽42.7GB/s,不过北桥速度只有1.8GHz,因此两个64位北桥合力带宽也不过28.8GB/s,这也是为了保持功耗的代价。
下图就是12核心Opteron 6100处理器的结构简图,其中红色虚线代表四个内存通道,蓝线代表内部HT缓存一致性连接,灰线代表外部缓存HT连接,绿线代表非一致性I/O HT连接,其中粗线是HT x16带宽、细线是HT x8带宽。
Opteron 6100系列采用了第二代直连架构(DAC 2.0),每个处理器内部的两个内核(Die)或称节点(Node)之间拥有多达24条HT总线直接相连,完全不存在带宽瓶颈问题,优于Intel当年通过外部前端总线(FSB)连接两个内核的做法。
下边就是Opteron 6100处理器在单路和双路情况下的互联情况,限于篇幅这里不再详述。
二、型号与规格
Opteron 6100处理器采用GlobalFoundries 45nm SOI工艺制造,每个内核/节点的核心面积为346平方毫米,总共集成18.08亿个晶体管,一级缓存每核心64+64KB,二级缓存每核心512KB,三级缓存共享12MB,支持四条HT 3.0 x16总线,每连接最高带宽6.4GT/s,支持四通道LV & U/RDDR3,-1333内存,每通道最多三条内存条,每处理器最多12条,支持AMD-V虚拟化技术。
Opteron 6100系列处理器首批型号共有十款,其中8核心、12核心各五款,主频1.7-2.3GHz不等,平均处理器功耗(ACP)有65W(HE)、80W、105W(SE)三种,价格455-1386美元,具体如下:
Opteron 6176 SE实物图:
三、功耗
Opteron 6100系列处理器支持多种节能技术,包括全局性的CoolSpeed、管理内核的PowerNow!、管理缓存的SmartFetch、管理HT总线连接和内存控制器的C1E。
C1E模式只有在所有核心均长期处于完全空闲状态的时候才能达到,此时一级和二级缓存中的所有数据都转移到三级缓存之中,然后所有核心进行时钟门控(Clock Gated),HT总线连接和芯片组也随之转入低功耗状态。在双路配置中两颗处理器要么都是C1E模式,要么都不是。
C1E模式之下,核心时钟关闭(时钟门控C1状态),三级缓存、北桥和内存控制器时钟频率分离,所有的HT总线连接转入LS2低功耗状态(LDT_STOP_L),DRAM DLL关闭。
按照AMD的说法,六核心Opteron 2425 HE 2.1GHz/55W在满负载下的功耗是215W,而核心数量翻番的Opteron 6164 HE 1.7GHz/65W满载功耗也不过225W,只增加了区区4%。两颗Opteron 6174 2.2GHz/80W在同样的双路系统上实测满载功耗为263W。
四、芯片组与未来规划
Opteron 6100系列处理器搭配的芯片组是SR56x0系列北桥芯片、SP5100南桥芯片,前者采用台积电65nm工艺制造,29×29mm FCBGA封装,最大热设计功耗13W,空闲功耗7.5/7.3/7.1W,分为SR5690、SR5670、SR5650三款型号,支持HT 3.0总线(最大带宽5.2GT/s)、PCI-E 2.0总线、可分别提供42/30/22条PCI-E连接,支持AMD-VI(IOMMU 1.2)虚拟化技术,并支持多种错误纠正和隔离技术。
SP5100南桥采用台积电0.13微米工艺制造,21×21mm 528-ball FCBGA封装,最大热设计功耗4W,空闲功耗1W,支持12个USB 2.0和2个USB 1.1接口、PCI 2.3总线、6个SATA 3Gbps接口(可独立屏蔽)、支持DotHill RAID组建软件磁盘阵列。
Opteron 6100系列处理器加上SR56x0+SP5100芯片组构成了AMD的新一代服务器平台“马拉内罗”(Maranello),稍后还会有代号“里斯本”(Lisbon)的4/6核心处理器Opteron 4100系列,使用Socket C32封装接口,加上芯片组构成新平台“圣马力诺”(San Marino)和“阿德莱德”(Adelaide),面向单路和双路市场。
等到2011年,备受瞩目的全新架构“推土机”(Bulldozer)终将面世,处理器有代号“英特拉格斯”(Interlagos)的12/16核心Opteron 6200系列和“巴伦西亚”(Valencia)的6/8核心Opteron 4200系列,分别继续使用Socket G34和Socket C32接口,向下兼容。
五、性能简单测试
服务器处理器的性能衡量标准和我们平常接触的桌面系统完全不一样,而且距离普通用户也比较远,所以就不再深入讨论,只选择AnandTech的一些测试数据简单看看。
测试中数据库文件放在两块Intel X25-E 32GB固态硬盘组成的RAID 0阵列上,日志文件纪录在另一块同样的固态硬盘上。再增加固态硬盘对性能的影响也是微乎其微(1%),所以这里不是瓶颈。
测试系统一(AMD Magny-Cours参考平台):
两颗AMD Opteron 6174 2.2GHz十二核心处理器
AMD Dinar主板(AMD SR5690+SB750芯片组)
ECC R DDR3-1333 4GB×8内存
Broadcom NetXtreme II BCM5709千兆网卡
1200W电源
测试系统二(超微A+ Server 1021M-UR+V系统):
两颗Opteron 2435 2.6GHz六核心处理器(伊斯坦布尔)
两颗Opteron 2389 2.9GHz四核心处理器(上海)
超微H8DMU+主板
DDR2-800 4GB×8内存
650W电源
测试系统三(华硕RS700-E6/RS4准系统):
两颗Intel Xeon X5570 2.93GHz四核心处理器(Gainestown)
两颗Intel Xeon X5670 2.93GHz六核心处理器(Westmere)
华硕Z8PS-D12-1主板
ECC R DDR3-1333 4GB×8内存
Intel 82574L PCI-EGBit千兆网卡
770W电源