马尼库尔的电源管理新特性很吸引人,请介绍一下工作原理。
Patrick Patla:马尼库尔和稍后的里斯本处理器在电源管理方面引入了C1E空载状态休眠技术,在四路48核系统中可以节省最多50W的功耗,特别是皓龙4000系列平台中更强调功耗和电源优化,其中“阿德莱德”(Adelaide)平台可以从BIOS设定等各个环节做到功耗的节省。
二、皓龙6000平台具备丰富的虚拟化功能,并且凭借显著提升的内存带宽可以支持更多虚拟机,而内存带宽和不同功耗产品之间具有一致性,因此内存带宽不会因功耗降低而受到影响和牺牲,这是如何做到的?对于高端用户来说有哪些好处?
Patrick Patla:AMD现在服务器平台上使用的都是第二代直连架构DAC 2.0,现在是12核,明年还要推出16核。我们在整个产品研发和设计过程中都注意了能效方面的管理及相应的对超传输总线、内存总线和内存通道的需求。
三、皓龙6000采用了四通道内存,并增加了一条超传输总线,这两方面的改进可以显著提升哪些关键应用方面的表现?
Patrick Patla:我们前面也提到过,皓龙6000平台最好的应用就是在虚拟化、数据库、高性能计算方面,特别是高性能计算客户,他们一直都在费劲脑筋地思考如何使现有系统中的部件结合得更紧密,而这些方面都可以显示出我们产品的长处。
四、皓龙6000系列和4000系列采用了G34和C32两种不同的接口,AMD这样做除了市场划分之外,有没有技术方面的原因?二者的命名又是如何来的呢?
Patrick Patla:G34接口处理器的体积更大一些,可以容纳更多的核心(最多16个)、更多的内存通道(四个),尺寸是42.5×60毫米,而C32基于现有的Socket F 1207插槽,针脚数也一样,可以容纳6个核心(明年8个)、两个内存通道,尺寸是40×40毫米。不同的平台有着不同的针脚机制,所以这样做(两种接口)主要是基于对内存通道和容量、核心的考量。
G34、C32中的“3”都代表我们的第三代插槽。G34中的“4”代表四路,G就是General Purpose,即通用的。C32中的“2”代表“2路”,C就是Cloud,即云计算。所以整体解读,G34就是通用的第三代四路平台,C32就是面向云计算的第三代双路平台。
五、对高性能计算用户来说,在性能和价格方面他们可能更关心性能,是否可以介绍一下皓龙6000平台在高性能计算(HPC)方面的情况?
Patrick Patla:皓龙6000平台一个很大的特点就是内存有很大的性能提升。对石油、油气等行业的用户来说,他们对运算建模的要求是非常高的,内存性能的提升可以使他们构建更大的模型。这样的HPC内存密集型应用,更多的是适用于石油、地质勘探公司,至于教育和金融业也都应该有很好的应用。G34的48核处理器最多可以支持0.5TB内存。
唐志德:我补充一下,高性能计算大部分是用于研发,比如刚才说的石油勘探,这些都对浮点计算和内存有很高的要求。Linpack就是高性能计算的一个衡量标准,主要通过浮点计算流水线和处理器主频来分析峰值浮点性能。还有内存通道和带宽方面的优势,比如内存支持到512GB,这都是HPC所需要的,也只有AMD G34产品可以提供。
六、伊斯坦布尔引入了HT Assist技术,马尼库尔又将超传输总线增加到四条,请问它们是如何协同工作来提升多路系统性能的?
Patrick Patla:HT Assist技术是非常重要的,是我们现在和未来相关升级以及多核心的关键性技术。这个机制可以让处理器直接从缓存中获取所需要的信息,在2010新平台(皓龙6000系列)引入之前通过它可以获得更好的超传输性能。现在新平台四路系统在处理器之间的通信全部只需要一跳(1-hop)就可以,不再有时候还得两跳。
七、皓龙6100 12核处理器比上代6核增加了一倍的核心,但是功耗几乎没有增加,AMD是如何做到这一点的?
Patrick Patla:三年前我们发布巴塞罗那的时候,它是四核的,主频2.3GHz左右,再往前三年的单核皓龙是1.8GHz,而现在增加到了12核,所以皓龙系列发展的过程中,基本上每三年核心数就要增加两三倍,而整体功耗都是差不多的。至于如何做到的,首先是从设计入手,进行低功耗优化,第二是专注于节省功耗的各种技术,包括CoolSpeed、C1E和硬件热能控制三个方面,另外还有生产工艺的改善。
八、皓龙6000系列处理器有四条超传输总线,其中三条连接到其他三颗处理器,那么第四条有什么作用?
Patrick Patla:四条超传输总线有三条用户处理器之间的互联,第三条则连接到北桥,可以参考系统架构图。
唐志德:在老的多路平台上没有相互直连,四路系统中对角两个处理器要互相访问,需要(绕道其他处理器)跳两次,而皓龙6000平台上通过更多超传输总线,可以实现直接访问。