Intel Cluster Studio 2012 For Linux* OS or Windows* OS 建立HPC集群计算性能和可伸缩性的新标准
软件包含以下内容:
Intel Cluster Studio
Intel Fortran Compiler
Intel Integrated Performance Primitives
Intel Parallel Building Blocks
Intel Math Kernel Library
Intel MPI Library
Intel Trace Analyzer and Collector
Intel MPI Benchmarks
英特尔.ClusterStudio为基于英特尔.架构(IA)的集群的分布式性能设定了新标准。此高级工具套件提供了开发灵活性,为基于英特尔.IA-32和英特尔.64位架构的高度并行化共享内存和集群系统提供了基于MPI的应用程序性能支持。
采用全新架构的英特尔.MPILibrary4.0Update1是实现这些优势的关键所在,它提供了新级别的集群可伸缩性、跨多种结构的改进型互连支持、更快的节点上消息传递、混合并行化支持和适合集群与应用程序结构的应用程序调优功能。
对于开发人员来说,英特尔.TraceAnalyzer和Collector8.0Upgrade1因为具备可加速基于MPI的集群应用程序的分析和调优周期的新特性,从而在性能上得以增强。最新的英特尔.C/C和FortranCompilerXE12.0技术以及英特尔.MathKernelLibrary(英特尔.MKL)10.3、英特尔.IntegratedPerformancePrimitives(英特尔.IPP)7.0进一步补充了这款套件。英特尔.ParallelBuildingBlocks(英特尔.PBB)的线程技术是该工具包中的新增特性。这包括多种用于任务、数据和向量并行化、英特尔.CilkPlus、英特尔.ThreadingBuildingBlocks和英特尔.ArrayBuildingBlocks(目前为测试版,单独提供)的线程机制。这有助于进一步优化和并行化集群的各计算节点上的应用程序执行。英特尔Fortran编译器引入了Co-arrays,这是Fortran2008标准支持的关键特性。此工具包提供了对HPC集群上Co-ArrayFortran(CAF)的支持。为了通过SSE和英特尔.AVX利用IA处理器改进的向量支持,编译器包含数组赋值语义和SIMDpragmas,可提高向量化效率和易用性。
英特尔.ClusterReady(英特尔.ICR)是一个定义集群架构的项目,旨在提高基于IA的高性能集群的正常运行时间、生产力,同时降低其总体拥有成本(TCO)。英特尔为HPC集群从开发至部署提供了一整套工具。英特尔.ClusterStudio2011使您能够更轻松地为基于MPI的集群应用程序编码、调试和优化,以便提高其可伸缩性。它为开发和调优混合并行代码提供了大量软件工具,使您能够将MPI与多线程范例混合使用,例如OpenMP*或英特尔.ParallelBuildingBlocks(英特尔.PBB)中的并行线程技术。
英特尔.Cluster Studio 2012提供了完整的软件包,包括用于英特尔.IA-32和英特尔.64位架构的英特尔.C/C编译器和英特尔.Fortran编译器以及英特尔ClusterStudio的英特尔.集群工具组件,帮助开发、分析和优化Linux*或Windows*OS上的高度可伸缩性应用程序的性能。通过将所有这些编译器和工具整合到一个许可包中,英特尔以极低的软件包价格为同类最佳集群软件工具提供了单一安装、互操作性和支持。
特性:
全面的工具套件
英特尔Cluster Studio许可在Windows或Linux平台上提供了
对以下工具的访问和支持:
英特尔.C ComposerXE12.0
英特尔.FortranComposerXE12.0
英特尔.MPILibrary4.0Update1
英特尔.TraceAnalyzerandCollector8.0Update1
英特尔.MathKernelLibrary10.3
英特尔.IntegratedPerformancePrimitives7.0Update1
英特尔.ThreadingBuildingBlocks3.0Update3
英特尔.MPIBenchmarks3.2.2
英特尔.Debugger12.0(除英特尔.MPILibraryforWindows应用程序之外)
轻松安装和更新:
使用英特尔.ClusterStudio的有效产品序列号,您可以注册和/或登录英特尔.软件开发产品注册中心(https://registrationcenter.intel.com/),自购买之日起一年期限内,您可在此下载产品包并进行更新。
特色产品:
英特尔ClusterStudio包含的所有软件工具均经过修订,可为MPI集群软件开发提供最佳的并行开发和性能分析工具。以下列表仅列出此最新版本提供的众多新特性中的一部分:
英特尔ComposerXE
多核优化——英特尔编译器采用内置优化技术和多线程支持,帮助创建能够在最新英特尔?多核处理器上以最佳表现运行的代码。英特尔FortranCompilerXE12.0提供集群上的CAF支持,这是Fortran2008标准支持的重要特性。
优化应用程序——英特尔编译器提供了广泛的高级优化、多线程处理和处理器支持,其中包括自动处理器调度、向量化、自动并行化、数据预取和循环展开。可以利用混合并行性模型,将进程、任务、数据和向量并行性与MPI和线程模型(如OpenMP、英特尔.CilkPlus和英特尔.TBB方法)混合使用,以便在两路、四路和八路的多核节点构成的集群(每个节点作为一个SMP)上大幅提升应用程序性能。
新特性——有关各种英特尔编译器新特性的更多信息,请访问:http://software.intel.com/en-us/intel-compilers。
英特尔MPILibrary4.0Update1
英特尔MPILibrary4.0Update1为英特尔?平台集群上执行的应用程序提供了全新级别的性能和灵活性。该库通过改进的互连支持、更快的节点上消息传递和适合集群架构和应用程序结构的应用程序调优功能,实现了这些优势。该库还特别提供multirailInfiniBand*(IB)支持,同时增强了本机IB层,以减少通信延迟。此外,该库与旧版英特尔MPI3.x兼容,同时提供了改进的库架构,支持供应商与英特尔处理器的互连,可最大限度地利用未来的最大性能和功能。
英特尔TraceAnalyzerandcollector8.0Update1
英特尔TraceAnalyzerandCollector8.0Update1具有全新的增强功能,可加速基于MPI的集群应用程序的分析和调优周期,使程序员能够分析高级互连对于应用程序性能的影响。英特尔TraceAnalyzerandCollector8.0Update1的负载失衡范例和理想互连模拟器可帮助MPI程序员识别更多的优化机遇。
英特尔MathKernelLibrary10.3
英特尔MathKernelLibrary10.3(英特尔?MKL10.3)是高度优化的、全面的线程化数学例程库,适用于需要最大性能的科学、工程和金融应用程序。核心数学函数包括BLAS、LAPACK、ScaLAPACK、SparseSolvers、FastFourierTransforms、ClusterFFTs、VectorMath等。英特尔MKL10.3是一个修订版,提供了英特尔?AdvancedVectorExtensions(英特尔?AVX)支持、LAPACK和PARDISO的C语言扩展、SummaryStatisticsLibrary,以及对DGEMM、FFTS、RNGs等多种例程的增强。
英特尔MPIBenchmarks3.2.2
英特尔MPIBenchmarks3.2.2提供了以下特性:
为某些MPI集合基准测试(如Allgather、Alltoall、Gather和Scatter)提供超过2GB的超大消息缓存支持,还支持较大的内核数。
全新的英特尔?MPIBenchmark可执行命令行选项“-include/-exclude”,更好地控制基准测试列表的执行。利用这些选项可在默认执行列表中包含或排除基准测试。
全新基准测试PingPongSpecificSource和PingPingSpecificSource。在PingPong和PingPing测试中使用准确的目标评级以替代MPI_ANY_SOURCE。默认情况下不会执行这两种测试。使用“-include”选项启动执行新的基准测试。