导语:说起超级计算机(Super computer),人们一般会想到那些由成百上千个处理器组成的,被用来完成超大型复杂计算的“超级”机器。是的,超算中心或超算系统,主要面向的就是科学计算领域。它拥有强大的数据处理和存储能力,能够承担起各种大规模的科学计算和工程计算任务,对于很多重要领域的研究工作至关重要。
超算系统往往有着惊人的计算速度和能力。例如,用一台普通计算机分析某领域过往数十年的数据,可能需要花上十几年时间,但如果使用超级计算机,或许只需要一个小时。这也是超算系统被大量用在国家级和社会科研机构的主要原因,特别是在能源探索、自然灾害研究、气象预报、地质勘查、城市规划等领域,可以说,我们日常所看到的研究成果,基本都离不开“超算”的功劳。
关乎国计民生的“超算”,为何越来越重要?
随着智能时代数据量的攀升,超算系统的应用场景已从最初的能源、科研等核心领域扩展到了社会的多个方面,甚至走入千千万万家企业,形成了规模巨大的计算产业,引发了人类社会的深刻变革。可以说,智慧时代的竞争很大程度上也是计算力的竞争,谁掌握了更强的超算能力,谁就能在科技领域拿下一个战略制高点。
2019年5月,价格9位数美元、占地两个篮球场,由AMD公司与美国橡树岭国家实验室 (ORNL) 和Cray公司联合打造的新一代超级计算机 Frontier官宣将于2021年交付,作为美国能源部下属橡树岭实验室有史以来打造的性能最强的超级计算机,届时预计将成为世界最强的超级计算机,运行峰值可达每秒1.5 exaflops(百亿亿次)。这台超级计算机基于下一代AMD EPYC霄龙处理器、Radeon Instinct加速卡、ROCm开源软件三大平台,将帮助研究人员利用前所未有的计算能力和下一代人工智能技术来搭建、模拟和提高对天气科学、亚原子结构科学、基因组学、物理学等科学领域现象的理解。
超级计算机作为高科技发展的要素,对于所有行业都意义重大。很显然,目前E级超算(百亿亿次)超级计算机已成为国际上高端信息技术创新和竞争的制高点,而“芯片”作为超算系统的灵魂组成部分,也从未变得如此重要。
算力超强,第二代AMDEPYC处理器打造前所未有“芯”速度
超级计算机主要包含两个方面的特点:一是极大的数据存储容量,二是极快速的数据处理速度。因此,它才可以在多个领域进行人或者普通计算机无法完成的工作。要想实现这两点,服务器的“芯”几乎发挥着决定性的作用。
在推动百亿亿次级超算的历程中,AMD EPYC处理器的推出就像一匹横空出世的“黑马”,直接将超算系统可利用的性能推向了新的高度。基于 7nm 制程工艺的第二代 AMD EPYC处理器,最高拥有64核128线程,支持 128 个 PCIe Gen 4.0通道和 8个内存通道,并可访问高达 4 TB 的高速内存。其采用的下一代AMD Infinity架构,突破了x86性能和计算能力的界限,能够获得超高的核心数量和内存带宽,包括PCIe 4.0接口,带来了前所未有的数据处理速度和存储容量。对于高性能计算,第二代AMD EPYC处理器能提供创纪录的浮点性能 ,同类产品最高的DRAM内存 和I/O带宽,以实现超强的HPC负载,高达2倍的计算流体力学性能 ,以及最高可提升72%的结构分析性能,实现更强的计算速度和性能。
在云计算中心、AI超算中心等算力的“新阵营“,第二代AMD EPYC能获得与本地部署相同的高性能。为了确保更好的云端体验,AMD不仅与与腾讯云、AWS,Microsoft Azure,Google Cloud,Oracle Cloud等主流云提供商的合作,让用户能够在云端享受到第二代AMD EPYC的超强性能,其自身卓越的兼容性、灵活性、高可扩展性和安全性,也能让客户在云端用得方便、安心,享受到顶尖的云端高性能计算体验。
同时,面对人工智能与超算结合对算力提出的更高要求,AMD也在不遗余力地联合硬件合作伙伴,以满足超算系统需要的异构计算平台需求。在最新版本的异构计算开源基础ROCm中,AMD更新了诸多功能,旨在为开发人员提供更好的开源体验,社区对于AMD ROCm的支持也在持续扩大。这些努力将为客户的超算系统带来更高的并行浮点运算效率,更高的峰值处理能力,更高的吞吐量,以及更低的延迟。
斩获TOP 500超算十席,AMD EPYC处理器在“超算”圈大获青睐
正因为第二代AMD EPYC处理器超高的核心、海量带宽和优异的浮点运算性能等优势,越来越多的全球关键超算客户选择了跟AMD“交朋友”。
除了文章开头提到的Frontier超级计算机,AMD还联合劳伦斯利弗莫尔国家实验室(LLNL)和HPE,正在打造一款采用下一代AMD EPYC CPU和AMD Radeon Instinct GPU,以及开源的AMD ROCm异构计算软件的超级计算机El Capitan。El Capitan预计将在2023年初交付,拥有超过2 exaflops(百亿亿次)的双精度性能,交付后将成为世界上最快的超级计算机。
NVIDIA今年也宣布,其全新的AI和机器学习系统DGX A100将由第二代AMD EPYC 处理器提供支持。据悉,每台DGX A100都将配备两个第二代AMD EPYC 7742处理器,总计128颗核心,运行基础频率为2.25 GHz,最高加速频率可达3.40 GHz。该系统将可提供5 petaflops (每秒千万亿次) 的AI性能,使企业能够加速多种类型的AI工作负载,例如数据分析、训练和推理等。
根据最新的TOP500强超级计算机榜单,AMD EPYC处理器支持的超级计算机已经在全球高性能计算TOP 500强榜单中占据十席,并有4套由AMD EPYC支持的超级计算机进入全球高性能计算50强,分别为:Selene(第7名),来自Nvidia的DGX A100 SuperPOD平台;Belenos(第30名),法国气象局的两台BullSequana XH2000超级计算机之一;Joliot-Curie(第34名),来自法国国家高性能计算组织GENCI;Mahti(第48名),来自芬兰科学信息技术中心的BullSequana XH2000超级计算机。
除上述的TOP 500系统之外,AMD EPYC处理器还为斯图加特高性能计算中心的HLRS “HAWK”、德国天气预报服务公司(DWD)的NEC SX-AURORA TSUBASA、苏黎世联邦理工学院(ETH Zurich)的ETH ZURICH EULER VI、圣地亚哥超级计算机中心(SDSC)的DELL EXPANSE、英国国家研究创新局(UKRI)的CRAY ARCHER2、法国国家高性能计算组织(GENCI)的JOLIOT-CURIE等等超算系统提供服务,支持着世界各国在不同领域的超算任务。
在教育行业,AMD EPYC致力于支持全球高等院校实现科研突破,让科研改变未来。例如,印第安纳大学部署了超级计算机Big Red 200,运算速度超过每秒6千万亿次,并还将部署Jetstream 2,基于即将推出的第三代AMD EPYC处理器的分布式云计算系统,运算能力高达8 petaflop。普渡大学也将部署Anvil,一款基于下一代AMD EPYC处理器的超级计算机,能够支持广泛的计算和数据密集型研究任务。
在更广阔的科学领域,全球最大的粒子物理实验室欧洲核子研究组织(CERN)近期在Gigabyte服务器上选用了第二代AMD EPYC处理器来处理其大型强子对撞机(LHC)实验中的海量数据。AMD EPYC 处理器绝佳的PCI-E和内存带宽,能够有效帮助研究人员收集实验中每秒发生的40 TB冲突数据而生成的原始数据流,从而加速大型强子对撞机的亚原子粒子研究。得益于第二代AMD EPYC解决方案,CERN还将服务器数量减少了三分之一,这不仅节省了成本,更有利于CERN构建更高速、低延迟的网络,加速科学创新。
世界从未如此渴求“算力”,在这个算力的“黄金时代”,第二代AMD EPYC处理器助力科研人员利用超算探索最前沿的科学密境,也以多种方式为企业和数据中心提供着业界一流的高性能。超高核心数量、超大内存及I/O带宽所带来的创纪录性能,也正是AMD EPYC迅速在超算阵营圈粉无数的秘诀所在。
|