缓存容量破纪录!AMD 米兰-X将性能再提升66%

发布时间:2022-03-23 15:35:04

2022年我国政府工作报告中,可以看到较为突出的关键词有:“减碳”“治理”“改造”“推进”及“节能”等等,重点推进碳达峰、碳中和工作,并落实行动方案。

在关于数据中心发展方面,则多次使用了“约束、加强”之词,如:进一步约束数据中心的水资源利用率和循环措施;提升PUE+WUE效率,加强中水使用;加强数据中心废水、废油、烟气排放管理。

并且,随着能源、金属等价格的上涨,数据中心的投资与运维成本将继续上升,企业应进一步通过新技术来降低数据中心的成本。

 

数据中心节能,AMD已在路上

我们再来看看数据中心,在一排排星罗密布的机架中,能耗最高的当属CPU和GPU,它们一直都被誉为多核心、超高频率的“组合体”,动辄几百瓦的功耗需要大量制冷设备为其辅助散热,因此老旧数据中心的PUE值一直难以降下。
随着技术的不断演进,CPU的效率也越来越高,凭借核心数量及性能的优势AMD提出了“单路打双路”及“一台打多台”的新思路。值得关注的是,在很多企业级应用场景中,AMD确实做到了!
时至今日,AMD EPYC经历了三代的更新,性能方面已经“修炼”得炉火纯青,那么在2022年它将给企业级用户带来什么呢?
没错!就是3D V-Cache

 

正如之前互联网上的各种预测那样,AMD这次真的将3D V-Cache引入了EPYC处理器上,并让单颗处理器L3缓存容量破天荒地提升至768MB,或双路平台L3缓存则首度破“GB”大关,达到了1.5GB
这,就是传说中的米兰-X!

米兰-X问世,破纪录的L3容量

2022年3月21日,AMD正式推出搭载AMD 3D V-Cache技术的第三代AMD EPYC(霄龙)处理器,其内部代号为米兰-X。它可以看作是第三代EPYC的增强版,在保持功耗不变的同时,在诸多企业级应用场景下能够提供更高的性能。

 

3D V-Cache的首度亮相是在Computex 2021上,是通过3D形式堆叠更多芯片模组,进而构建出更大容量的3D垂直缓存(3D Vertical Cache)。近日AMD公布了第一款采用 AMD 3D V-Cache技术的锐龙处理器——锐龙7 5800X3D 处理器,就是通过3D V-Cache技术在顶部3D封装额外的新缓存,将三级缓存扩容到96MB,凭借这项行业领先的技术,5800X3D 的游戏性能可提升15%。
正如前文所述,在面向企业级的EPYC(霄龙)处理器中,AMD推出了拥有3D V-Cache技术的米兰-X处理器,并提供 16核7373X、24核7473X、32核7573X及64核7773X,共计4款可供选择。
64核128线程的旗舰型号7773X处理器,基础频率为2.2GHz,加速频率可达3.5GHz,TDP功耗280W。与米兰相比,米兰-X总L3缓存容量提升至768MB,相当于前者的3倍。

打破系统瓶颈的768MB缓存

我们来看看3D V-Cache缓存的分布情况。谈到AMD的Zen架构处理器,相信大家对CCD一定不会陌生,其为Core Chiplet Die的缩写,可以看作是多颗核心组成的处理器单元。

 

图:Zen3架构下的CCD单元(米兰)
一般情况下CCD核心单元包含CCX(CPU Complex,可看作是纯计算单元)及Infinity Fabric,每个CCX整合了8个Zen内核,每个核心都有独立的L1与L2缓存,L3缓存则为共享形式。因此,以Zen3架构EPYC 7003处理器为例,一组CCD核心单元就具备8核16线程,以及可共享的32MB的L3缓存。8套CCD核心单元组成具备64颗核心、128线程合计256MB的L3缓存。
CCD核心与I/O之间采用Infinity Fabric总线连接,它在扩展性、延迟和能效方面都表现出色,具备512-bit总线位宽。相比上一代罗马,EPYC 7003的每颗核心均可访问CCD单元中32MB的L3缓存,这在很多企业级应用中能够明显提升计算性能。
对处理器而言,L3缓存容量的大小极为重要。如果简单地将存储分层的话,可以看到站在性能制高点的是L1和L2缓存,但由于频率极高,受限于晶体管数量及良品率控制,所以容量不能做的很大。而再下一级就是L3缓存和内存,相比之下内存依然是“CPU之外”的存储,其位宽、频率及延迟等性能要远远逊于CPU缓存,所以这里就会出现一个超高速率的处理器+小容量缓存与大容量内存之间形成的性能“断层”。
如何很好地弥补这一“断层”?需要L3缓存来实现。L3缓存依然位于CPU内部,因此性能强劲,且容量能够做得相对大一些,就像是高速度的“存储池”,L3缓存向上承接超高速的L1及L2,向下则与更大容量但速度较慢的内存进行数据交换。因此L3缓存是拓宽系统数据交换瓶颈的重要“交通枢纽”。
多年来,AMD也是潜心致力于扩大L3缓存容量,用以提升整体性能。随着制造工艺的不断进步,3D V-Cache得以实现,AMD 米兰-X此次提升的就是CCD单元中L3缓存容量,从之前的32MB飙升至96MB,组成了共计768MB的超大容量。

 

 

另外值得关注的是,AMD推出的这四款米兰-X处理器无论核心数量多少,均配备了768MB的L3缓存,因此可以用脱胎换骨来形容。

米兰-X性能最高提升66%

如此规模庞大的L3缓存可以说是史无前例,那么它到底能带来多大的性能提升呢?
此次AMD也对米兰-X进行了全面测试,其中包括计算流体动力学(CFD)、有限元分析(FEA)、电子设计自动化(EDA)以及结构分析,这四大领域。

 

 

EDA是Electronic design automation的缩写,指的是利用计算机辅助设计(CAD)软件,来完成超大规模集成电路芯片的功能设计、综合、验证、物理设计,包括布局、布线、版图、设计规则检查等流程的设计方式。
在当今这个数字化时代,EDA被誉为半导体设计、制造方面的基石,也是工业领域重要的组成部分。包括AMD、高通、三星等厂商在芯片设计方面也都离不开EDA。在各种复杂设计的模拟方面,性能强劲的服务器可以让工作效率实现大幅提升,并可直接缩短设计周期。
在EDA测试中,拥有3D V-Cache的第三代AMD EPYC 7373X对比EPYC 73F3,结果显示能够为Synopsys VCS这样的EDA RTL模拟提供高达66%的性能提升。

 

 

此外,在FEA、CFD等分析及仿真程序测试中,米兰-X也表现出了更强大的性能,并且能够帮助企业级用户在同样的时间内解决更多问题。

AMD继续扩大朋友圈,

软硬合作伙伴同发力

近年来,EPYC的成功让AMD朋友圈逐渐丰富了起来,几乎所有的硬件厂商都已经成为了AMD的合作伙伴,也帮助其在企业级市场屡屡攻城略地。
此次米兰-X的发布,AMD又将生态进一步扩充,软件方面支持了包括Altair、Ansys、Cadence、Dassault Systèmes、Siemens以及Synopsys等生态伙伴,让EPYC能够享受更多软件优化,进一步提升工作效率。

 

 

拥有3D V-Cache的AMD 米兰-X处理器也给云计算注入了全新的活力。据了解,基于米兰-X的Microsoft Azure HBv3虚拟机将于近期正式上线,相比前代HBv3系列虚拟机,能够在关键HPC 工作负载中的性能提升高达 80%

 

 

服务器方面,此次包括Atos、Cisco、Dell、HPE、Lenovo、QCT以及Supermicro在内的众多OEM合作伙伴都已经为Milan-X做好了准备,近期用户就可以享用3D V-Cache了。

 

 

一直以来,AMD EPYC都凭借更多的核心及更高地性能在企业级市场中大放异彩,很多用户都用更少数量EPYC服务器替代了原有平台,在降低功耗与采购成本的同时又减少了能耗,兼顾了节能与高性能。全面迎合了我国数据中心未来发展方向。
在“Zen 4”推出之前,AMD发布米兰-X,不断强化自己的产品阵营,以更高的性能迎接来自竞争对手的挑战。而在绝对性能方面,米兰-X又再次刷新了多项纪录,给企业级用户交上了一份合格的答卷。