当前位置:主页>人物专访

数据中心风起云涌,Ampere全新80核arm架构处理器能否突破x86封锁线?

作者:单祥茹  来源:中国电子商情

发布时间:2020-03-11

0k

在手机、基础设施、自动驾驶、嵌入式设备等多个领域,基于ARM架构的芯片具有很高的市占率。ARM公司发布的最新数据显示,在2019财年第三季度(2019年9-12月)中,ARM合作伙伴基于ARM技术的芯片出货量达到64亿颗,再创历史新高。截至目前,基于ARM技术的芯片整体出货量已经超过1600亿颗。然而,在服务器CPU市场,似乎并不是ARM的江湖,x86架构一家独大的局面由来已久。


图1  Ampere公司产品高级副总裁Jeff Wittich

Ampere是一家成立仅仅两年多的美国科创公司,近日,该公司正式发布了一款全新Ampere Altra处理器,此款产品是业界首款搭载80个内核数量的服务器中央处理器,同时也是首款应用于新一代云和边缘计算数据中心的云原生中央处理器。随着这款基于ARM v8.2架构、采用台积电(TSMC)7nm制程工艺打造的服务器处理器的问世,ARM架构是否能够冲破在云服务领域由Intel、AMD组成的x86封锁线,在未来的数据中心中赢得一席之地呢?

云计算驱动服务器市场稳步增长

IDC预测,到2021年,中国90%以上的企业将依赖于本地或专属私有云/多个公有云以及既有平台的组合,来满足其基础设施需求。到2023年,50%的中国企业应用将部署在容器化的混合云/多云环境中,以提供敏捷的、无缝的部署和管理体验。长期来看,用于云IT基础设施的支出将以7%的年复合年增长率(CAGR)增长,2023年将达到920亿美元,占IT基础设施总支出的58.1%。其中,公有云数据中心将以6%的复合年增长率增长,占66.3%。私有云基础设施的支出将以9.2%的复合年增长率增长。

图2  2017--2023年全球云IT基础设施市场发展情况及走势

为什么需要新的处理器平台?

用Ampere公司产品高级副总裁Jeff Wittich先生的话说,当前的解决方案无法满足云需求,他表示,过去的10--15年,云计算的需求已经在基于企业级计算演进而来的云计算上发生了很大变化。从软件角度来说,现在的需求更多的是朝向云原生如容器、微服务这类的计算模型快速转变,而不是面向以前那种企业级内部的计算模型。此外,现在的边缘数据中心越来越多,像延时、散热、功耗等需求也与从前有很大不同。超大规模云以及边缘云计算的需求的增长,对CPU的部署密度和能耗要求越来越高。

另有一个市场现象值得注意,边缘计算出现越来越多的定制化趋势,这些异构型的基础设施要求有云计算的能力。有些企业开始尝试将GPU用于AI,smartNIC(智能网卡)、smartnet用于网络的工作负载等等。

针对所有这些变化,一种具备新型计算能力,尤其是专门针对云的高效CPU呼之欲出,而新一代的CPU不再拥有以往CPU的那些制约因素。

为什么是ARM架构处理器?

处理器是服务器中成本占比最高的部件。不可否认,在这一市场,x86一直是服务器处理器的主流架构。

Jeff Wittich先生表示:“经过几年的发展,ARM架构的综合能力目前已经具有领先的数据中心性能和能效。此外,ARM的软件生态非常成熟,目前运行在数据中心的这些软件均可在ARM架构芯片上运行,其中包括操作系统、中间件以及应用。更重要的一点是,台积电7nm先进工艺制程技术也已成熟。最领先的IP、成熟的ARM软件生态、7nm先进制程,加之Ampere经验丰富的团队,这些因素结合在一起,足以支持Ampere为新一代数据中心设计最新的、能效更优的CPU。”

在上述这些因素之外,Jeff Wittich先生认为,ARM架构本身要比其他的架构有更多的优势。由于使用相对于x86而言的简单指令级(RISC),芯片的功耗更小,而整体的效率更高。可喜的是,ARM生态系统在服务器领域日益成熟,所有大型的操作系统包括Linux、BSD、windows,ARM架构芯片均予支持。容器化,包括虚拟化工具如docker、vmware、KVM和kubernetes都可以在ARM芯片上得到支持。总体来看,现代云计算的三大要求:可预测和高性能、跨平台的可扩展性(从内核,到IO,到内存)以及高能效及部署密度等,基于ARM架构的Ampere Altra处理器均能很好地支持。与英特尔和AMD最新的顶级x86产品相比,就目前的市场下,在价格和性能上都具备强劲的竞争力。

Ampere Altra:专为云全新设计的处理器

Ampere Altra处理器为采用7nm工艺技术制造的ARM架构64位芯片,具有80个处理核心,Jeff Wittich先生表示,这款CPU是世界上第一款从设计和制造伊始就面向云,而且是为了满足现在新的云计算需求的一款CPU处理器。它能够提供可预测的、非常高的性能,单路具备80个处理核心,支持两路平台。利用Monolithic die(即单芯片设计)工艺,所有的核在Mesh网络互连下相互连结,提供非常高的带宽和一致性互联Mesh网络。另外,还有非常高的内存带宽和内存密度。

在可扩展性方面,Ampere Altra处理器依据行业最领先的每核功耗,从边缘到超大规模云等不同部署环境下提供多种可选的处理器配置。此外,该处理器还能够提供多路支持,以及非常灵活的IO连接和高带宽。

Ampere Altra处理器的每核最高频率为3.0GHz,所有内核都能在turbo模式下持续运行。这个处理器还能够实现四宽的超标量的主动无序执行。单核单线程设计在提供最优性能的同时,还能保证安全隔离,这一点也是现代云计算的要求,有效保障了用户在多用户环境中不受相邻干扰。

在缓存方面,Ampere Altra处理器可提供非常宽的内存带宽和内存容量,共有8个DDR4通道,每一个通道能插两个DIMM,运行时能够提供总带宽单路200GB/秒的速度。另有单路4TB的内存或者双路8TB的内存容量,并有两个128BT的SIMD单元用于浮点运算。

在IO子系统方面,Ampere Altra处理器单路对外提供128条PCIe Gen4通道,双路192条。X16的控制器分为x8或者x4或者x2等不同的设计选择,即可连接高带宽GPU,也可连接高扇出(fan-out)及NVME存储设备。最多可外接4个CCIX协议的加速器。

云计算、大数据、AI的快速发展对数据中心算力的需求不断提升,数据中心已成为能耗大户。据预测,目前全球数据中心的电力消耗总量已经占据全球电力使用量的3%,并将于2030年增长至11%。Ampere Altra处理器在内核上进行了优化,内核只提供云计算所需要那些性能,减少了耗电量,内核的功耗效率得到极大提高。Jeff Wittich先生表示:“Ampere Altra处理器具有80个内核和210W的功耗,为日新月异发展的前沿科技领域如数据分析、人工智能、数据库、数据存储、电信堆栈、边缘计算、Web主机与云原生应用等提供突破性的能效提升。”

Ampere Altra:性能优势大比拼

据Jeff Wittich先生介绍,与传统服务器CPU架构相比,Ampere Altra处理器共有三大创新点:一是单线程。其目的是为每一个用户提供稳定、可预测的性能。在云计算应用中,单线程还能够提供非常好的安全隔离。二是通过架构的优化提供最多数量的内核。基于Mesh网格化的部署,密度非常高,并且有非常好的一致性和高效率。三是内核能效最高。

图3 领先的性能

Jeff Wittich先生表示,Ampere Altra处理器不仅性能高,功耗也更低,每瓦特的性能比AMD EPYC和Intel至强要高。对于那些以能耗为中心(power-centered)的应用,如存储网页游戏、边缘云、Web主机等应用,将是一个非常完美的解决方案。

图4 领先的节能效率

Ampere Altra处理器出色的核的扩展性在数据中心应用中将得到最大发挥,每一个机架能够部署多达3500个内核。每一个机架的单核密度,比AMD EPYC高38%,比Intel至强高173%。在单机架性能上具有优势,总体应用成本TCO也更低。

图5 领先的可扩展性

Ampere Altra:市场部署初见成效

Jeff Wittich先生说:“在过去一段时间,ARM一直致力于推进可用于数据中心高性能、高能效的内核研究,我们也一直在推动ARM架构性能的不断改善。随着我们利用之前的经验积累,在云数据中心这一块,Ampere服务器CPU的性能已超过X86。尤其是台积电7nm制程技术的采用,使得我们的产品实现了体积最小、能效最高、速度最快的目标。”

据Jeff Wittich先生透露,在过去一年,Ampere与最主要的云服务商一直保持密切合作。针对这款Ampere Altra处理器的合作,微软、甲骨文(Oracle)等,已经开展相应测试。预计今年下半年会有市场部署,规模量产预计在2020年年中。另外,因产品的更新迭代每年都会有非常固定的节奏,Jeff Wittich先生认为这一点也是打动客户采用Ampere产品的重要原因。

有关Ampere 服务器处理器的发展路线图,Jeff Wittich先生表示,计划在2021年推出Mystique新产品。Mystique的核数将更多,性能也更好,与现在的Altra平台兼容。2022年计划推出Siryn产品,该产品要比之前的两款产品核数更多,性能更好,功耗更低,而且还有更多基于云的设计的特点。

0k