当前位置:主页>嵌入式应用

火力全开,Xilinx发布Versal Premium再次为FPGA行业树立新标杆

作者:单祥茹  来源:中国电子商情

发布时间:2020-03-13

0k

物联网、虚拟增强现实以及5G等技术的普及,对互联带宽的需求与日俱增。根据Equinix发布的最新全球互连指数(GXI),到2022年,亚太地区的互连带宽预计将以56%的复合年增长率。综合来看,无论是数据中心还是核心城域网,每年带宽的年复合增长率均高达51%,而视频流、企业、物联网和智能器件是主要贡献者。随着5G时代的到来,带宽预计增长近100倍,这将对核心网、数据中心和流量管理带来巨大的压力。届时,5G核心网的扩展预计年复合增长率将达到313%。

“现在摆在我们面前最大的挑战是,摩尔定律正在接近极限,GPU的数量与性能之间的边际效应越来越低,但是端口的密度和带宽却成几何级数增长,这意味着我们的器件和芯片已经跟不上计算密度的发展。”赛灵思(Xilinx)产品线营销与管理高级总监Sumit Shah在近日的一场线上媒体活动上表示。正是看准了这一点,Xilinx在这场活动上重磅推出了Versal ACAP 产品组合的第三大产品系列——Versal Premium,该产品在带宽和计算密度上,再次为FPGA行业树立了一个新标杆。


图1  数据爆炸驱动网络转型

Versal ACAP平台的前世今生

在介绍Versal Premium具体性能之前,我们有必要先回顾一下Xilinx ACAP的诞生过程。

早在1985年,Xilinx公司推出了全球第一款FPGA产品XC2064,这是一颗采用2μm工艺,包含64个逻辑模块和85000个晶体管,门数量不超过1000个的芯片。三十多年来,随着技术的发展,FPGA的功能和集成度不断提高,FPGA在系统中逐渐由配角变成主角。尤其是在FPGA传统应用领域的有线通信市场,随着通信的内容从语音、文字、图片走向高清视频,带宽和处理能力的需求一直是主导着这个领域飞速发展的主要驱动力,在此过程中,可编程器件也得到了快速发展。

FPGA曾经被行业列为震撼世界的25款芯片之一,自适应计算加速平台(ACAP)是Xilinx继1984年发明FPGA之后又一颠覆性技术发明成就。从本质上说,ACAP与FPGA同属一类器件,是一个功能远超常规芯片架构的革命性全新异构计算器件类别。赛灵思总裁及CEO Victor Peng曾将ACAP称作是在业界需求最迫切时刻的雪中送炭。

ACAP产品组合包括Versal Prime系列、Versal Premium系列和HBM系列。此外,还有一系列面向AI应用的AI Core系列、AI Edge系列和AI RF系列,采用突破性的AI引擎,专为解决各种应用低时延AI推断的新需求而设计。2018 年10月16日,赛灵思推出Versal,Versal是业界首款ACAP。Versal Premium平台是Versal的第三款产品。在此之前,XIlinx已经推出了Versal Prime 系列、AI Core 系列。2019年6月19日Versal Prime开始出货。

图2  Xilnx ACAP产品组合

Versal Premium系列为FPGA行业树立新标杆

如果说Versal ACAP是业界首款自适应计算加速平台,是一个功能远超常规芯片架构的革命性全新异构计算器件类别。那么,Versal Premium系列则在带宽、计算密度等性能上达到了一个前所未有的高度。它能够以3倍带宽打造最快速、最安全的网络,能够实现2倍计算密度的灵活应变加速,以高度集成的硬件软件平台提高生产力。

图3  Versal Premium架构框图

据Xilinx高端ACAP与FPGA高级产品线经理Mike Thompson介绍,Versal Premium是在Versal Prime的基础上打造的,它进一步集成了更多的连接安全,提高了产品的性能。Versal Premium采用台积电(TSMC)7nm工艺制程,融软件可编程能力与动态可配置硬件加速、预制连接和安全功能为一体,为加快产品上市进程提供了强大引擎。Mike Thompson表示:“作为Versal ACAP的最新产品系列,Versal Premium系列可提供比当前FPGA高达三倍的吞吐量,且内置以太网、Interlaken和加密引擎,以打造快速、安全的网络。该系列提供了当前部署主流FPGA两倍的计算密度,同时还面向持续扩展的多元化且不断演进的云工作负载及网络工作负载,提供了灵活应变的能力。”

Versal Premium还添加了很多独特的功能,如PCIe Gen5、DMA和CCIX。另外还内置了最先进的112Gbps PAM4收发器、数百GbE(千兆位以太网)和Interlaken连接。600G Interlaken硬核可以实现以太网的即时连接。在安全方面,Versal Premium还加入了400G加密引擎。

Mike Thompson对Versal Premium进行了如下评价:“Versal Premium系列将ACAP推向了一个新高度,通过网络硬核IP的突破性集成,成就了单芯片400G和800G的解决方案。面向下一代网络和云部署,Versal Premium在软件和硬件开发者皆可轻松编程的可扩展平台上,提供了出色的带宽和计算密度,实现了加速功能的优化并大幅降低了总拥有成本。”

图4  突破性集成功耗优化的网络硬核

谈到Versal Premium的集成规模,Mike Thompson表示,如果仅仅用以太网和加密引擎的话,采用上一代FPGA UtraScale+,相当于需要22个FPGA。这种大规模异构集成,可以帮助客户大大降低资本支出和运营成本。

面向5G应用提供功耗优化的带宽密度

随着5G网络投入运营,网络流量大幅增长,导致在现有空间和功耗范围内吞吐量和计算密度的需求不断提高。为支持业界应对这一挑战,Versal Premium系列提供了高达9Tb/s的可扩展及自适应串行带宽。具体方法是将112G PAM4收发器与集成的网络功能模块用于核心网、城域网和数据中心互联(DCI)等基础设施,同时将每端口的带宽密度提高两倍,并降低时延高达50%。

图5  Versal Premium提供9Tb/s可扩展、自适应串行带宽

面向数据中心提供高度集成的云加速平台

Versal Premium系列旨在帮助超大规模数据中心用户为多元化的数据中心工作负载实现最高加速水平,将超过120TB/s的片上存储器带宽与可定制存储器层级相结合,减少数据移动从而消除相应的关键瓶颈。与此同时,还支持以嵌入式方式将预制连接与硬核集成到现有云基础设施中。从基因组学、数据分析和视频转码,到针对语音和图像识别的AI推断,Versal Premium提供了高度集成的云就绪平台,为多元化的工作负载提供突破性能。与前代FPGA产品相比,Versal Premium的吞吐量可以提升5倍。

图6  Versal Premium拥有低于100瓦功耗提供单芯片800G DCI吞吐量

数据中心互联(DCI)是现在市场上非常热门的领域,通过Versal Premium,客户可以使用800G DCI,而它的功耗不到100瓦。如果用FPGA布置800G DCI的话(如图6),就会需要两个器件,总功耗超过200瓦。然而,100瓦已经是端口的极限。Versal Premium在同样的带宽场景下,只需要一个器件,功耗降低50%以上,占板只有FPGA的一半,但是却实现了两倍的带宽密度。

另据Mike Thompson介绍,在对象检测方面,Versal Premium要比英伟达Tesla的性能提升4.6倍到7.7倍。在图像分类方面,性能则要高出1.6倍到2.3倍。此外,Versal Premium能够提供123TB/s片上存储器带宽,这是英伟达GPU的9倍到25倍。因此,Versal Premium在计算加速方面的性能是GPU无法企及的。

对于Versal Premium的面世,Xilinx大中华区销售副总裁唐晓蕾(Maria Tang)表示:“以前Xilinx一直比较关注硬件的推广。随着FPGA的广泛普及和行业大势所趋,我们越来越发现平台是一个非常重要的发展方向,一个灵活的、自适应的平台,更能够帮到客户快速推出新产品。Versal Premium将再次拓展Xilinx在整个高端市场的地位。”

现在,客户已经可以开始用Versal Premium进行原型设计,因为Versal Premium是在Versal  Prime的基础上去打造,客户可以借助Versal Prime的评估套件着手尝试并做界面测试。

在开发工具上,软件开发者可以使用他们最熟悉的C、C++和Python语言,另外数据科学家和算法开发人员也可以使用他们平时最熟悉的框架。对于传统的硬件开发商客户来讲,Xilinx仍然在大力投入VIVADO工具的开发。

0k