作者:单祥茹 来源:中国电子商情
发布时间:2018-10-19
一年前,就任赛灵思(Xilinx)首席执行官仅仅3个月的Victor Peng来到中国,亲自向业界介绍了具有划时代意义的赛灵思自适应计算加速平台(ACAP)。在刚刚结束的赛灵思开发者大会(XDF)上,CEO Victor Peng再一次郑重宣布:ACAP平台首款产品Versal系列问世。
这是一个颠覆性的产品,尤其是在摩尔定律已经无法赶上创新步伐的今天,Versal ACAP的问世意义非凡,同时,也展现了赛灵思人工智能加速及数据中心优先战略的强大执行力和创新能力。Victor Peng表示,现在的模型设计周期已经超过了硅片发展的周期,在标准流程下,硅片设计需要大约18~24个月,有时甚至要花费更长的时间,然而市场却是快速变化的。因此,我们不能再依靠固定的芯片解决方案。赛灵思推出的革命性新异构计算架构ACAP,这种紧密耦合的混合架构比任何一种单独架构的实现都支持更高的定制水平和性能提升。
图1 赛灵思总裁及首席执行官Victor Peng先生在北京举行的赛灵思开发者大会上发表“打造灵活应变、万物智能的世界”的主题演讲,并隆重推出面向人工智能和数据中心的重磅产品Versal
Versal产品组合采用台积电(TSMC)的7 nm FinFET工艺技术,是第一个将软件可编程性与特定领域硬件加速和灵活应变能力相结合的平台。它整合了标量处理引擎、自适应硬件引擎和智能引擎以及前沿的存储器和接口技术,实现显著的性能提升,其速度超过当前最高速的FPGA 20倍、比当今最快的CPU实现快100倍。该平台面向数据中心、有线网络、5G无线和汽车驾驶辅助应用,为所有的应用提供强大的异构加速功能。最重要的是, Versal的硬件和软件均可由软件开发者、数据科学家和硬件开发者进行编程和优化。
据赛灵思产品及技术营销高级总监Kirk Saban介绍,Versal产品组合包括6个系列的器件,其独特架构针对云端、网络、无线通信乃至边缘计算和端点等不同市场的众多应用提供了可扩展性和AI推断功能。 Versal ACAP产品组合包括 Versal 基础系列( Versal Prime),Versal 旗舰系列(Versal Premium旗舰)系列和HBM系列,能针对要求最严格的应用提供业界领先的性能、连接性、带宽和集成功能。此外,该产品组合还包括 AI核心系列(AI Core),AI边缘系列(AI Edge)和AI射频系列(AI RF),采用突破性的 AI引擎。AI引擎是一种新型硬件模块,专为解决各种应用低时延AI推断的新需求而设计,同时支持高级DSP实现方案,满足无线和雷达等应用要求。它与Versal自适应硬件引擎紧密结合,支持整体应用加速,意味着软硬件都能调节,从而确保最高性能和效率。
图2 赛灵思产品及技术营销高级总监Kirk Saban详细讲解行业首款灵活应变的ACAP自适应计算加速平台Versal
根据现场公布的产品路线图,该组合中率先亮相的是Versal Prime系列,它跨多个市场提供广泛的适用性。同时推出的还有Versal AI Core系列,相对于业界领先的GPU,产品的AI推断性能预计能提升8倍。
VERSAL AI核心系列:5款产品实现突破性的AI推断吞吐量和性能
Versal AI核心系列提供该系列最高计算性能和最低时延,实现突破性的AI推断吞吐量和性能。该系列针对云端、网络和自动驾驶技术进行了优化,提供业界最广泛的AI和工作负载加速功能。Versal AI核心系列有5款产品,提供128到400个AI引擎。芯片内部包含双核ArmCortex-A72 应用处理器、双核Arm Cortex-R5实时处理器、256KB片上ECC存储器、超过1900个专为高精度低时延浮点运算而优化的DSP引擎。此外,它还包括190多万个系统逻辑单元以及超过130Mb的UltraRAM、高达34Mb的块RAM和28Mb分布式RAM和32Mb 新加速器RAM块,任何引擎都能直接访问,这也是Versal AI系列的独特之处,而且都能支持定制存储器架构。该系列还包括 PCIe Gen4 8信道和16信道以及CCIX主机接口、功耗优化型32G SerDes、多达4个集成型DDR4存储器控制器、多达4个多速率以太网MAC、650个高性能I/O(用于MIPI D-PHY)、NAND、存储级内存接口和LVDS、78个多路复用I/O(连接外部组件)和超过40个HD I/O(3.3V接口)。以上所有器件均通过业界一流的片上网络 (NoC)实现互联,具有多达28个主/从端口,以低时延提供每秒多Tb带宽,而且提供高功率效率和原生软件的可编程性。
VERSAL PRIME系列:9款产品覆盖更广泛的应用市场
Versal Prime系列经过精心设计,适用于多个市场的广泛应用,并针对各种工作负载的连接性和在线加速进行了优化。这款中端系列包括9款产品,每款产品都采用双核Arm Cortex-A72 应用处理器、双核Arm Cortex-R5实时处理器、256KB片上存储器(带ECC)、超过4000个专为低时延高精度浮点运算优化的DSP引擎。此外,它还包括200多万个系统逻辑单元,结合200Mb以上UltraRAM、超过90Mb的块RAM以及30Mb分布式RAM,能支持定制存储器架构。该系列还包括PCIe Gen4 8信道和16信道以及CCIX主机接口、功耗优化型32Gb 每秒的SerDes和主流58Gb每秒的PAM4 SerDes、多达6个集成型DDR4存储器控制器、多达4个多速率以太网MAC、700个高性能I/O(支持MIPI D-PHY)、NAND、存储级内存接口和LVDS、78个多路复用I/O(连接外部组件)和超过40个HD I/O(3.3V接口)。以上所有器件同样是通过NoC实现互联,具有多达28个主/从端口,以低时延提供每秒多Tb带宽,而且提供高功率效率和原生的软件可编程性。
图3 赛灵思软件及IP产品执行副总裁Salil Raje先生激情描绘Versal加速当今AI时代各种创新的美好前景
VERSAL工具和软件:FPGA的开发者可快速上手
无论是硬件还是软件Versal平台都具有非常好的可编程性。赛灵思软件及IP产品执行副总裁Salil Raje表示,伴随着Versal的推出,赛灵思已经在平台中添加了软件堆栈,那些使用过赛灵思FPGA的硬件开发者可以用他们非常熟悉的硬件编程流程直接在这个平台上进行编程。当然,我们也加入了更多软件开发者比较熟悉的堆栈进来。也就是说,在全新的Versal技术中,无论是哪个层面的开发者,他们都能够很快地开始他们的研发工作。