当前位置:主页>人物专访

加速云:用FPGA提高AI计算力,用IP库降低开发难度

作者:单祥茹  来源:中国电子商情

发布时间:2018-05-02

0k

“加速云是一家从技术上推导出来的公司,多年对多核处理器的研究积累,让我们不仅观察到技术的发展方向,更从技术角度研发出一系列基于FPGA的硬件加速产品而这些产品可以帮助更多的企业实现深度学习,在大数据时代赢得先机。”在4月份的加速云科技峰会暨新产品发布会上,公司创始人、CEO邬刚用这样一席话描述了公司的定位。

加速云CEO邬刚

在大数据时代,深度学习是人工智能的主要推动力。据Gartner分析,到2018年,80%的数据科学家会将深度学习纳入其工具包中。机器学习和人工智能项目的成功不仅需要依靠数据和算法,还需要融合技能、基础设施和业务方面的认可。可以说,计算力的快速增长使得深度学习技术有了质的飞跃,从而在计算机视觉、语音识别、自然语言处理等领域出现了重大突破。然而,深度学习需要大量的并行计算,对硬件平台有极高的要求。相对于CPU和GPU,FPGA出色的性能功耗比、超低延时、丰富的I/O接口资源,以及灵活的动态可编程特性,使得基于FPGA的深度学习方案成为未来技术的发展方向。

据邬刚介绍,此次加速云北京新品发布会,共推出两个系列硬件加速产品——SC-OPS和SC-VPX、两个IP库——FDNN和 FBLAS、三大解决方案——深度学习解决方案、高性能计算及数字信号处理解决方案、边缘计算解决方案。这些产品适用于深度学习、机器视觉、数字信号处理、高性能计算、边缘计算、云计算等领域,尤其是对计算力有着迫切需求的智能工控,更是公司当下重点开拓的市场。

性能卓越的硬件加速产品
SC-OPS是加速云推出的全球首张Intel Stratix 10 FPGA加速卡,采用Intel最新14nm工艺的Stratix10 GX2800 FPGA器件,可以广泛应用于数据中心、云计算、机器视觉、深度学习、高性能计算、仿真、金融等领域。

SC-VPXVPX刀片加速平台采用Intel Stratix 10 GX2800器件,兼容GX1650,构造业界先进、灵活、高效的信号处理和深度学习架构,主要定位高校研究所等单位的雷达,通信,深度学习相关领域的产品原型快速搭建和算法开发与应用。邬刚称其为全球计算密度最高的刀片加速平台。

有效降低开发难度兼具高性能的IP库
虽然FPGA解决方案有其技术上的优势,然而,FPGA也有其应用上的硬伤,那就是开发难度大。加速云的深度学习加速库FDNN是国内首个支持通用卷积神经网络的FPGA加速库,基于RTL级代码,可以提供很高的性能和灵活配置特性。高性能计算加速库FBLAS是业界更高性能的RTL级数学加速库。对于两个IP库的重要作用,邬刚表示:“硬件是载体,IP才是加速云的核心。只有硬件,FPGA就像一张白纸。其中,FDNN这套库相当于我们做出了谷歌的TPU。加速云的IP库还支持丰富的接口类IP,如高速通信接口、高清视频接口等。另外,高性能的PCIe、DMA、内存所有这些IP都不再需要用户自己开发,而且我们的IP性能更高。”

覆盖最热门应用的三大解决方案
深度学习加速解决方案:加速云有一整套基于FPGA的深度学习加速方案,包括SC-OPM/SC-OPF/SC-OPS加速卡及FDNN加速库,满足客户对深度学习高性能、灵活性加速要求。为了方便客户使用高层语言开发,加速云还提供了基于FPGA完整的OpenCL异构开发环境,快速实现用户自定义的深度学习加速方案。同时加速云也提供快速深度神经网络定制加速服务。

数字信号处理解决方案:针对雷达、通信等数字信号处理系统的要求,结合Stratix10 FPGA系列的高性能,加速云提供了一套完整的硬件和软件相结合的解决方案,实现了高性能矩阵运算(矩阵乘、转置、求逆、QR分解)和超高速FFT(傅立叶变换)。同样,为了方便客户使用高层语言开发,加速云的这款方案也支持基于FPGA完整的OpenCL异构开发环境。

边缘计算解决方案:这款方案主要针对智能工控应用,采用高性能Intel Arria10 GX660器件,具有模块化设计,强实时特性和高性能的算法IP加速、完整的OpenCL异构开发环境,可以实现新一代高性能边缘计算网关,适用于各种工业环境。

人工智能在未来发展上还存在很多瓶颈,需要硬件技术和算法方面的突破。邬刚表示:“异构计算是计算架构的未来趋势,而FPGA是实现异构计算的完美选择。加速云创新的异构计算加速平台解决方案,具有高性能、高效率、低延时特性以及可编程性和远程可重构能力,非常适合云上的弹性业务的需求。我们希望能够通过我们的技术,帮助更多的企业实现深度学习,在大数据时代赢得先机。”
 

0k