作者: 来源:中国电子商情
发布时间:2019-11-06
几年前,Arm曾向业界公布了一项计划:每年将以能效提升30%的速度更新自己的IP产品,现在看来,它做到了。继今年5月份发布了三个全新IP——Cortex-A77、Mali-G77、Mali-D77之后,在今年10月份举办的Arm Tech Symposia 2019 Beijing期间,Arm正式向业界介绍了一系列针对主流市场及其他细分市场的新IP,并且能效全部提升了30%。这些IP可分成三个类别:第一类是全新的NPU产品,Ethos-N57和N37;第二类是Mali-G57 GPU,也是首款基于Valhall架构的主流图形处理器;第三类是显示处理器Mali-D37 DPU,该产品是迄今单位面积效率最高的处理器。
图1 Arm最新发布的三大IP产品Ethos-N57和N37 NPU、Mali-G57 GPU、Mali-D37 DPU
Ethos-N57与Ethos-N37 NPUs:提供真正的异构计算
继Arm ML(机器学习)处理器(现称为Ethos-N77)发布后,这一次Ethos NPU家族又添加了Ethos-N57与Ethos-N37两位新成员。这也是Arm首次向外界介绍Ethos这个产品系列名称。
Arm Ethos产品组合旨在解决AI与ML复杂运算的挑战,以便为日常生活设备创造更为个性化与沉浸式的体验。由于消费者的设备越来越智能化,通过专属的ML处理器提供额外的AI性能与效率,是非常有必要的。全新的Ethos 对成本与电池寿命最为敏感的设计进行优化,NPU可以为日常生活设备带来优质的AI体验。
据Arm ML事业群商业与营销副总裁Dennis Laudick先生介绍,Ethos-N57与Ethos-N37的设计理念以及一些基本原则主要体现在这些方面:第一,针对Int8与Int16数据类型的支持性进行优化;第二,采用先进的数据管理技术,以减少数据的移动与相关的耗电;第三,通过创新的Winograd技术的落地,使性能比其他NPU提升超过200%。
此外,Ethos-N57的功能还包括:旨在提供平衡的ML性能与功耗效率,以及针对每秒2兆次运算次数的性能范围进行优化。
Ethos-N37的初衷更是为了提供面积最小的ML推论处理器(小于1平方毫米)而设计,同时针对每秒1兆次运算次数的性能范围进行优化。
Arm Ethos-N77、N57和N37有相同的核心架构,Ethos-N77主要针对最高端、性能要求最高的市场,Ethos-N57针对主流市场,它非常完美地实现了性能、成本以及功耗的均衡,Ethos-N37则针对低端市场,也就是对成本极端敏感的市场。当前,市场对NPU有多样化需求,而且这个市场对性能以及带宽的需求非常一致,Ethos-N37、N57、N77属于rm针对性能需求和市场的差异化产品。而Ethos-N37、N57让AI应用成为可能,并在ML的性能与成本、面积、带宽与电池寿命之间达成平衡。
图2 Arm Ethos NPU产品家族让研发人员能够根据应用选择更适合的IP
Mali-G57 Valhall架构GPU:为主流市场带来智能与沉浸式体验
曾经只是高端设备专属的沉浸式体验,如AR、高保真游戏与以AI为基础的全新移动与家庭应用案例,目前也逐渐成为主流市场的需求。让开发人员能够使用针对日常设备优化的高性能AI与媒体IP解决方案,可以赋能新的AI驱动应用案例,提供包括语音识别与always-on在内的功能,告别这些功能由移动设备所独享的时代。
从游戏设备到数字电视(DTV),人工智能已经无所不在,但要促成这些响应式体验,端点必须具备更强的计算能力。例如,数字电视的智能体验,包括智能助理语音指令、节目实时翻译,以及人脸辨识以强化家长监护。
图3 首款Valhall架构GPU与前代产品相比性能密度达到1.3倍
Mali-G57将优质的智能与沉浸式体验带到主流市场,包括高保真游戏、媲美电玩主机的移动设备图型效果、DTV的4K/8K用户接口,以及更为复杂的虚拟现实和增强现实的负荷。Arm市场营销副总裁Ian Smyth先生表示:“这是移动市场划分中最大的一部分,而Arm最近与Unity的发布强调其基于Arm IP的片上系统(SoC),随着CPU、GPU性能的进一步优化,可以让开发人员有更多的时间创造出全新的沉浸式内容。”
Mali-G57关键功能包括:与Mali-G52相比,各种内容都能达到1.3倍的性能密度;能效比提升30%,使电池寿命更长; 针对VR提供注视点渲染支持,且设备ML性能提升60%,以便进行更复杂的XR实境应用。
Mali-D37 DPU:单位面积效率最高的处理器
Mali-D37是首款面向主流和入门级别市场的显示处理器(DPU)产品,它在最小的可能面积上包含丰富的显示与性能,成为入门设备与小型显示屏幕最适合的DPU。对于终端用户而言,这意味着当面积成为首要考虑因素,例如在入门级智能手机、平板电脑与分辨率在2k以内的小显示屏等成本较低的设备上,会有更佳的视觉效果与性能。
Mali-D37的最重要特点是在支持全高清(Full HD)与2K分辨率的组态下,16纳米制程的面积小于1mm2。同时,通过减少GPU核心显示工作以及包括MMU-600等内存管理功能,系统电力最高可节省30%。此外,从高阶的Mali-D71保留关键的显示功能,包括与Assertive Display 5结合使用后,Mali-D37还可混合显示高动态对比(HDR)与标准动态对比(SDR)的合成内容。
图4 在支持全高清与2K分辨率的组态下,Mali-D37的16纳米制程面积小于1mm2
“我们的设计理念是为主流的设备带来最极致的体验。因此,在设计这些IP时研究了不同市场的用户体验。我们的想法是如何使硬件、软件相结合,并且发挥生态系统的力量来提升使用体验。arm的IP组合一直沿袭我们倡导的大小核理念,既有比较高端的配置,如Mali-G57和Ethos-N57,也有入门级低端的产品,如Mali-D37。”Ian Smythe先生表示。
另据Ian Smyth先生介绍,在设计之初,Arm投入大量的资源用于研发ML的软件以及工具,因此,所有的GPU、DPU、NPU产品,都有极高的可迁移性和易用性。