当前位置:主页>嵌入式应用

寄望人工智能,ARM全新多核平台助力实现下一个千亿芯片目标

作者:中国电子商情 单祥茹  来源:中国电子商情

发布时间:2017-04-06

0k

过去四年里,计算领域发生了令人惊叹的发展。在已经出货的1000亿颗基于ARM的芯片中,有500亿颗是由ARM的合作伙伴从2013年到2017年出货的,这个数字充分反映了整个行业目前对于更多计算的需求。而更非同寻常的是,ARM预计其合作伙伴将在2021年完成下一个1000亿颗基于ARM的芯片出货,在很大程度上这将归功于人工智能(AI)在人们日常生活中的广泛应用。

之所以将ARM未来千亿芯片出货量的目标主要寄望于人工智能领域,ARM计算产品事业部总经理Nandan Nayampally认为,在未来,ARM的计划就是计算在哪,ARM就在哪。确实地说,Cortex-A改变了整个计算格局。目前,ARM是当今行业的架构首选,在全球共计有35亿人在使用基于ARM架构的计算设备,并且是作为主要的计算设备。

图1  ARM要在接下来的5年时间内实现此前26年实现的千亿芯片出货量的目标,而人工智能则是目标实现的关键

展望2020年,人工智能(AI)、机器学习(ML)、计算机视觉(Computer Vision)等能力将无处不在。同时,这样智能化技术将被深入地运用到无人驾驶汽车、机器人以及工业控制系统中。越来越高的智能化需求必须有更高、更强的处理能力来支持,这就意味着在CPU平台的设计方法上必须要有新思路才能更好地应对诸如人工智能之类的新需求。人生的精彩往往就在于,当你要彻底改变世界时,早已有人预先为你准备好了合手的工具。ARM公司全新的DynamIQ,就是针对下一个计算时代应运而生的新平台。它从底层重新进行开发,呈现出来的是一个更高性能的计算平台。首先,DynamIQ重新定义了多核(multicore redefined),并且是针对一个多核的新集群。过去,位于同一个集群中的内核必须是同等级别,也就是说只有同样运算能力的内核才能放在一起使用。现在,DynamIQ创造性地允许在一个集群中最多放8个内核,并且这8个内核可以拥有不同的处理能力。此举意味着,无论是否使用大小核(big.LITTLE),都能够实现同构或者异构计算的灵活性。

DynamIQ技术平台的推出是ARM big.LITTLE技术的重要演进。自2011年推出以来,ARM big.LITTLE技术为主要计算设备的多核特性带来了革新。DynamIQ big.LITTLE将继续通过“根据不同的任务选择最合适的处理器”的方式来推动高效、智能的多核计算创新。DynamIQ big.LITTLE还允许对单一计算集群上的大小核进行配置,而这在过去是不可能实现的。举例来说,1+3或者1+7这样的SoC设计配置,现在因为DynamIQ big.LITTLE使其得以实现,尤其在异构计算和具有人工智能的设备上都是需要优先考虑的。此外,DynamIQ对于内存子系统也做了重新设计,以便内核本身具有更强的处理能力和更高的性能。

图2 在人工智能和机器学习上,DynamIQ能够大幅提升CPU及其系统的性能

作为未来ARM Cortex-A系列处理器的基础,DynamIQ技术平台代表了多核处理设计行业的转折点,其灵活多样性将重新定义更多类别设备的多核体验,覆盖从端到云的安全、通用平台。DynamIQ技术平台将被广泛应用于汽车、家庭以及数不胜数的各种互联设备,这些设备所产生的海量数据会在云端或者设备端被用于机器学习,以实现更先进的人工智能,从而带来更自然、更直观的用户体验。

Nandan Nayampally表示,DynamIQ将在今年晚些时候为所有新的Cortex-A系列处理器带来全新的特性和功能。在指令集方面,只有ARMv8.2版本才支持DynamIQ技术平台,其中包含有专门针对人工智能工作负载的指令集以及相应的优化库。第一代采用DynamIQ技术平台的Cortex-A系列处理器在优化应用后,可实现比基于Cortex-A73的设备高50倍的人工智能性能,并最多可提升10倍CPU与SoC上指定硬件加速器之间的反应速度。在多核灵活性上,SoC设计者可以在单个集群中最多部署8个核,每一个核都可以有各自不同的性能特性。这些先进的能力会为机器学习和人工智能应用带来更快的响应速度。全新设计的内存子系统也将实现更快的数据读取和全新的节能特性。另外,DynamIQ的高性能和灵活性还体现在,在严苛的热限制下仍然能够实现更高的性能,其原理是通过对每一个处理器进行独立的频率控制,高效地在不同任务间切换最合适的处理器。例如,在汽车的行车电脑使用场景中,在执行导航任务过程中,若有一个新的面部识别请求到来,要求有较高的计算处理能力,此时内核就会把任务从小核转移到大核。面部识别工作完成且经过验证后,再把工作任务从大核迁移回小核。

也许我们目前所看到的人工智能技术本身还在快速地演进发展过程中,其中会包含各种各样的多元化算法。市场上现在专门研制人工智能芯片的公司也很多,DynamIQ的独特之处在于,它在不牺牲效率的同时实现较以往任何时候都更高的性能表现。一方面能够实现通用处理器在AI性能方面的提升,另外一方面,能够实现通用的处理器和专门加速模块之间快速响应和连接。因此,整个片上系统(SoC)本身针对AI的性能就会得到提升。这一点对那些本身体积受限的小设备而言尤其重要。据悉,2018年就会看到该技术在设备端的使用。

0k