出击多个细分市场,ARM多款新架构中端IP一览

百家 作者:微型计算机 2019-12-15 10:20:47

秋季是收获的季节,也是“收货”的季节。无论是双十一促销,还是十月长假,都显示着这个季节带给人们的是满足。对于ARM这种全球首屈一指的、以知识产权为主的公司来说,在秋季自然也有一揽子货物等着用户选购。10月底,ARM推出了一系列新品,包括新的中端GPU、新的AI加速架构以及全新的显示处理模块。今天,本文就为你解读ARM在这个秋季推出的多款产品的相关信息。


ARM在10月底召开了2019年技术座谈会(ARM Tech Symposia 2019),在这个会议上,ARM发布了多款新品,包括两个AI加速核心、一个中端GPU核心和一个显示处理模块。此外,ARM还介绍了新的AI加速品牌和相关内容。虽然从规模来看,这个发布会是一个小范围的发布会,但是整体内容和产品信息还是相当丰富的,值得一看。


▲ARM发布了4款新品核心,包括机器学习、中端GPU和入门级DPU等产品。


走进移动AI加速新时代

全新的Ethos NPU


ARM在发布会上首先带来的就是新品牌“Ethos”旗下的两款新品。“Ethos”的中文意思是“气质、思潮”,ARM用这个词汇来命名旗下的AI加速架构还是挺有深意的。从产品发布时间来看,Ethos相关产品架构在2018年初就已经发布了,当时被称作“Project Trillium”或者ARM Machine Learning,简写为ARM ML。显然,这样的名称是不可以作为商品名使用的。


▲在之前的发布会上,ARM就已经给出了有关ARM ML产品的相关信息。


2019年,ARM正式发布了全新的Ethos品牌和旗下首款产品Ethos N77,也就是定位于高性能的AI加速处理器,其最高计算性能在1GHz可达4TOP/s。在Ethos N77之后,ARM此次在10月底的会议上发布了Ethos N57和Ethos N37两款产品,定位也变成中端和入门级,其实从数字大小和ARM一贯的产品型号命名习惯就可以看出其性能是按照数字大小依次排序的。


为了增加对ARM的Ethos系列产品的认识,本文简要回顾一下历史。在2018年之前,ARM在机器学习上几乎没有推出专属产品,基本上是通过不断加强GPU和CPU的性能来提高机器学习的性能。不过随着市场发展,各大厂商都开始纷纷定制自己的机器学习模块,包括华为、高通、imagination等厂商,都推出了有自主知识产权的机器学习或者AI加速单元后,ARM才姗姗来迟,进入这个领域。


2018年,ARM公开发布了一个名为“Project Trillium”的开发计划,准备研发一整套用于机器学习和对象检测的软硬件产品。此时ARM也给出了一些信息,包括性能预期和最终的实现方法等。ARM当时给出的产品预测是在7nm工艺下,ARM的机器学习处理器产品能够在1.5W的功耗下实现8位整数计算4.6TOP的理论吞吐量,性格功耗比大约为3TOPS/W。在集成模式和架构实现方面,ARM认为可以直接通过自家的ACE-Lite接口进行接驳并集成至SoC中,当然也可以集成在DynamiQ集群中。市场方面,ARM认为新的产品并不是像传统的加速器或者模块那样使用,而是更类似一个独立的处理器,应该被更加重视起来。


▲ARM推出了全新的机器学习产品线


总之,ARM在机器学习产品上属于“赶了个晚集”。由于推出时间较晚,因此ARM还在努力向市场推广自己的整套解决方案,包括硬件架构和软件支持等各方面。可喜的是,在ARM发布了Ethos N77之后,人们发现ARM基本实现了自己在研发阶段的承诺,甚至还有所超越。


▲ARM展示旗下机器学习产品的框架,并宣称已经做好了软硬件的准备。


言归正传,继续来看本次发布会的内容。在本次发布会上,去年已经发布的Ethos N77产品又被ARM重新重点提及,当然也带来了不少的改进内容。其中最重要的就是Ethos N77允许配置1MB到4MB的SRAM缓存,而在之前的配置中这个数据只能选择1MB。ARM解释说,客户需要更多的内存带宽来应对网状NPU的高数据量,因为DRAM带宽很有限且难以扩展。性能方面,Ethos N77和在研发阶段的样品基本相同,都是在1GHz时种下实现4TOPS的处理能力,不过性能功耗比大幅度提升至5TOPS/W。


▲ARM之前给出的产品性能和功耗参数估计


另外,ARM在Ethos家族的架构设计上采用了相同的构造块(CE),并且通过构造块的数量增减来实现性能的加强或者降低。在Ethos中,所有的NPU共享相同的MAC计算引擎(MCE)和可编程引擎(PLE)。MCE由128个MAC单元组成,并且和PLE配对。一个MCE和PLE,再搭配相应的SRAM就组成了一个CE,这就是最基本的模块。在Ethos N77上,CE有16个,在Ethos N57上则是8个,Ethos N37则拥有4个。由于性能定位差异,ARM也给出了不同产品的用途示意。


比如最低端的Ethos N37适用于智能摄像头、入门级智能手机、数字电视机等产品。中端的Ethos N57除了包含Ethos N37的适用范围外,还可以在智慧家庭、中端手机上一显身手。定位高端的Ethos N77则包含Ethos N37和Ethos N57所有的功能,还可以额外扩展至AR/VR应用、高端智能手机、高端相机等方面。


▲ARM有关NPU产品的配置信息


功能方面,所有Ethos家族产品都对功耗和性能进行了优化(可能是性能功耗比提升的原因之一),并且能够针对int8或者int16的数据类型进行特殊的支持优化、还采用了数据管理技术来减少数据移动的次数从而节约能源。在数据压缩方面,Ethos家族的产品都可以采用端到端的压缩技术,能够降低数据对DRAM的要求,并且将系统带宽压力缩减1.5~3倍。


▲ARM宣称采用专用芯片后,相比DSP的性能提升了80倍。


除此之外,针对中低端产品,ARM还带来了一些针对性的技术手段。比如针对Ethos N57,ARM对2M以内的计算进行了性能和功耗的平衡优化。对Ethos N37这款面积小于1平方毫米的推理处理器,ARM也对其计算范围也就是1M以内的运算进行了功耗优化。


▲ARM展示相关小数据移动至核心内部SRAM后的性能提升幅度


总的来看,本次Ethos家族的进一步解读和新品发布,使得ARM在机器学习市场上拥有了标准化的能力。正如前文所言,目前市场上机器学习相关的IP很多,对一些客户而言,多方采购产品并最终整合在一起存在一定的困难,且很难快速地应对市场变化。尤其是目前机器学习相关应用正处于高速发展的阶段,包括面部识别等生物识别和一些图像分类算法正在不断扩大应用范围,而这些都需要机器学习处理器的加入。ARM此时推出新的产品,不但解决了标准化的问题,还带来了小面积和较低计算强度下的解决方案,应该会得到市场的青睐。


▲ARM Ethos家族产品的用途和场合分类


面向中端用户的新GPU

ARM Mali-G57


在本刊之前的文章中,曾经提及ARM全新的Valhall架构和全新的Mali-G77 GPU。新的GPU架构相比之前的Bifrost,在内核设计上有诸多改进,其整个GPU架构设计更为现代化、更类似于桌面产品并在越来越复杂的移动图形计算环境下有着更出色的计算能力。不过Mali-G77架构规模和最终芯片面积都比较大,它是给高端芯片准备的GPU架构。相应的,ARM发布了Mali-G57,利用全新架构,瞄准了中端市场。


▲ARM Mali-G57主要面向中端用户


Mali-G57和Mali-G77在配置上最大的差异在于,Mali-G77最少需要配置7个计算核心,而Mali-G57可以选择1~6个核心,具体的数量可以根据用户所面向的市场以及产品定位而定。新的Mali-G57面向的市场包括中端智能手机、4K/8K电视、VR/AR市场等。


性能方面,Mali-G57显然和Mali-G77无法相比,但是相比之前发布的定位入门级的Mali-G52,Mali-G57还是有诸多优势,比如在内容显示方面的能耗比为Mali-G52的1.3倍,在所有场合下都有更好的峰值能耗比呈现,更好的支持VR功能,机器学习性能提升60%等。总的来看,Mali-G57是ARM在中端GPU市场的一次新尝试,全新架构会令其带来出色的使用体验。


▲ARM Mali-G57的性能提升情况


为中端产品带来高端功能

Mali-D37 DPU


ARM在显示处理器上也有多年的积累。之前ARM推出了新的“Komeda”显示处理器架构,并且带来了全新的Mali-D77 DPU产品。不过,这个架构在之前只面向高端产品,中低端市场依旧只能使用老架构。鉴于此,ARM发布了全新的Mali-D37 DPU,将新的架构和功能带到了中低端市场中。


▲ARM Mali系列DPU发展历史简述


Mali-D37是目前面积最小、效率最高的显示处理器产品,其在16nm工艺下的面积小于一平方毫米,只有上代Mali-D71的36%。在节能方面,Mali-D37带来了新的内存管理功能,被称为MMU-600,最高能够带来30%的功耗节约。对于目前比较流行的HDR和SDR内容,之前的Mali-D71是搭配ARM Assertive Display 5 HDR管理技术,可以实现SDR和HDR的混合显示,现在这项技术也被配备在了Mali-D37上,用户可以在更低的成本上体验到HDR显示的魅力了。


▲新的Mali-D37 DPU相比相同程序运行在GPU上时,性能提升大约为30%。


Mali-D37具体产品瞄准的2K和全高清的产品,主要针对的也是中端和入门级设备。凭借其极低的功耗和极小的芯片面积,Mali-D37应该会成为很多主流产品的选择。


写在最后

ARM努力将更好的体验带给用户


从本文介绍的产品可以看出,本次ARM的技术座谈会,并没有太多高端的技术和全新的架构出现,其最主要的目的就是如何将更好的技术和更新的架构带到更广泛的市场中去。无论是针对机器学习的全新Ethos家族,还是新的中端GPU Mali-G57,以及DPU Mali D37,都在践行着这个理念,那就是更好的特性、更便宜的价格和更广泛的用户。


尤其值得一提的是面向机器学习的Ethos产品线,ARM在“赶了晚集”的情况下,还是依靠灵活的架构设计和自己在移动计算领域的先天优势,迅速推出齐全的软硬件解决方案,实现了产品的后来居上,并很有可能被广泛应用在发展速度越来越快的智能设备中。


有关产品上市时间,比较乐观的估计,在明年年中也就是6月左右,就应该有搭载这些技术的产品出现在市场上了。届时本刊还将选择一些有趣的产品进行解读,看看进入新时代、进入了机器学习时代的ARM产品有哪些更出色的体验。


关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接