发布时间:2021-08-2 阅读量:3377 来源: 我爱方案网 作者: 我爱方案网整理
众所周知,手机市场的需求正在下降,用户的换机周期正在增长,一些评测机构也发现,各家旗舰手机的芯片在单核、多核的性能提升上也正在放缓,这是否意味着芯片的能效提升放缓?曾经表示以每年能效提升30%为目标的Arm却在上周一口气发布三款IP,向放缓说No。
从系统角度不断提升
对于每年能效提升30%来更新自身产品的目标,Arm市场营销副总裁IanSmythe表示计算实际上分不同的层次,Arm会从系统的角度来做各种提升,不断优化整个系统内所有相关的IP。

也就是说,上周Arm推出NPU、GPU、DPU的新品实际上就是在从各个角度来为整个系统进行提升。Arm资深产品经理SinanYalcin就表示,如果把一些工作从GPU卸载到DPU上做,就能降低总体的系统能耗。实际上,当GPU在做一个图形处理的任务的时候,它会多次访问内存。但如果用DPU,使用专用的处理器做同样的图形处理的任务,它就会在完成任务后直接把数据发给GPU,这个时候GPU就无须再去访问内存,也就是把GPU的一些负载放到DPU上。这样一个单向的操作就能够节约能耗和带宽。
Arm公司的“工程师文化”也正是希望不断推动能效的提升,相关设计也都是从系统级别来看如何更好地降低功耗,减少芯片面积,提高效率,优化总体设计。上周发布的三款IP恰恰在能效上均有不同的提升,也为更多设备带来了更强大的AI算力、图像处理能力及显示能力,同时这一套全新的IP,设计时就考虑到解决方案,并吻合Arm全面运算(TotalCompute)的初衷,以确保它们确实是实际体验驱动,同时针对解决未来工作负荷的复杂运算挑战进行优化。
性能提升200%的Ethos-N57/N37
Ethos-N57/N37,相对已经发布的定位高端设备的Ethos-N77,Ethos-N57定位主流市场,实现了性能、成本以及功耗的均衡,Ethos-N37则针对低端市场。不过,这两款产品均采用了与Ethos-N77相同的核心架构,均针对Int8与Int16数据类型的支持性进行优化,通过先进的数据管理技术以减少数据的移动与相关的耗电,同时通过如创新的Winograd技术的落地,使性能比其他NPU提升超过200%。

ArmEthos产品组合旨在解决AI与ML复杂运算的挑战,以便为日常生活设备创造更为个性化与沉浸式的体验。由于消费者的设备越来越智能化,通过专属的ML处理器提供额外的AI性能与效率,是非常有必要的。全新的Ethos对成本与电池寿命最为敏感的设计进行优化,NPU可以为日常生活设备带来优质的AI体验。
对于通用型NPU的优势,ArmML事业群商业与营销副总裁DennisLaudick透露,不少合作伙伴都向Arm表示,他们并不希望支持五花八门的处理器,他们希望硬件标准化。Arm正是首先根据生态系统里的伙伴各种各样的需求为他们提供了各种硬件、IP的选择,同时也给他们提供软件和工具的支持。
能效比提升30%的Mali-G57
Mali-G57是Arm首款针对主流市场基于Valhall架构的GPU,性能是前一代产品(ArmMali-G52)的1.3倍。据悉,Valhall架构的两大设计宗旨为:首先,把并行的最小线程数量做得越来越大,使架构越来越宽的;其次尽量简化,从编译的角度来说做得更加的友好。

Mali-G57也同样将能效比提升30%,在性能密集度上也提升了30%,IanSmythe表示该GPU可以以很好的画面质量来运行每秒60帧的游戏。同样,如上文所提到的通过针对同的产品系列以及产品系列内部去不断地提高GPU的ML和人工智能芯片的性能,Mali-G57可使ML性能提升60%。
Mali-G57可将优质的智能与沉浸式体验带到主流市场,包括高保真游戏、媲美电玩主机的移动设备图型效果、DTV的4K/8K用户接口,以及更为复杂的虚拟现实和增强现实的负荷。这是移动市场划分中最大的一部分,而Arm最近与Unity的发布强调其基于ArmIP的片上系统(SoC),CPU,GPU进一步的性能优化的努力,它可以让开发人员有更多的时间创造出全新的沉浸式内容。
系统电力最高可节省30%的Mali-D37
Mali-D37是首款面向主流和入门级别市场的DPU产品,最重要的特点是在支持全高清(FullHD)与2K分辨率的组态下,16纳米制程的面积小于1平方毫米。同时,通过减少GPU核心显示工作以及包括MMU-600等内存管理功能,系统电力最高可节省30%。

由于Mali-D37是一个在最小的可能面积上包含丰富显示与性能的DPU。对于终端用户而言,这意味着当面积成为首要考虑,在例如入门级智能手机、平板电脑与分辨率在2k以内的小显示屏等成本较低的设备上,会有更佳的视觉效果与性能。
于此同时,Arm还与Unity引擎进行合作,目标在自己的原生开发环境中,Unity的开发人员可以方便地访问所有Arm的性能,从而让Unity开发人员能跨Arm的CPU、GPU和NPU获得最佳性能。
在任何数字电子系统中,时钟信号都扮演着“心脏起搏器”的角色。
RTC晶振与普通32.768kHz晶振的PCB设计要点基本一致,其核心均在于通过优化布线以降低杂散电容、确保频率精度,并依托合理的布局规划最大限度屏蔽来自板上其他信号源的电磁干扰。
按晶振的功能和实现技术的不同,分为温度补偿晶振(TCXO)、压控晶振(VCXO)、恒温晶振(OCXO)。
为了在性能与功耗之间取得最佳平衡,需要根据具体应用场景,对基准时钟进行相应的分频、倍频或转换处理,从而为各模块提供适宜的时钟信号。此时,分频技术就成为连接晶振基准频率与系统需求的关键,通过数字电路将晶振原始频率按固定比例降低,输出符合要求的低频时钟信号。
RTC芯片是一种专门用于精准计时、掉电续时的专用集成电路,其核心功能是提供精准、稳定的时间信息(包括秒、分、时、日、月、周、年),并能在主电源断电后依靠备用电池继续保持计时,从而确保时间持续不间断。