Arm推出NPU、GPU、DPU三款IP,重新定义芯片性能、功耗

发布时间:2021-08-2 阅读量:3201 来源: 我爱方案网 作者: 我爱方案网整理

众所周知,手机市场的需求正在下降,用户的换机周期正在增长,一些评测机构也发现,各家旗舰手机的芯片在单核、多核的性能提升上也正在放缓,这是否意味着芯片的能效提升放缓?曾经表示以每年能效提升30%为目标的Arm却在上周一口气发布三款IP,向放缓说No。


从系统角度不断提升


对于每年能效提升30%来更新自身产品的目标,Arm市场营销副总裁IanSmythe表示计算实际上分不同的层次,Arm会从系统的角度来做各种提升,不断优化整个系统内所有相关的IP。


59.png


也就是说,上周Arm推出NPU、GPU、DPU的新品实际上就是在从各个角度来为整个系统进行提升。Arm资深产品经理SinanYalcin就表示,如果把一些工作从GPU卸载到DPU上做,就能降低总体的系统能耗。实际上,当GPU在做一个图形处理的任务的时候,它会多次访问内存。但如果用DPU,使用专用的处理器做同样的图形处理的任务,它就会在完成任务后直接把数据发给GPU,这个时候GPU就无须再去访问内存,也就是把GPU的一些负载放到DPU上。这样一个单向的操作就能够节约能耗和带宽。


Arm公司的“工程师文化”也正是希望不断推动能效的提升,相关设计也都是从系统级别来看如何更好地降低功耗,减少芯片面积,提高效率,优化总体设计。上周发布的三款IP恰恰在能效上均有不同的提升,也为更多设备带来了更强大的AI算力、图像处理能力及显示能力,同时这一套全新的IP,设计时就考虑到解决方案,并吻合Arm全面运算(TotalCompute)的初衷,以确保它们确实是实际体验驱动,同时针对解决未来工作负荷的复杂运算挑战进行优化。


性能提升200%的Ethos-N57/N37


Ethos-N57/N37,相对已经发布的定位高端设备的Ethos-N77,Ethos-N57定位主流市场,实现了性能、成本以及功耗的均衡,Ethos-N37则针对低端市场。不过,这两款产品均采用了与Ethos-N77相同的核心架构,均针对Int8与Int16数据类型的支持性进行优化,通过先进的数据管理技术以减少数据的移动与相关的耗电,同时通过如创新的Winograd技术的落地,使性能比其他NPU提升超过200%。


60.png


ArmEthos产品组合旨在解决AI与ML复杂运算的挑战,以便为日常生活设备创造更为个性化与沉浸式的体验。由于消费者的设备越来越智能化,通过专属的ML处理器提供额外的AI性能与效率,是非常有必要的。全新的Ethos对成本与电池寿命最为敏感的设计进行优化,NPU可以为日常生活设备带来优质的AI体验。


对于通用型NPU的优势,ArmML事业群商业与营销副总裁DennisLaudick透露,不少合作伙伴都向Arm表示,他们并不希望支持五花八门的处理器,他们希望硬件标准化。Arm正是首先根据生态系统里的伙伴各种各样的需求为他们提供了各种硬件、IP的选择,同时也给他们提供软件和工具的支持。


能效比提升30%的Mali-G57


Mali-G57是Arm首款针对主流市场基于Valhall架构的GPU,性能是前一代产品(ArmMali-G52)的1.3倍。据悉,Valhall架构的两大设计宗旨为:首先,把并行的最小线程数量做得越来越大,使架构越来越宽的;其次尽量简化,从编译的角度来说做得更加的友好。


61.png


Mali-G57也同样将能效比提升30%,在性能密集度上也提升了30%,IanSmythe表示该GPU可以以很好的画面质量来运行每秒60帧的游戏。同样,如上文所提到的通过针对同的产品系列以及产品系列内部去不断地提高GPU的ML和人工智能芯片的性能,Mali-G57可使ML性能提升60%。


Mali-G57可将优质的智能与沉浸式体验带到主流市场,包括高保真游戏、媲美电玩主机的移动设备图型效果、DTV的4K/8K用户接口,以及更为复杂的虚拟现实和增强现实的负荷。这是移动市场划分中最大的一部分,而Arm最近与Unity的发布强调其基于ArmIP的片上系统(SoC),CPU,GPU进一步的性能优化的努力,它可以让开发人员有更多的时间创造出全新的沉浸式内容。


系统电力最高可节省30%的Mali-D37


Mali-D37是首款面向主流和入门级别市场的DPU产品,最重要的特点是在支持全高清(FullHD)与2K分辨率的组态下,16纳米制程的面积小于1平方毫米。同时,通过减少GPU核心显示工作以及包括MMU-600等内存管理功能,系统电力最高可节省30%。


62.png


由于Mali-D37是一个在最小的可能面积上包含丰富显示与性能的DPU。对于终端用户而言,这意味着当面积成为首要考虑,在例如入门级智能手机、平板电脑与分辨率在2k以内的小显示屏等成本较低的设备上,会有更佳的视觉效果与性能。


于此同时,Arm还与Unity引擎进行合作,目标在自己的原生开发环境中,Unity的开发人员可以方便地访问所有Arm的性能,从而让Unity开发人员能跨Arm的CPU、GPU和NPU获得最佳性能。


相关资讯
核心对比!无源晶振与有源晶振在结构和工作原理的本质区别

无源晶振与有源晶振是电子系统中两种根本性的时钟元件,其核心区别在于是否内置振荡电路。晶振结构上的本质差异,直接决定了两者在应用场景、设计复杂度和成本上的不同。

温度稳定性对RTC晶振的计时误差影响与分析

RTC(实时时钟)电路广泛采用音叉型32.768kHz晶振作为时基源,但其频率稳定性对温度变化极为敏感。温度偏离常温基准(通常为25℃)时,频率会产生显著漂移,且偏离越远漂移越大。

从参数到实践!剖析有源晶振的频率稳定度、老化率及正确接线方案

有源晶振作为晶振的核心类别,凭借其内部集成振荡电路的独特设计,无需依赖外部电路即可独立工作,在电子设备中扮演着关键角色。本文将系统解析有源晶振的核心参数、电路设计及引脚接法,重点阐述其频率稳定度、老化率等关键指标,并结合实际电路图与引脚定义,帮助大家全面掌握有源晶振的应用要点,避免因接线错误导致器件失效。

如何对抗晶振老化?深入生产工艺与终端应用的防老化指南

晶振老化是影响其长期频率稳定性的核心因素,主要表现为输出频率随时间的缓慢漂移。无论是晶体谐振器还是晶体振荡器,在生产过程中均需经过针对性的防老化处理,但二者的工艺路径与耗时存在显著差异。

无源晶振YSX321SL应用于高精度HUD平视显示系统YXC3225

在现代汽车行业中,HUD平视显示系统正日益成为驾驶员的得力助手,为驾驶员提供实时导航、车辆信息和警示等功能,使驾驶更加安全和便捷。在HUD平视显示系统中,高精度的晶振是确保系统稳定运行的关键要素。YSX321SL是一款优质的3225无源晶振,拥有多项卓越特性,使其成为HUD平视显示系统的首选。