让三星Exynos 990性能提升20%的背后,你所不了解的M5核心细节

发布时间:2019-11-25 阅读量:930 来源: 智东西 发布人: Jane

11月22日消息,三星在昨天的一个更新补丁中,透露了其自研的最新定制CPU核心M5的部分细节信息,包括相较于前代M4的升级点,以及基础架构图示。M5是三星自研定制核心的第五代产品。

 

三星上月发布了最新一代7nm旗舰SoC芯片Exynos 990,性能增强20%,其中就使用了自家的2颗猫鼬M5核心。据三星消息,Exynos 990今年年底将实现量产,并于明年用在旗舰机型上。

 

本月初,三星宣布放弃自研CPU核心,将关闭CPU核心研发部门,未来的Exynos处理器全部使用ARM架构,至此,M5也成为了三星最后一个自研定制核心。以下是外媒对此次M5细节报道的原文编译。

 

一、IPC改进不明显

 

M5是由三星奥斯汀研发中心(SARC)开发的三星第五代定制内核。考虑到最近的裁员和内部重组浪潮,它也即将成为SARC研发的最后一个定制核心。

 

让三星Exynos 990性能提升20%的背后1.png 

▲M5改进情况概述

 

三星表示,M5内核可提供“高达20%的增强性能”,所以平均水平应该会相对更低。尽管LLVM调度器模型的级别较高,无法说明发生了哪些较小的修改,但我们可以看到一些较大的改动。

 

LLVM补丁程序中,我们很难看到M5的大部分性能提升来自于IPC的改进,除非这些性能提升来自于显着改进的预取器(prefetchers),分支预测器(branch predictors)或其他类似的隐藏组件。

 

二、指令集队列增加

 

在指令集方面,M5具有与M4 – Armv8.2-A相同的ISA级别。在较高的层次上,M5也与M4十分相似:通道(pipeline)保持6宽(wide)解码,后端保留相同的228条深度重排序缓冲区(deep reorder buffer)。

 

三星确实将指令队列从48个条略微增加到60个,而更大的变化是错误预测损失(misprediction penalty)改善了1个周期,降低到15个周期。

 

让三星Exynos 990性能提升20%的背后2.png 

▲M5与M4的参数对比

 

让三星Exynos 990性能提升20%的背后3.png 

▲M5架构示意图

 

三、后端浮点性能改善

 

在后端,三星添加了两条新的32位整数ALU通道。这使整数通道(包括分支)的总数达到7个。添加两个32位ALU通道很有趣,因为它不会提高典型的简单ALU工作负载的吞吐量。

 

让三星Exynos 990性能提升20%的背后4.png 

▲M5 ALU通道数情况

 

在浮点群集(floating-point cluster)方面,三星再次重新平衡了执行通道。最显著的变化是在三个FP通道的每一个上添加了neon dot生产执行单元。这样的改变可以帮助解释(explain)32b整数ALU。

 

让三星Exynos 990性能提升20%的背后5.png 

▲M5 FP通道调整情况

 

结语:回归Arm架构,三星手机芯片寻找新发力点

 

2015年第一代M1核心“Mongoose”亮相以来,三星已经推出了五代定制ARM核心。根据外媒报道,目前三星在CPU核心研发上的投入近200亿美元,Exynos系列SoC性能相较于骁龙、麒麟系列一直具有较强竞争力,此次“砍掉”自研核心业务,可能有多方因素影响。

 

三星虽然放弃了坚持多年的自研CPU核心的道路,但他们也在寻找其他方向。目前三星已经与AMD进行合作,利用AMD强大的GPU研发实力,发力手机GPU领域,预计2021年将会推出搭载AMD GPU的手机。

 

根据Canalys最新发布的数据看,2019年Q3三星仍然是全球最大的智能手机出货厂商,且出货量保持11%的增长速度,这位巨头在手机芯片领域近期动作频频,三星能否找到更多新的发力点,我们拭目以待。

 

原文来自:WikiChip Fuse

相关资讯
新能源汽车的“核心系统”:深度解析大三电与小三电技术体系

本文将从技术原理、系统架构及工程实现角度,全解剖析新能源汽车的大三电和小三电系统

从汽车电子到多元工业应用:CAN总线技术解析与发展趋势

CAN总线技术通过单一总线替代复杂布线系统,极大提高了系统的可靠性与可维护性

窥见电池灵魂:BMS数据采集如何成为电动时代的神经末梢

数据采集的精度和可靠性,直接决定了整个BMS系统性能的天花板

强强联合!英伟达50亿入股英特尔

英伟达投资50亿入股英特尔股票

​温补晶振(TCXO)核心技术解析:8大关键参数决定系统时序精度​

在高速通信、精准导航与精密测量等尖端领域,电子系统的时序架构对时钟信号稳定性的要求已近乎苛刻——其精度如同机械钟表的游丝摆轮,微小偏差便可能引发整个系统的时序紊乱,导致数据传输错误、定位偏移或测量失准。环境温度的波动一直是普通晶振频率稳定性的最大挑战,而温补晶振(Temperature Compensated Crystal Oscillator,简称TCXO)作为高精度时钟基准的核心器件,正是为解决这一核心问题而生。它凭借内置的“感知-计算-补偿”机制,在宽温环境下实现对频率的精准锁定,将温度变化引发的漂移压制在极低水平,成为高端电子系统中不可或缺的“时序锚点”。要真正理解并选型这一精密器件,就必须深入剖析其决定性能优劣的几个重要参数。