刚刚,芯片界震动!Arm引入自定义指令集,成立自动驾驶计算联盟

发布时间:2019-10-9 阅读量:1691 来源: 智东西 发布人: Jane

智东西10月9日消息,今日凌晨,在加利福尼亚州圣何塞举行的Arm TechCon 2019活动上,Arm宣布在部分CPU内核引入自定义指令功能,即客户能够编写自己的定制指令来加速其特定用例、嵌入式和物联网应用程序。

 

2020年开始,使用Cortex-M33内核及之后的Cortex-M CPU内核系列的所有客户都可以免费使用自定义指令功能。

 

刚刚,芯片界震动1.jpg 

▲Arm CEO Simon Segars讨论未来Arm CPU内核上的新自定义指令集功能。

 

Simon Segars表示,在公司重返公开市场之前,仍有许多事情需要安排到位。不过软银CEO孙正义为Arm设定的在2023年重返证券市场的目标仍保持不变。

 

在本次大会上,Arm还宣布更改其免费的开源物联网操作系统Mbed OS的合作伙伴治理模式,允许开发人员对Mbed OS的特性产生更直接的影响。另外,Arm成立自动驾驶汽车计算联盟,并宣布与Unity合作以支持各种3D内容创作。

 

一、将自定义指令引入CPU内核

 

本次大会上,Arm首席执行官Simon Segars宣布,从Cortex-M33起,Arm将在CPU内核中集成一个特殊的块,允许客户对Armv8-M指令集体系结构(ISA)进行自定义指令。从2020年开始,使用Cortex-M33及此后Cortex-M CPU内核系列的所有客户都可以免费使用自定义指令功能。

 

刚刚,芯片界震动2.jpg 

 

Arm Cortex-M内核是功耗优化的内核,可与智能手机和PC等应用程序中的Cortex-A性能内核结合使用。该内核还是数十亿个低功率嵌入式/ IoT应用程序的主要处理内核,应用领域覆盖烤面包机、冰箱、电机控制、传感器处理等各类终端设备,占每年数十亿Arm核出货量的绝大部分。

 

刚刚,芯片界震动3.jpg 

 

ARM汽车和物联网业务高级总监Thomas Ensergueix表示,Arm始终有一系列的加速选项,从其内存映射架构开始,通过总线和当今的神经处理器单元进行连接,这使得CPU和加速器可并行运行,但与此同时总线成为瓶颈,客户还可以选择直接连接到CPU的协处理器。

 

而今天新发布的自定义指令功能允许Arm客户创建自己的加速算法,然后直接在CPU上运行,这意味着客户可以更快的智能集成和快速开发完全集成的自定义CPU指令,而不会产生软件碎片,也不像内存映射解决方案那样并行运行。

 

刚刚,芯片界震动4.png 

 

由于现有CPU功能没有中断,此设置为集成客户工作负载加速提供了更低的成本和风险,并且仍允许其客户使用他们所熟悉或已使用的现有标准工具。

 

刚刚,芯片界震动5.jpg 

 

当前Arm已经与许多合作伙伴合作以支持自定义指令,包括IAR Systems、恩智浦、芯科科技、ST意法半导体等。

 

这是今年Arm为使其产品和技术更加灵活所发布的第二项公告。此前在今年夏天,Arm宣布了一项新许可计划,为客户提供更低价的大量IP访问权限,在生产出芯片前无需签署许可协议。

 

Arm灵活访问服务的帮助下,客户每年只需支付7.5万美元即可购买单个芯片,而无需支付20万美元即可购买无限数量的芯片。

 

刚刚,芯片界震动6.jpg 

 

这些新的措施有助于解决Arm架构的两个局限性,一是开发芯片的成本,二是使用非常规硬件的灵活性。许可的变更和开发自定义指令的能力使当前和潜在客户可以更轻松地开始利用Arm IP开发芯片,同时利用其优势或Arm工具和广阔的生态系统。

 

二、改变Mbed OS合作伙伴治理模式

 

除了发布自定义指令功能,Arm还宣布改变其免费开源嵌入式操作系统Mbed OS的合作伙伴治理模式。Mbed OS做为物联网(IoT)的基础,正帮助日常物品变得更加智能互连。

 

在将近30年的时间里,由1000多个合作伙伴组成的Arm生态系统合作开发了一个模型,已交付了超过1500亿个芯片,助力数百个合作伙伴打造数十亿个基于Arm芯片的IoT设备。

 

刚刚,芯片界震动7.jpg 

 

Arm表示,在解决开发和部署物联网的挑战时,Arm生态系统模型是紧密结合在一起的。

 

为了简化物联网开发,过去十年,Arm围绕免费的开源物联网操作系统Mbed OS建立了一个广阔的生态系统,其中包括超过42.5万个第三方软件开发人员、150多个启用Mbed的主板及模块。

 

当前,Arm正在将Mbed OS改成协作型治理方式,建立每月的产品工作组会议,在该会议上,Arm将确定优先级并进行投票,然后将新功能添加到Mbed OS中。任何Mbed Silicon合作伙伴计划成员均可参加。

 

Analog Devices、赛普拉斯、Maxim Integrated、Nuvoton、恩智浦、瑞萨电子、瑞昱半导体、三星、 芯科科技、u-blox等多家Arm芯片合作伙伴已经积极参加了该工作组。

 

刚刚,芯片界震动8.jpg 

▲Arm计划成为所有技术的粘合剂。

 

此前大多数商业物联网操作系统是由单个供应商开发的,没有关于硬件合作伙伴如何贡献的清晰模型。Arm表示,产品工作组讨论的结果将最终使更广泛的Arm IoT生态系统受益,以帮助硅芯片合作伙伴能够保持强大的商业领导地位,加大构建新功能、特性和功能的力度,这对于扩展至数万亿连接的设备至关重要。同时,它也有助于塑造和确定Mbed OS的未来方向。

 

例如,Arm正在根据合作伙伴的初步贡献进行新的低功耗电池优化,这将延长设备在现场的电池寿命。

 

随着物联网市场规模扩大到数千亿、万亿个互联设备,Arm表示,只有合作伙伴能够继续合作,生态系统模型才会成功。这是朝着推动物联网生态系统内不断创新和差异化迈出的重要一步。

 

三、成立自动驾驶汽车计算联盟

 

在大会上,Arm汽车和嵌入式产品高级副总裁Dipti Vachani宣布成立自动驾驶汽车计算联盟,以协作的方式解决各种安全和计算问题。

 

联盟成员包括通用汽车、NVIDIA、电装、丰田、博世、Arm、德国大陆集团和恩智浦。

 

刚刚,芯片界震动9.jpg 

 

Vachani说,很多人对人类驾驶和自动驾驶汽车的安全性感到担忧,为了确保来自不同提供商的技术能很好协同工作,该联盟将就安全性、计算、软件等问题进行合作。她表示,此前没有任何一家公司能做到这一点。

 

刚刚,芯片界震动10.jpg 

 

四、合作Unity支持3D应用

 

本次大会上,Arm宣布将与Unity合作,以确保3D应用程序在使用Arm架构的硬件上流畅运行。该公告是硬件和软件设计中更大的全计算(Total Compute)协作方法的一部分,开发人员可以轻松访问除CPU内核之外的其他内核。

 

Arm客户业务部门市场营销副总裁Ian Smythe说,Arm Total Compute代表了一种IP设计的新方法,重点是用例驱动的优化系统解决方案。

 

刚刚,芯片界震动11.jpg 

 

基于该解决方案,开发人员将借助软件开发套件编写他们的软件,从而可以找出在CPU、GPU或机器学习(ML)硬件上处理该软件的最佳方法,了解如何优化以获得最佳渲染和性能。 Arm的客户小组副总裁Paul Williamson表示,这取决于在给定的功率范围内处理软件的最佳方法。

 

作为Total Compute的一部分,Arm和Unity Technologies正在扩展战略合作伙伴关系,以进一步提高性能。

 

刚刚,芯片界震动12.jpg 

 

Williamson说,Arm和Unity正将合作扩展到各种3D内容,尤其是VR和AR,要使其在具有计算约束的所有平台上达到最佳状态,需要进行大量工作。双方已在工程上合作了几个月,并将在未来几年继续这样做。Arm的技术将针对Unity实时3D开发平台进行优化,反之亦然。

 

Unity Technologies平台副总裁Ralph Hauwert表示很高兴与Arm合作,这将确保全球最大的创作者群体——Unity开发人员——为数十亿Arm驱动的设备提供经过独特优化的工具。

 

刚刚,芯片界震动13.jpg 

▲Unity渲染游戏和娱乐图形。

 

Smythe认为,从过程扩展和数据隐私方面的挑战,到CPU以外的非常分散的生态系统,都正在发生多种转变。尽管5G将创造一个充满机遇的世界,但硬件制造商仍将需要为下一代的沉浸式体验提供强大的功能、性能和效率,Total Compute将努力试图在5G连接性和处理屏幕图形的需求之间找到平衡。随着5G的到来,AI、xR和IoT的加速正在改变计算需求,数字沉浸所需的性能将必须超越当今的水平。

 

“这要求我们设计知识产权(IP)的方法截然不同,重点是优化性能、安全性和开发人员访问权限。毫无疑问,这不会完全一样,而只是思维方式的转变。” Smythe说,“通过从IP、软件和工具内部以及跨IP、软件和工具进行优化,以提供安全的基础并提供应对未来工作负载的复杂计算挑战所需的性能,我们正在从单一产品开发重点转向用例和经验驱动的系统解决方案。 ”

 

五、持续提升机器学习性能和安全功能

 

Arm推出Cortex-A73以来,Arm逐步提高了机器学习(ML)的性能,今天,Arm希望大幅扩展ML在CPU中的使用。

 

Smythe说:“为了实现这个新的数字世界,我们需要将计算推向更高的水平,这就是为什么我们在我们的下一代Cortex CPU Matterhorn中添加了Matrix Multiply(MatMul)的原因,从而使ML性能有效地比以前提高了一倍世代。”

 

刚刚,芯片界震动14.jpg 

 

据他介绍,除了CPU之外,Arm还需关注Total Compute方法并将其应用于系统中的每个计算元素及其基础架构。无论是Arm CPU、GPU、NPU、互连模块还是系统IP,都必须对其进行优化以作为集成解决方案。而这要依靠实现这一目标的软件和工具,包括Arm NN、Arm计算库、开源社区和开放标准等,它们全都建立在安全的基础上。

 

刚刚,芯片界震动15.jpg 

 

▲Ian Smythe公布Total Compute所做的努力。

 

由于人们正越来越依赖于手机作为所有个人信息、隐私和安全事宜的中心,Arm现已开始作为Total Compute的一部分推出诸如存储标签扩展(MTE)之类的创新安全功能,以满足客户的各种需求。

 

Arm希望,Total Compute成为所有开发人员的首选平台。

 

刚刚,芯片界震动16.jpg 

 

最近,谷歌宣布了与Arm合作设计用于Android设备的MTE的计划。这些功能与平台安全体系结构(PSA)相结合,将有助于对整个生态系统的安全性进行标准化和碎片整理。

 

Smythe说,任何Total Compute解决方案都涉及很多要素,无论是用于VR头显还是可穿戴设备,智能手机或DTV,其目标是为未来的计算平台提供基础,并采用全面计算方法,简化安全性,提高性能和效率,并为开发人员提供整个Arm生态系统更多的性能访问机会,最终实现真正的数字沉浸式体验。

 

结语:顺应开发定制芯片的大势

 

过去一年,开源指令集RISC-V的兴起、以及老牌MIPS宣布开源,都对于Arm发起了冲击。从Arm今年以来的一系列举措,我们可以看出Arm正迅速适应市场变化,消解竞争压力。

 

新发布的自定义指令功能,解决了使用第三方IP内核的一大限制,迎合了电子行业中不断发展的趋势,即开发定制芯片以优化性能、降低成本。对于Arm来说,这是拥抱指令集定制化的重要一步,同时仍保持其内核的安全性、可预测性和可靠性。

 

开发定制芯片仍需付出巨大的成本和风险,但随着这一门槛逐渐降低,消费电子设备、汽车OEM等越来越多的公司正在开发或考虑在内部或通过合作伙伴开发定制芯片。

 

原文来自:VentureBeat,Forbes,Techcrunch

相关资讯
“中国芯”逆袭时刻:新唐携7大新品打造全场景AIoT解决方案矩阵

在万物互联与智能化浪潮席卷全球的今天,新唐科技以颠覆性创新奏响行业强音。4月25日,这场历时10天、横跨七城的科技盛宴在深圳迎来高潮,以"创新驱动AI、新能源与车用科技"为主题,汇聚全球顶尖行业领袖,首次公开七大核心产品矩阵,展现从芯片设计到智能生态的全链条创新能力,为半导体产业转型升级注入新动能。

半导体先进制程技术博弈:台积电、英特尔与三星的差异化路径

在2025年北美技术研讨会上,台积电正式宣布其A14(1.4nm)工艺将于2028年量产,并明确表示无需依赖ASML最新一代High NA EUV光刻机。这一决策背后,折射出全球半导体巨头在技术路线、成本控制和市场竞争中的深层博弈。

嵌入式主板EMB-3128:轻量级边缘计算的工业级解决方案

随着AIoT技术的快速落地,智能设备对高性能、低功耗嵌入式硬件的需求持续攀升。华北工控推出的EMB-3128嵌入式主板,搭载Intel® Alder Lake-N系列及Core™ i3-N305处理器,以高能效比设计、工业级可靠性及丰富的接口配置,成为轻量级边缘AI计算的理想选择。该主板支持DDR5内存、多模态扩展接口及宽温运行环境,可广泛应用于智能家居、工业自动化、智慧零售等场景,助力产业智能化升级。

从ASMI财报看行业趋势:AI芯片需求爆发如何重塑半导体设备市场?

作为全球半导体沉积设备领域的龙头企业,荷兰ASM国际(ASMI)近日发布2024年第一季度财报,展现强劲增长动能。财报显示,公司当季新增订单额达8.34亿欧元(按固定汇率计算),同比增长14%,显著超出市场预期的8.08亿欧元。这一表现主要受益于人工智能芯片制造设备需求激增与中国市场的战略性突破,同时反映出半导体产业技术迭代与地缘经济博弈的双重影响。

车规级SerDes国产替代提速:解析纳芯微NLS9116/NLS9246技术优势与市场潜力

随着汽车智能化加速,车载摄像头、激光雷达、显示屏等传感器数量激增,数据传输带宽需求呈指数级增长。传统国际厂商基于私有协议(如TI的FPD-Link、ADI的GMSL)垄断车载SerDes市场,导致车企供应链弹性不足、成本高企。2025年4月,纳芯微电子发布基于HSMT公有协议的全链路国产化SerDes芯片组(NLS9116加串器与NLS9246解串器),通过协议解耦、性能优化与供应链自主可控,为ADAS、智能座舱等场景提供高性价比解决方案,标志着国产车规级芯片从“跟跑”迈向“并跑” 。