亚马逊发力自研芯片!推Graviton2服务器芯片,性能翻7倍

发布时间:2019-12-4 阅读量:872 来源: 智东西 发布人: Jane

12月4日消息,亚马逊今日在AWS re:invent大会上发布了基于Arm架构的Graviton2服务器芯片,同时公布了Inferentia芯片的最新进展。AWS表示,Graviton2相较x86同类产品计算量提升4倍,性价比提升最高达40%。基于Inferentia芯片的Inf1实例相比Nvidia G4实例,吞吐量提高3倍,且成本降低40%。

 

Graviton2已经针对AWS云的原生应用进行了优化,并且每个核心的浮点性能有2倍提升。Inferentia是用于AI推理的高性能芯片,于去年推出。AWS CEO Andy Jassy今天在会上表示,目前AWS已经储备了人才力量,将在自研芯片领域持续发力,为用户提供更多高性价比产品。

 

一、Inf1吞吐量超英伟达G4 3倍

 

1.png 

▲AWS首席执行官Andy Jassy于2019年12月3日在拉斯维加斯的re:Invent大会上,图片来源:Techcrunch

 

亚马逊AWS今天推出了Inf1实例,该实例由Inferentia芯片提供支持,是一个在云中为AI推理提供支持的实例,AWS CEO Andy Jassy称之为云中可用的成本最低的推理产品。

 

Andy Jassy表示,“与Nvidia G4实例相比,Inf1具有更低的延迟,吞吐量将提高3倍,并且每个实例的成本降低40%。”“使用云服务为AI解决方案提供动力的运营成本绝大多数来自推理,而推理芯片可能会很昂贵,并且要求低延迟和高吞吐量。”

 

Inf1还将由Annapurna Labs制造的Inferentia芯片提供支持,该芯片企业是2015年被以色列AWS收购的。Inferentia芯片拥有4的个NeuronCore,可以提供128TOPS的算力,而每个Inf1实例可以提供2000 TOPS的算力。

 

2.png 

▲Inferentia芯片详细参数,图片来源:AWS

 

Inf1实例目前已经上市,并将与PyTorch,MXNet和TensorFlow集成。2020年,Inf1将可以用于EKS实例和Amazon的SageMaker,来进行机器学习的推理运算。

 

3.png 

▲Inf1实例四种规格,图片来源:AWS

 

二、Graviton2成为英特尔AMD劲敌

 

亚马逊今日还推出了基于Arm架构的Graviton2服务器芯片,与基于x86的同类实例相比,该处理器的性价比最高提升可达40%,计算量提升4倍。基于Arm架构的Graviton2可能会对云工作负载、AWS的成本结构以及数据中心Arm架构的应用产生重大影响。

 

4.png 

▲M6g、R6g、C6g实例部分数据

 

AWS加大了对Graviton2的投注,它们对Arm架构的数据中心处理器研发和稳步推进云基础架构创新都非常重视。AWS正在启动新的基于Arm的Amazon EC2实例,包括M6g、R6g、C6g系列。

 

Graviton2针对云原生应用进行了优化,并且基于64位Arm Neoverse内核和AWS的片上定制系统设计。Graviton2的每核浮点性能提高了2倍,可用于科学和高性能工作负载领域,最多支持64个虚拟CPU,25Gbps网络和18Gbps EBS带宽。

 

AWS CEO Andy Jassy在主题演讲中说:“我们决定设计芯片来为您提供更多功能。尽管许多公司使用x86已有很长时间,但我们希望为您提高性价比。”不过他补充说,英特尔和AMD仍然是AWS的主要合作伙伴。

 

结语:亚马逊服务器芯片重点发力,自研已成主攻方向

 

通过目前亚马逊发布的Inf1实例和Graviton2芯片,以及AWS CEO的发言我们不难看出,打造高性价比的自研芯片是亚马逊目前和今后的主要发展策略,而Arm架构在服务器领域的声量也将越来越大。

 

不过Andy Jassy也提到,英特尔、AMD后续将继续作为AWS的主要合作伙伴。在AI芯片和服务器芯片两大战场,格局似乎变得不再单一,英特尔、AMD、亚马逊等巨头后续会展开怎样的竞争与合作,我们拭目以待

 

文章来源:Techcrunch,ZDNet

相关资讯
“中国芯”逆袭时刻:新唐携7大新品打造全场景AIoT解决方案矩阵

在万物互联与智能化浪潮席卷全球的今天,新唐科技以颠覆性创新奏响行业强音。4月25日,这场历时10天、横跨七城的科技盛宴在深圳迎来高潮,以"创新驱动AI、新能源与车用科技"为主题,汇聚全球顶尖行业领袖,首次公开七大核心产品矩阵,展现从芯片设计到智能生态的全链条创新能力,为半导体产业转型升级注入新动能。

半导体先进制程技术博弈:台积电、英特尔与三星的差异化路径

在2025年北美技术研讨会上,台积电正式宣布其A14(1.4nm)工艺将于2028年量产,并明确表示无需依赖ASML最新一代High NA EUV光刻机。这一决策背后,折射出全球半导体巨头在技术路线、成本控制和市场竞争中的深层博弈。

嵌入式主板EMB-3128:轻量级边缘计算的工业级解决方案

随着AIoT技术的快速落地,智能设备对高性能、低功耗嵌入式硬件的需求持续攀升。华北工控推出的EMB-3128嵌入式主板,搭载Intel® Alder Lake-N系列及Core™ i3-N305处理器,以高能效比设计、工业级可靠性及丰富的接口配置,成为轻量级边缘AI计算的理想选择。该主板支持DDR5内存、多模态扩展接口及宽温运行环境,可广泛应用于智能家居、工业自动化、智慧零售等场景,助力产业智能化升级。

从ASMI财报看行业趋势:AI芯片需求爆发如何重塑半导体设备市场?

作为全球半导体沉积设备领域的龙头企业,荷兰ASM国际(ASMI)近日发布2024年第一季度财报,展现强劲增长动能。财报显示,公司当季新增订单额达8.34亿欧元(按固定汇率计算),同比增长14%,显著超出市场预期的8.08亿欧元。这一表现主要受益于人工智能芯片制造设备需求激增与中国市场的战略性突破,同时反映出半导体产业技术迭代与地缘经济博弈的双重影响。

车规级SerDes国产替代提速:解析纳芯微NLS9116/NLS9246技术优势与市场潜力

随着汽车智能化加速,车载摄像头、激光雷达、显示屏等传感器数量激增,数据传输带宽需求呈指数级增长。传统国际厂商基于私有协议(如TI的FPD-Link、ADI的GMSL)垄断车载SerDes市场,导致车企供应链弹性不足、成本高企。2025年4月,纳芯微电子发布基于HSMT公有协议的全链路国产化SerDes芯片组(NLS9116加串器与NLS9246解串器),通过协议解耦、性能优化与供应链自主可控,为ADAS、智能座舱等场景提供高性价比解决方案,标志着国产车规级芯片从“跟跑”迈向“并跑” 。