发布时间:2022-12-2 阅读量:1046 来源: 我爱方案网整理 发布人: Aurora
Amazon Web Services已经表明,云计算的未来不能仅依靠其新型Graviton3E芯片的通用芯片,AWS将与AMD和英特尔一起推出旨在更快、更高效地执行某些应用程序的专用中央处理器。
虽然受益于许多并行工作的内核,计算世界越来越多地开始使用GPU来处理AI训练等工作负载,但英特尔、AMD和AWS发现为一些对企业、政府、政府和组织都很重要的数据密集型应用程序定制CPU的好处。
这意味着未来CPU改进的节奏不会那么简单,因为这三家公司很快都会有通用和专用的中央处理器可用。对于具有高性能需求的组织,这将需要对系统配置进行更多审查,因为芯片设计人员希望以新的方式提高性能和效率。
就Gravtion3E而言,AWS、AMD和英特尔最近和即将推出的CPU有着相同的目标——高性能计算——至少在更广泛的层面上是这样。我们谈论的是科学家、工程师和其他数据相关专业人士使用的广泛应用,例如计算流体动力学、天气建模和分子动力学等。
AWS本周表示,Graviton3E非常适合HPC应用程序,因为它针对浮点和矢量数学进行了优化。AWS执行官Peter DeSantis声称,与今年早些时候开始为实例提供动力的通用Graviton3相比,这种微调使基于Arm的芯片在生命科学和金融建模工作负载的基准测试中运行得更快。
虽然AWS没有透露有关Graviton3E的许多细节,但我们可以看看来自AMD和英特尔的新的HPC调优CPU,以了解如何调整通用芯片以使一组应用程序受益。
AMD提升缓存以服务于技术计算应用程序
今年早些时候,AMD推出了一款全新的Epyc服务器芯片,代号为Milan-X,旨在加速HPC中的应用程序。目标工作包括电子设计自动化、计算流体力学、有限元分析和结构分析模拟,AMD将其置于“技术计算”的保护伞之下。
Milan-X芯片的批量定价比普通的具有类似特性的第三代Epyc处理器“略有溢价”,但AMD表示,由于CPU上融合了大量缓存,用户可以期待目标工作负载的性能大幅提升。额外的性能以768MB的L3高速缓存的形式出现,是2021年推出的通用第三代通用Epycs的三倍。这意味着双插槽服务器的L3缓存总量可以超过1.5GB。
扩大的L3高速缓存允许CPU在靠近处理器核心的地方存储更多的数据,这对于经常移动大量数据的技术计算工作负载非常重要。AMD声称16核Milan-X芯片每小时可以为Synopsys用于芯片设计的VCS软件执行40.6个任务。相比之下,AMD的同一代16核Epyc每小时只能完成24.4个任务,使得Milan-X芯片的速度提高了66%。
该公司还声称,Milan-X的运行速度比英特尔去年推出的第三代至强可扩展芯片快23-88%,适用于各种技术计算应用。
英特尔通过高带宽内存应对HPC
英特尔还在解决让更多数据更靠近HPC应用程序内核的问题,除了没有创建更大的缓存,该公司还设计了一款具有64GB高带宽内存的CPU。这是指英特尔即将推出的XeonMax系列处理器,它们是明年初推出的SapphireRapids服务器芯片的HPC变体。
英特尔表示,至强Max芯片的性能将优于其第三代至强可扩展处理器和AMD的Milan-X芯片,适用于广泛的HPC应用程序。它通过展示近20个HPC基准来做出这一声明,最高的XeonMax芯片的性能比上一代处理器高出20%至近5倍。
通过将64 GB的高带宽内存直接放入芯片中,英特尔在服务器配置方式上也提供了更大的灵活性。例如,数据中心操作员只需依赖XeonMax的高带宽内存,就可以完全放弃服务器中的DRAM,而无需进行代码更改。这反过来又有望降低购买内存DIMM及其能源成本的相关成本。
XeonMax还可以与高带宽内存一起使用DRAM来扩展整个系统的内存,尽管这需要在软件中进行代码更改。或者,用户可以配置XeonMax的高带宽作为DDR的缓存,而DDR不需要任何代码更改。
虽然增加的高带宽内存是XeonMax的决定性特性,但处理器还有其他的功能来增强某些HPC和AI应用,如英特尔深度学习助推器、英特尔数据流加速器和英特尔高级矩阵扩展。
碎片化处理的未来
专用CPU并不是全新的概念。英特尔一直在大量生产针对电信工作负载进行优化的至强处理器。但这批新产品代表了一个更大的浪潮,即将到来的中央处理器将不会被设计为服务于尽可能广泛的应用程序。
英伟达(Nvidia)计划在明年年初发布基于ARM的Grace CPU,用于HPC和人工智能。另一方面,AMD正在开发未来几代Epyc芯片,这些芯片不仅针对HPC进行了优化,还针对边缘和电信工作负载进行了优化。英特尔和AMD都在开发为云计算优化的CPU。
我们需要考虑英特尔、Nvidia和AMD正在研究如何让CPU和GPU之间的距离更近一些,用于需要大量马力的应用程序。对于英伟达来说,这将在明年以Grace Hopper Superchip的形式出现。英特尔计划在2024年通过其Falcon Shores"XPU"实现这一目标。与此同时,AMD打算在明年推出的Instinct MI300芯片上实现这一点。
关于我爱方案网
我爱方案网是一个电子方案开发供应链平台,提供从找方案到研发采购的全链条服务。找方案,上我爱方案网!在方案超市找到合适的方案就可以直接买,没有找到就到快包定制开发。我爱方案网积累了一大批方案商和企业开发资源,能提供标准的模块和核心板以及定制开发服务,按要求交付PCBA、整机产品、软件或IoT系统。更多信息,敬请访问http://www.52solution.com
市场研究机构UBI Research最新报告显示,2024年第二季度全球折叠屏手机OLED面板出货格局出现显著变化。三星显示以52%的市占率重回行业首位,单季度出货量呈现指数级增长——其4月出货量仅为25万片,5月迅速攀升至178万片,6月维持153万片高位,季度总出货量达356万片。
全球科技巨头英伟达与电子制造领军企业富士康正加速合作,计划于富士康美国休斯顿新建工厂部署人形机器人,用于生产英伟达下一代人工智能服务器。该项目预计于2025年第一季度投入运行,标志着人形机器人技术首次大规模应用于高端硬件制造产线。
日本显示器公司(JDI)于6月21日通过股东大会,正式批准了包括车载业务分拆、大规模裁员及技术转型在内的深度重组计划。这标志着连续11年净亏损(2024财年达782亿日元)的老牌面板企业,开启了创立以来最彻底的自我革新。
三星电子近期在第六代1c纳米级DRAM晶圆测试中实现重大突破,良率跃升至50%-70%,较2023年不足30%的水平翻倍增长。这一进展源于其研发团队对芯片结构的重新设计,通过创新性架构调整显著提升能效与生产稳定性。此前因技术优化导致的量产延迟已通过激进投资策略弥补,三星正同步推进平泽工厂P3/P4生产线的设备部署,为年内启动大规模量产铺平道路。
全球5G网络规模化部署面临射频系统集成度低、散热效率不足的核心挑战。Qorvo作为射频技术领导者,针对性推出两款高性能组件——QPQ3550 BAW滤波器和QPA9862预驱动放大器,通过系统级创新推动5G mMIMO基站与固定无线接入设备的性能跃迁。