7000多名研究人员启用全球最快AI超级计算机 Perlmutter!

发布时间:2021-06-1 阅读量:710 来源: NVIDIA 发布人: Joisse

六千个NVIDIA A100 GPU提供了近4百亿亿次混合精度性能,推进美国国家能源研究科学计算中心(NERSC)科学研究。


其将帮助科学家拼合宇宙三维地图,以及探索绿色能源的原子内的相互作用。


微信图片_20210601105121.jpg


近日(28日),在美国国家能源研究科学计算中心(NERSC)正式启用的超级计算机Perlmutter将为7000多名研究人员提供近4百亿亿次的AI性能。


这使得Perlmutter成为在AI使用的16位和32位混合精度数学运算方面全球最快的系统。这一性能,还未包括今年晚些时候,将在劳伦斯伯克利国家实验室系统中开展的项目第二阶段。


Perlmutter是全球最大的A100赋能系统,搭载6144块NVIDIA A100 Tensor Core GPU,可支持20多种应用,致力于推动天体物理学、气象科学等领域的科学发展。


宇宙三维地图


这台超级计算机将在一个项目中协助拼装迄今为止最大的宇宙三维地图。它将处理来自宇宙摄像机——暗能量光谱仪(DESI)的数据。暗能量光谱仪每次曝光可以捕获多达5000个星系。


研究人员需要利用Perlmutter的GPU速度,及时捕捉每晚几十次曝光,从而确定次日晚间将DESI对准何处。在以前的系统中,研究人员需要几周乃至几个月的时间,才能完成一年数据的发布准备工作,而有了Perlmutter,他们在短短几天内就能完成任务。


NERS数据架构师Rollin Thomas目前正在帮助研究人员为Perlmutter编写代码,他表示:“GPU让我们的数据准备工作速度提升了20倍,这太令人感到惊喜了。”


功夫不负有心人


暗能量光谱仪(DESI)的地图将揭示暗能量这一宇宙加速膨胀背后的神秘物理学现象。暗能量的主要发现者是伯克利实验室的天体物理学家Saul Perlmutter,他也因此而获得诺贝尔奖。这台新的超级计算机就是以他的名字命名的。


在Perlmutter因这一发现而获得诺贝尔奖后,Thomas与他一起开展了后续的项目。Thomas提到:“Saul向我们证明了一点,人类只要永保好奇心和乐观精神,就能够做到任何事情。”


融合AI和高性能计算的超级计算机


正是有了Saul Perlmutter的精神,许多项目才有望在NERSC的新超级计算机上运行,例如,材料科学领域的研究旨在发现原子间的相互作用,从而为开发更好的电池和生物燃料指明方向。


传统的超级计算机几乎无法在几纳秒内使用Quantum Espresso等程序来处理模拟多个原子所需的数学运算。然而,通过将它们的高精度模拟与机器学习相结合,科学家们可以在更长的时间内研究更多的原子。


NERSC的应用性能专家Brandon Cook表示:“以前我们不可能针对电池接口这样的大型系统进行完整的原子模拟,但现在科学家们计划用Perlmutter来进行这一模拟。”目前,Brandon Cook正在帮助研究人员启动此类项目。


A100中的Tensor Core能够在这方面发挥其独特的作用。它们既能加速用于模拟的双精度浮点数学运算,又能加速深度学习所需的混合精度计算。


在去年11月,入围戈登·贝尔奖决赛的BerkeleyGW项目赢得了NERSC的认可,这一项目使用了NVIDIA V100 GPU。在NERSC领导该项目并负责监督应用性能的Jack Deslippe认为,A100的强大性能有望将此类研究提升到一个新的水平。


软件令Perlmutter如虎添翼


Deslippe提到,Perlmutter的另一个战略组成部分是软件。与此同时,他还指出该系统所使用的NVIDIA HPC SDK能够支持OpenMP和其他常用编程模型。


另外,用于GPU上数据科学的开源代码RAPIDS,将加快NERSC内部日渐壮大的Python程序员团队的工作速度。目前它已在一个项目中证明了自身价值:相比之前的CPU,它使NERSC Cori超级计算机网络流量分析速度加快了近600倍。


Thomas表示:“这使我们相信,对于如何通过数据加速科学研究,RAPIDS将发挥重要的作用。”


应对疫情挑战


疫情期间,Perlmutter项目仍按计划进行。但团队不得不重新思考一些重要问题,例如:能为该系统的百亿亿次级应用编写代码的研究人员正在居家办公,如何在此期间为其举办编程马拉松。


来自慧与(HPE)的工程师们协助NERSC组装了第一阶段的系统,并且与NERSC工作人员合作,对其设施进行了升级以适应新的系统。Thomas表示,“我们非常感谢他们能够到现场来搭建系统,尤其是在疫情期间受到各种规定限制的情况下。”


在这场线上启动仪式上,NVIDIA首席执行官黄仁勋对于伯克利实验室工作人员使用这台超级计算机推动科学进步的计划表示了祝贺。


黄仁勋表示:“Perlmutter融合了AI和高性能计算,将为材料科学、量子物理学、气候预测、生物研究等多个领域的科研带来突破。”


AI超级计算恰逢其时


NERSC数据和分析服务组代理负责人Wahid Bhimji表示:“美国能源部正在大力发展人工智能科学,将概念验证引入粒子物理学、材料科学和生物能源等领域的生产用例。”


“当前人们正在探索更大规模的神经网络模型,希望获得更加强大的资源,而Perlmutter基于A100 GPU、全闪存系统和数据流功能,能够适时满足人们对AI的这一需求。”


相关资讯
产业深度:2025深圳国际半导体展(SEMI-e)的战略布局与技术前瞻

2025年9月10-12日,SEMI-e深圳国际半导体展将携手中国国际光电博览会(CIOE),在深圳国际会展中心构建覆盖32万平方米的全球半导体产业生态平台。本届展会由集成电路创新联盟与CIOE联合主办,预计吸引超1000家国际头部企业参展,涵盖芯片设计、晶圆制造、先进封装、核心设备及材料等全产业链环节。展区规划聚焦六大核心领域——IC设计与应用、半导体制造、化合物半导体、先进封装技术、设备与材料、AI算力基础设施,集中展示第三代半导体、Chiplet封装、车规芯片等前沿技术成果,推动半导体与光电、汽车、通信等产业的交叉创新。

全球晶圆厂陷投产僵局:技术迭代与成本压力下的战略调整

全球半导体产业正经历深度结构性调整,龙头企业集体陷入"投产困局"与"亏损漩涡"的双重考验。三星电子美国泰勒工厂设备进口延期、台积电海外基地运营成本失控等标志性事件,暴露出行业面临市场需求周期性下行、地缘政治扰动加剧、技术迭代成本陡增等系统性压力。贝恩咨询数据显示,2023年全球晶圆代工板块平均毛利率下降8.2个百分点,而3nm以下先进制程研发支出激增42%,印证产业步入"高投入、低回报"的战略转型深水区。在此背景下,头部企业通过技术联盟重构、区域产能优化等创新策略,试图在行业洗牌中重塑竞争优势。

性能对标国际品牌!南芯SC25042Q为智能汽车打造高性价比通信方案

在智能汽车高速发展的浪潮下,车载通信网络正面临数据传输速率、信号完整性及国产化替代的多重挑战。近日,南芯科技推出的车规级高速CAN/CAN FD收发器SC25042Q,以5Mbps传输速率、自主振铃抑制技术及全场景兼容性破局而生。该产品通过AEC-Q100认证,对标国际品牌性能,不仅解决了传统CAN总线在复杂拓扑下的信号失真和误码率难题,更依托全国产化供应链实现成本优化,为智能座舱、车身控制及新能源高压系统提供了高可靠通信方案,成为国产车载芯片突围高端市场的关键落子。

6000元补贴撬动百亿市场:国产手机品牌集体“狂飙”

根据Counterpoint Research最新报告,2025年第一季度中国智能手机市场销量同比增长2.5%,延续了2024年以来的温和复苏趋势。这一增长主要得益于国家补贴政策的刺激:自1月启动的“国补”计划覆盖售价低于6000元人民币的机型,单机最高补贴500元,直接拉动中高端市场消费活力。数据显示,补贴政策实施首月(1月20日-26日)单周销量同比激增65%,显示出政策对换机需求的显著撬动作用。

国产替代进阶:纳芯微SoC方案降本15%,加速车企智控升级

2025年4月23日,全球汽车产业目光聚焦上海国家会展中心5.2馆。在中国汽车芯片产业创新战略联盟主导下,首个聚焦汽车芯片的集成型展示平台"中国芯"展区正式启幕。作为科创板汽车芯片第一股的纳芯微电子(股票代码:688052),携12大产品线矩阵惊艳亮相,现场展出的嵌入式电机驱动SoC NSUC1610更斩获"年度影响力汽车芯片"大奖,标志着国产汽车芯片正式进入系统级创新阶段。