AI大型模拟计算比超算快200倍

发布时间:2020-11-30 阅读量:636 来源: 科技日报 发布人: coo

美国塞雷布拉斯系统公司基于有史以来最大芯片制造的专用人工智能(AI)计算机CS—1,在一场具有5亿个变量的模拟计算中,击败了世界排名第69的超级计算机。这项研究成果近日在世界超级计算大会SC20上进行了展示。


研究表明,CS—1在解决燃煤电厂的燃烧问题时,其速度要比其模拟的真实火焰更快。塞雷布拉斯及其合作伙伴美国国家能源技术中心称,CS—1的完成速度要快于当今任何基于CPU或GPU的超级计算机。


塞雷布拉斯首席执行官安德鲁·费尔德曼表示,天气预报、飞机机翼设计、核电站温度预测以及许多其他复杂的问题,都可以通过模拟“流体在空间中的运动随时间的推移”来解决。模拟计算将世界划分为一组多维数据集,对这些多维数据集中的流体运动进行建模,并确定多维数据集之间的交互作用。这些多维数据集可以有100万个甚至更多,可能需要50万个变量来描述正在发生的事情。


此类模拟问题的解决方案需要计算机系统具有许多处理器内核、非常接近内核的大量内存、连接内核和内存的巨大带宽,以及连接内核的带宽负载。同样地,这也是神经网络训练计算机所需要的。CS—1包含一块单芯片,其拥有40万个内核,18GB内存,每秒9PB的内存带宽和每秒100PB的内核间带宽。


美国国家能源技术中心的科学家使用CS-1和世界排名第69的超级计算机“焦耳”对燃煤电厂中的燃烧问题进行了模拟。“焦耳”超算具有84000个CPU内核,耗电量为450千瓦。相比之下,CS—1的功率约为20千瓦。模拟显示,“焦耳”在2.1毫秒内完成了计算,而CS-1用时仅为6微秒,将速度提高了200倍以上。


费尔德曼认为这一速度具有两重含义。其一,在此类流体力学问题的大型模拟计算上,当今没有CPU甚或GPU的组合可以击败CS—1。其二,由于模拟完成的速度比模拟的真实燃烧事件快,因此CS—1现在可以承担一项新任务,即在复杂机器的控制系统中发挥作用。


第一代CS—1使用台积电的16纳米工艺,目前正在研制的下一代CS—1将使用7纳米工艺,其内存为40GB,AI处理器内核数量将达85万个


相关资讯
村田BLM15VM系列量产在即:车规级磁珠解决高频通信干扰难题

在智能驾驶飞速发展的时代,5.9GHz频段的C-V2X(蜂窝车联网)和5.8GHz频段的DSRC(专用短程通信)已成为车辆与环境交互的关键神经。然而,GHz频段内日趋复杂的电磁环境却为通信灵敏度与可靠性带来严峻挑战。传统噪声抑制元件在应对高频宽范围干扰时力不从心,高性能宽频噪声解决方案成为行业急需突破的技术瓶颈。村田制作所(Murata)以其深厚的材料技术积淀和创新设计,适时推出了革命性的片状铁氧体磁珠——BLM15VM系列,直击高频车联网通信的核心痛点。

微软战略转型:裁员重组与800亿美元AI投资的双轨并行

据彭博社6月20日报道,微软计划于今年7月启动大规模组织结构调整,预计裁员数千人,主要集中在全球销售与客户服务部门。此举引发行业对科技巨头战略重心迁移的高度关注,尤其引人瞩目的是其裁员节省的资金流向——微软官方确认将在新财年向人工智能基础设施领域投入约800亿美元。

Microchip新一代DSC破解高精度实时控制难题,赋能AI电源与电机系统

在AI服务器爆发式增长、新能源系统复杂度飙升的产业背景下,传统控制芯片正面临三重挑战:碳化硅/氮化镓器件的高频开关控制需求、功能安全标准升级、以及机器学习边缘部署的实时性要求。Microchip最新推出的dsPIC33AK512MPS512与dsPIC33AK512MC510数字信号控制器(DSC),通过78ps PWM分辨率与40Msps ADC采样率的核心突破,为高精度实时控制树立了新基准。

全球扫地机器人市场迎开门红 中国品牌领跑优势持续扩大

根据权威机构IDC最新发布的《全球智能家居设备季度追踪报告》,2025年第一季度全球智能扫地机器人市场迎来强劲开局,总交付量达到509.6万台,较去年同期增长11.9%,连续第二个季度实现超过20%的增长率。市场活力显著提升,展现出强劲复苏势头。

汽车电子革新:TDK高集成PoC电感破解ADAS空间与成本困局

随着ADAS渗透率突破50%(据Yole 2023数据),车载传感器供电与数据传输架构面临革命性变革。传统双线分立设计(电源线+信号线)导致线束占整车重量超3%,且故障率居高不下。TDK株式会社推出的ADL8030VA系列PoC专用电感器,通过单元件高集成方案重构滤波电路,为智能驾驶系统提供空间与可靠性双重优化路径。