微软发布新一代Maia 200高性能 AI 推理芯片,已突破10 petaflops算力!

发布时间:2026-01-28 阅读量:46 来源: 发布人: suii

微软(470.28, 4.33, 0.93%)正式发布新款AI推理芯片Maia 200,定位于为AI推理规模化部署提供高性能核心算力。作为2023年推出的Maia 100的升级版本,该芯片在技术与能效上实现显著提升,可支持更高性能的AI模型以更快速度、更低能耗运行。Maia 200集成超过1000亿个晶体管,在4比特精度下算力突破10 petaflops,8比特精度下约达5 petaflops,整体性能较上一代大幅提高。


图片6.png


AI 推理指运行已训练完成模型的计算过程,与模型训练所需的计算过程不同。随着人工智能企业的发展走向成熟,推理成本在企业整体运营成本中的占比持续提升,也让行业重新聚焦于推理流程的优化方案。


微软希望 Maia 200 能成为推动这一优化的关键产品,助力 AI 企业实现更稳定的业务运行与更低的能耗。微软表示:“实际应用中,单节点 Maia 200 可轻松运行当前规模最大的 AI 模型,且为未来更大规模的模型运算预留了充足的算力空间。


当前科技巨头纷纷自研芯片,以此降低对英伟达的依赖 —— 英伟达的前沿图形处理器(GPU)已成为人工智能企业发展的核心算力支撑,微软这款新芯片的推出,正是这一趋势的体现。例如,谷歌(333.59, 5.16, 1.57%)推出了张量处理单元(TPU),该产品并非以芯片形式对外销售,而是通过谷歌云平台以算力服务的形式开放;电商巨头亚马逊(238.42, -0.74, -0.31%)则拥有自研 AI 加速芯片 Trainium,其最新款 Trainium3 已于去年 12 月发布。这些自研芯片均可承接原本由英伟达 GPU 承担的部分计算任务,从而降低企业的整体硬件成本。


这款芯片采用台积电(332.71, -2.16, -0.65%) 3 纳米制程工艺,每台服务器内集成四颗芯片,通过以太网电缆实现连接,而非 InfiniBand 高速互联标准。英伟达在 2020 年收购迈络思后,便开始推出 InfiniBand 交换机产品。


格斯里在博客中写道,同等价格下,Maia 200 的性能较同类产品高出 30%。微软表示,单颗 Maia 200 搭载的高带宽内存,容量超过亚马逊云科技第三代 Trainium AI 芯片和谷歌第七代张量处理单元。


格斯里还指出,微软可将多达 6144 颗 Maia 200 芯片组网联动,在实现高性能算力的同时,降低能耗与整体拥有成本。


微软表示,Maia系列芯片已在实际业务中部署,不仅为该公司超智能团队的各类AI模型提供核心算力,也为旗下聊天机器人Copilot的日常运营提供技术支撑。截至1月26日,微软已面向开发者、科研学者以及前沿人工智能实验室等多元主体,开放Maia 200软件开发工具包(SDK)在实际业务算力场景中的试用。


相关资讯
鸿蒙HarmonyOS 6新春主题上新:新增马年专属水印!

HarmonyOS 6推出以新春为主题的功能更新,主要包括:“鸿运签名堂”提供个性化艺术签名设计及马年限定签名样式;相机应用新增马年专属水印;以及“贺岁视频一键成片”功能,可自动将静态照片合成为动态贺岁视频。

美光追加240亿美元投资,新加坡厂将扩产存储芯片!

为应对由人工智能发展带来的存储芯片持续短缺,美光科技宣布将在未来十年内向新加坡追加240亿美元投资,用以扩大其先进制造产能。美光表示,这项投资预计将创造约1600个就业岗位,新增晶圆生产线计划于2028年下半年投入生产。

中国机器人三度携手春晚!宇树去年交付突破5500台机器人

中国机器人领先企业宇树科技(Unitree)正式宣布,其已成为中央广播电视总台2026年春节联欢晚会的机器人合作伙伴。

苹果迈入2nm时代!M6芯片首款采用2nm工艺或将近期发布

苹果公司近日意外发布了AirTag 2,这预示着其在2026年可能将持续带来更多新产品。M6芯片预计将是苹果首款采用2nm工艺制造的芯片。

新思科技CEO:存储短缺恐延至2027年!

电子设计自动化(EDA)软件巨头新思科技(Synopsys,SNPS.US)执行长Sassine Ghazi近日指出,存储器的价格上涨与供应短缺局面预计将持续至2027年。