发布时间:2026-05-28 阅读量:44 来源: 发布人: suii
5月28日消息,据多位供应链及行业内部人士透露,英伟达原计划于今年下半年推出的推理专用GPU——Rubin CPX,其发布前景正趋于不明朗。由于英伟达至今尚未向供应链下达相关内存及基板订单,业内普遍推测该项目或已遭实质性取消,亦或是正在进行根本性的战略调整。
据知情人士透露,尽管英伟达早在去年9月的AI基础设施峰会上就公布了 Rubin CPX 的发布计划,并明确其将搭载8颗16GB的GDDR7显存(总容量128GB),采用板载部署设计,但截至目前,围绕该产品的实质性开发活动几乎处于停滞状态。
内存行业的相关人士表示,此前市场曾寄望于 Rubin CPX 能成为 GDDR7 显存从高端消费级显卡(如RTX 5090、RTX 5080)向更广泛AI服务器领域扩展的催化剂。然而,目前英伟达并未就 Rubin CPX 的 GDDR7 应用展开任何讨论,相关开发需求也未启动。虽然有猜测认为该产品可能改用高带宽内存(HBM),但目前同样没有取得任何进展。
基板行业的情况同样不容乐观。由于GDDR7内存被设计为围绕GPU基板的板载配置,基板厂商原本预期会迎来一波新的需求增长。但基板行业人士表示,由于 Rubin CPX 项目缺乏实质进展,业内普遍认为该项目实际上已被取消。
这一项目的生变并非毫无征兆。在今年3月举办的 GTC 2026 大会上,英伟达在展示其未来的 Vera Rubin 平台产品线时,意外地将 Rubin CPX 从产品路线图中移除。距离该公司首次展示该产品并计划于今年发布,仅仅过去了大约六个月。尽管外界对此变动多有询问,但英伟达方面至今未给出明确解释。
业内分析认为,Rubin CPX 项目的搁浅,很可能与英伟达在推理计算领域的战略重心转移有关。随着 AI 代理的普及,市场对推理计算的需求急剧增长,英伟达正在积极调整其产品布局以应对这一变化。
关键转折点出现在英伟达去年底与 Groq 签署的一项价值高达200亿美元的协议。通过该协议,英伟达不仅吸收了 Groq 关键的推理技术和工程人员,还获得了其语言处理单元(LPU)技术的授权。目前,Groq 的“Groq 3 LPX”已出人意料地成为了 Vera Rubin 平台的核心推理产品。
传统上,英伟达的 GPU 主要专注于 AI 训练工作负载,而 Rubin CPX 原本是为应对推理市场日益增长的需求而开发的专用 ASIC 芯片。然而,随着 Groq 技术的引入,英伟达显然找到了更具竞争力的替代方案。业内人士普遍认为,英伟达此举实际上是一次对 Groq 的“收购式”合作,旨在通过 LPU 技术巩固其在推理计算领域的领先地位。
目前,关于 Rubin CPX 的最终命运仍存在两种猜测。一种观点认为,鉴于英伟达已经确立了以 Groq 为中心的推理战略,Rubin CPX 项目可能已经被彻底放弃。另一种观点则认为,英伟达可能会在未来的 Feynman 产品线中,以完全不同的形式或规格重新设计并推出 Rubin CPX。
Rubin CPX 所面临的变数,折射出 AI 硬件市场白热化的竞争格局与急速演进的技术迭代节奏。对供应链而言,因原预期中 GDDR7 需求随该推理 GPU 放量落空,短期内只得继续倚仗高端消费级显卡作为主要出货支撑。
小米于宣布,对MiMo‑V2.5系列大模型的API调用价格实施永久性下调,最高降幅达99%,且新版定价不再区分上下文长度。
深天马A回应“京东方洽谈兼并收购”传闻:相关说法不属实
英伟达CEO黄仁勋(Jensen Huang)近日接受清华大学经济管理学院(SEM)的邀请,将加入该院顾问委员会
环球晶董事长徐秀兰在25日召开的股东会上指出,尽管今年半导体硅晶圆市场景气较去年“相对好非常多”,但受成本上涨及折旧摊提增加影响,公司已预告将在今年下半年启动产品售价调涨。
三星电子计划投资约15亿美元在越南建设一座半导体测试工厂。