芯原重磅推出超低能耗NPU IP,突破移动端大语言模型推理瓶颈!

发布时间:2025-06-10 阅读量:1180 来源: 我爱方案网 作者:

【导读】2025年6月9日,芯原股份正式推出其革命性的超低能耗、高性能神经网络处理器(NPU)IP。该IP实现了在智能手机等移动终端设备上高效运行大语言模型(LLM)推理的重大突破,AI算力可灵活扩展至40 TOPS以上。作为专为应对移动平台激增的生成式AI(AIGC)需求而设计的核心引擎,它不仅能为AI PC提供强劲算力支撑,更能满足智能手机等设备对极致能效的严苛要求,标志着移动AI算力进入全新阶段。


15.jpg


产品核心优势


  ● 极致能效比: 专有架构设计深度融合高效内存管理与稀疏感知加速技术,显著降低计算负载与延迟,确保复杂AI任务流畅、响应迅捷,续航无忧。

  ● 超高灵活性与扩展性: 具备高度可配置、可扩展的架构,支持混合精度计算(INT4/INT8/FP16)、稀疏化优化及并行处理,算力可按需无缝扩展至40 TOPS以上。

  ● 广泛兼容性: 全面支持TensorFlow Lite、ONNX、PyTorch等主流AI框架,大幅加速客户在不同场景的应用部署与集成效率。

  ● 强大模型支持: 兼容包括Stable Diffusion、LLaMA-7B在内的数百种主流AI模型及算法(如AI-NR降噪、AI-SR超分),满足多样化AI应用需求。

  ● 异构计算协同: 可与芯原其他处理器IP(如CPU、GPU、DSP)无缝集成,实现高效的异构计算,为SoC设计者提供灵活强大的AI解决方案构建平台。


竞争产品关键指标比对


16.jpg

17.jpg


攻克的核心技术难题


芯原此款NPU的推出,成功解决了移动端部署生成式AI与大模型面临的关键瓶颈:


1. 算力与功耗的极致平衡: 在提供足以驱动LLM推理所需高算力(>40 TOPS)的同时,通过独创的稀疏感知加速引擎和精细化内存子系统设计,将功耗控制在移动设备电池可承受的范围内,解决了高强度AI计算带来的能耗灾难性问题。

2. 大模型移动化部署: 突破性地优化了计算架构与数据流,使LLaMA-7B等参数规模庞大的模型能在资源受限的移动终端上高效运行推理,实现“智能手机即个人AI服务器”的愿景。

3. 复杂模型广泛兼容性: 其高度可配置性和对混合精度、稀疏化的深度支持,有效克服了不同AI模型(尤其是生成式模型如Stable Diffusion)计算需求差异大的难题,实现“一芯多用”。


应用案例与应用场景


  ● 智能手机: 旗舰机型集成此NPU,用户可流畅进行本地化的AI助手对话(LLM)、实时生成创意文本/图像(AIGC)、享受极致的AI增强拍照(超分、降噪)与视频体验。

  ● AI PC/笔记本电脑: 作为核心AI引擎,支持本地运行文档智能总结、代码辅助生成、AI绘图等高生产力应用,保护隐私并提升效率。

  ● XR设备(AR/VR): 实现低延迟的实时环境感知、手势识别、空间音效增强与虚拟物体交互,提升沉浸感。

  ● 智能汽车座舱: 赋能车内强大的本地语音助手、多模态交互、驾驶员状态监控及乘客个性化娱乐服务。

  ● AIoT边缘设备: 在安防摄像头、智能家居中控等设备上实现本地化的实时视觉分析、行为识别与快速决策。


市场前景分析


随着生成式AI(AIGC)和多模态大模型的爆发式增长,市场对移动终端设备本地AI算力的需求正经历指数级跃升。芯原首席战略官戴伟进指出:“智能手机正加速演变为个人AI服务器,强大的本地AI算力已成为移动产品的核心竞争力。” 具备超低功耗特性的高性能NPU,将成为下一代智能手机、AI PC乃至各类AI边缘设备的标配核心IP:


  ● 智能手机市场: 高端及旗舰机型将率先普及支持LLM本地运行的专用NPU,中端机型也将快速跟进,市场渗透率将急剧攀升。

  ● AI PC浪潮: “AI PC”概念的落地高度依赖本地NPU提供的实时、隐私安全的AI能力,该NPU IP是抢占此万亿级市场的关键入场券。

  ● 边缘AI普及: 对低功耗、高性能的边缘AI处理需求将驱动此IP在更广泛的物联网、汽车电子等领域应用。


结语


芯原股份此次推出的超低能耗、支持移动端大语言模型推理的高性能NPU IP,不仅是其在AI处理器领域深厚技术积累的集中展现,更是直击了移动与边缘AI发展的核心痛点——如何在有限能耗下提供强大的本地AI算力。其卓越的能效比、可扩展性、广泛兼容性及异构计算能力,为OEM和芯片设计厂商提供了打造下一代AI智能终端的终极武器。随着该IP在新一代智能手机和AI PC中的量产落地,芯原正引领移动AI计算迈入一个前所未有的高效能、低功耗的新纪元,为终端用户带来真正无缝、智能、个性化的AI体验。


相关资讯
日产与Wayve达成AI驾驶辅助合作!计划2027财年在日本首发

近日,日产汽车和总部位于英国的自动驾驶初创公司Wayve签署协议,合作开发基于人工智能的驾驶辅助系统。

京东重金布局存算一体AI芯片,“40K-100K×20薪”高调招募存算一体AI芯片人才!

京东开启招聘存算一体芯片设计工程师计划,薪酬高达“40K-100K*20薪”

铠侠2026年量产第十代NAND闪存,332层堆叠助力AI数据中心存储升级!

日本芯片制造商铠侠(Kioxia)计划于2026年在其岩手县晶圆厂开始生产新一代NAND闪存芯片。

英特尔、AMD、德州仪器遭指控!被指对芯片流入俄罗斯存在“故意漠视”

一系列诉讼指控芯片制造商英特尔、AMD及德州仪器公司,未能有效阻止其技术被用于俄罗斯制造的武器。

突发!台积电日本晶圆厂已停工,或直接升级至4nm工艺!

台积电日本子公司JASM熊本第二晶圆厂在 10 月下旬启动后近期处于暂停状态,重型设备已撤出工地