重磅!龙芯3A6000将于本月推出,性能媲美10代I5

发布时间:2023-11-7 阅读量:923 来源: 我爱方案网 作者: bebop

11月6日,龙芯中科举行了业绩说明会,并在与投资者互动过程中公布了龙芯3A6000、3B6000、3C6000处理器,9A1000 GPU等产品的最新消息。


官方表示,龙芯3A6000处理器初步定于2023年11月28日正式发布。这款CPU采用龙芯自主指令系统龙架构(LoongArchTM),为4核8线程设计,主频2.5GHz,集成双通道DDR4-3200内存控制器,得到了统信、麒麟、欧拉、龙蜥、鸿蒙等操作系统的支持。性能方面,龙芯3A6000可对标英特尔第10代酷睿i5系列处理器,SPEC CPU 2006 base单线程定/浮点分值分别达到43.1/54.6分,双DDR4-3200内存通道Stream实测带宽超过42GB/s。


在先进工艺研发方面,龙芯称已经开展对新工艺的评估,2024年将研制相关IP并开展测试片研制。胡伟武表示,7nm先进工艺对未来3A7000 CPU产品提升,目前看还应该可以提高20%-30%性能。


据介绍,7nm流片费用较高,一次需花费上亿元,不能用该工艺试错,用已有工艺完成结构试错后再改到更先进工艺。在新工艺上,还需研制DDR5 PHY、PCIE PHY、各类寄存器堆、锁相环等IP。


龙芯服务器类芯片过去并未在算力市场发展中,有效撑起公司业绩成长。胡伟武在业绩会上称,由于过去龙芯只有4核,几乎没有服务器市场。不过随着3C5000和3D5000的推出,今年龙芯服务器有很大进步,胡伟武表示,相信6000系列出来后,会有更大进步——3D6000、3E6000和3C6000推出时间(间隔)不会超过半年。


GPU方面,龙芯中科目前正在开发9A1000等GPU,以及用于互联的“龙链”技术。胡伟武称,9A1000的INT8性能大概达到32TOPS,并支持多个GPU通过龙链互联,“龙链跟3A5000的片间互联协议比,片间互联延迟成倍降低,带宽提高了好几倍,大大提高多片协同工作的性能。但目前龙链和英伟达的NVlink相比,速率要低一些,但效率已经很不错了。”


胡伟武透露,龙芯显卡产品9A1000对标AMD RX550,同时支持科学计算加速和AI加速,计划在2024年Q3流片。


资料显示,龙芯中科是国内唯一基于自主指令系统构建、独立于Wintel/AA的开放信息技术体系,和国内多数企业直接购买国外商业IP进行芯片设计、基于x86/Arm指令系统融入国外信息技术体系、依赖境外先进工艺提升性能的做法,是完全不同的。


龙芯在获得MIPS指令集授权后,借鉴创新出LoongArch指令集。这可以简单理解为指令集技术的“逆向工程”,先买别人的来研究仿制,再独立开发,并一步步迭代。


这条路走得艰难,在没有前人领路,只能“自学”的情况下,龙芯完成研究到独立开发迭代。在性能方面,龙芯制程工艺达到12nm节点,性能逐步达到七八年前主流水平。这表明授权+自研指令集路线的CPU,虽然还没有追上主流CPU的性能,已经取得了不小的进步。


龙芯中科处理器核心IP实现自主设计,依托于三大产品线,构建完整生态。龙芯中科通过完成自研指令系统、CPU和操作系统,龙芯中科打造独立自主信息产业技术体系,在处理器核设计、高速互连设计、内存控制器设计、物理设计等核心技术取得多项专利。


在产品方面,龙芯中科研制的芯片包括龙芯1号、龙芯2号、龙芯3号三大系列处理器芯片及桥片等配套芯片,主要客户是板卡、整机厂商。龙芯1号系列、龙芯2号系列主要面向工控类应用;龙芯3号系列主要面向信息化应用,其中部分面向高端工控类应用;配套桥片在工控类和信息化类领域均有应用。


龙芯具体芯片、方案介绍:


龙芯3A5000

3A5000.png

龙芯3A5000是面向桌面和服务器等信息化领域的通用处理器,是首款采用龙芯指令系统(LoongArch)的处理器芯片。主频为2.3GHz-2.5GHz,包含4个处理器核心。每个处理器核心采用64位超标量GS464V自主微结构,包含4个定点单元、2个256位向量运算单元和2个访存单元。其关键IP源代码均为自主编写,芯片内置安全模块。



龙芯3A5000集成了2个支持ECC校验的64位DDR4-3200控制器,4个支持多处理器数据一致性的HyperTransport 3.0控制器。龙芯3A5000支持主要模块时钟动态关闭,主要时钟域动态变频以及主要电压域动态调压等精细化功耗管理功能。可广泛适用于五轴数控机床、工业计算机、双路服务器等场景。


应用案例:五轴数控机床




3a5000应用.png

该方案基于龙芯3A5000芯片,完成龙芯CPU+ Loongnix + Preempt-RT的核心底层平台,并完成了五轴数控系统核心功能基于该平台的移植与初步验证,正在开展实时系统、 PLC子系统、总线协议栈、设备及轴管理、内核重构、 IDE编程调试软件、 HMI软件移植等完善提升。


龙芯3C5000



3C5000.png

龙芯3C5000通过封装集成了四个3A5000硅片,形成16核处理器,重点优化多核多路互联效率主频 2.2-2.5GHz,单芯片双精度浮点峰值运算速度超过 0.5TFLOPS。单芯片unixbench分值9500以上,双精度计算能力达560GFlops,16核处理器峰值性能与典型Arm 64核处理器的峰值性能相当,并支持最高16路互连,搭配新一代龙芯7A2000桥片,PCIe吞吐带宽比上一代提升400%以上。可满足通用计算、大型数据中心、云计算中心的计算需求。


应用案例:工业服务器


3C5000应用.png


(3C5000边缘云可扩展服务器)


3C5000 多达16核、2.5GHz的主频为实时数据库、历史数据库、应用服务器、OPC服务器提供充沛的计算能力。可应用于工业生产现场、设备控制、实时监控、高性能高可靠运算等场景。


龙芯2K1000LA

2K1000.png



龙芯2K1000是面向工业控制与终端等领域的低功耗通用处理器,片内集成两个 64 位的双发射超标量 LA264 处理器核,主频 1GHz,功耗低至1~5W ,并支持动态降频降压,集成 GPU。芯片外围接口包括两路PCIE2.0、一路SATA2.0、4路USB2.0、两路DVO、64位DDR3及其它多种接口。可广泛适用于行业自助终端、数据网关、工业机器人、工业网关、PLC等领域。


应用案例:AI双目识别一体机

2K1000应用.png



支持适配国产Loongnix/UOS/麒麟系统;

支持龙芯3A4000/2K1000处理器;

支持本地人脸图片的采集入库

金融级别的红外活体防伪认证算法

可用于人脸认证开机等权限管理应用

支持门禁机、认证对比机、一体机产品应用

内存:512MB,1×16-bit DDR4-2400

存储:2Gb NandFlash


申请样片,方案技术资料,请扫二维码。

龙芯.jpg


相关资讯
英伟达、瑞芯微高性能边缘计算盒子的五大应用领域

边缘智能依靠的是设备自身的硬件来处理与机器学习和深度学习相关的数据和过程

国产RISC-V电机控制MCU在伺服编码器中的应用与方案

编码器可以测量旋转角度或直线位移,并通过反馈控制系统调整电机的速度和运动轨迹,确保生产精度和稳定性。

智能表计中的低功耗MCU与应用案例解析

智能表计中的MCU不但需要有超低功耗能力,还要有灵活的功耗管理方式,协调外围电路达到最佳整机功耗。

两款高端MCU产品性能差异分析和选型对比

HC32F460与HC32F448是小华半导体针对电机控制等行业推出的两款高性能MCU,具有不同的应用场景和性能表现

意法半导体发布高能效智能惯性测量单元,提供工业产品寿命保证

未来AI芯片的技术路线图将更加注重性能与能效的平衡,同时,新的计算范式和算法优化也将不断推动芯片架构的创新