超低成本!千元级国产开发板即可本地化部署deepSeek-r1 1.5B语言大模型!

发布时间:2025-02-27 阅读量:1874 来源: 我爱方案网 作者: bebop

摘要:使用瑞芯微RK3588本地部署DeepSeek,意味着千元级硬件即可本地化高效运行1.5B/7B DeepSeek模型,无需联网就可在本地处理数据,不需要将数据传输到云端,减少了网络延迟,可以快速响应应用,同时也减少了数据传输到云端时被窃取的问题,不需要借助云端就可以处理数据,也就降低了成本。快包平台可提供安全稳定且即插即用的RK3588开发板及主控芯片,帮助工程师快速实现DeepSeek应用部署。


扫码可申请免费样片以及获取产品技术规格书

图片

RK3588是瑞芯微电子推出的一款高性能处理器,采用先进的8nm制程工艺,集成了四核Cortex-A76和四核Cortex-A55 CPU,以及Mali-G610 MP4 GPU。更重要的是,RK3588内置了独立的NPU(神经网络处理单元),可提供高达6TOPS的AI算力,为运行复杂的深度学习模型提供了强劲动力。


AI界新星DeepSeek(中文名:深度求索)在近期迅速崛起,凭借低成本、高性能的AI模型火爆全网。其核心是一个强大的语言模型,能够理解自然语言并生成高质量文本,此外DeepSeek免费向全球开发者开放,加速了AI技术普及。


在RK3588上部署Deepseek可以通过瑞芯微官方的 RKLLM量化部署,步骤如下:


1、环境搭建
基于Ubuntu系统安装RKLLM-Toolkit,创建Python3.8的Conda环境,安装量化工具链。

2、模型转换
通过transform.py脚本加载模型,结合量化校正数据集,指定目标平台为RK3588,生成适配NPU的.rkllm文件。

3、本地推理
调用RKLLM API实现交互式对话,支持多线程与NPU核心调度,1.5B模型响应延迟低至毫秒级。
本次测试使用的DeepSeek-R1-Distill-Qwen1.5B和DeepSeek-R1-Distill-Qwen7B模型,均为蒸馏模型,通过rkllm-toolkit转换成RK3588开发板支持运行的rkllm格式模型,采用w8a8量化算法,压缩模型体积同时保持精度,1.5B模型仅需1.89GB存储,7B模型仅需7.63GB存储。

DeepSeek转换完成的RKLLM模型如下图所示:

图片

(图源讯为,下同)

然后将其传输到开发板上,使用对应的可执行文件运行即可,运行之后如下图所示:

图片

接下来向该模型提出问题即可,回复内容如下所示:

图片

在回复的过程中查看CPU和NPU的利用率,可以看到CPU的占用率为84%,并且调用了NPU的3个核心进行加速推理:

图片


本地部署,释放边缘AI潜力
RK3588成功在本地部署DeepSeek,意味着无需将数据上传至云端,在设备端即可完成复杂的AI计算任务,这将带来以下优势:

  • 更低延迟: 本地处理数据,无需网络传输,显著降低延迟,满足实时性要求高的应用场景,例如工业机器视觉、自动驾驶等。
  • 更高隐私: 敏感数据无需上传至云端,有效保护用户隐私和数据安全,适用于智慧医疗、金融支付等领域。
  • 更低成本: 减少对云服务的依赖,降低网络带宽和云存储成本,更适合大规模部署。

应用场景广泛,赋能千行百业
RK3588与DeepSeek的结合,为边缘AI应用提供了强大的硬件和软件支持,将赋能以下场景:

  • 智能安防: 在智能摄像头、门禁系统等设备中,利用DeepSeek实现人脸识别、行为分析、异常检测等功能,提升安防效率和准确性。
  • 工业视觉: 在工业生产线中,利用DeepSeek实现产品质量检测、设备状态监控、机器人引导等功能,提高生产效率和产品质量。
  • 智慧医疗: 在医疗影像设备中,利用DeepSeek辅助医生进行疾病诊断和治疗方案制定,提高诊断准确性和效率。
  • 其他领域: 包括智能零售、智慧交通、智能家居等,RK3588和DeepSeek的组合将为各行各业带来创新应用。

快包电子平台推出了很多设计优化的RK3588主板方案,它们都是稳定出货、即插即用,在具体场景实现应用的产品。


瑞芯微RK3588工控机开发板
图片
方案简介:
方案基于Rockchip新一代旗舰 RK3588处理器开发设计,采用先进8nm制程工艺集成4核Cortex-A76+4核Cortex-A55架构,主频最高达2.4GHZ,支持8K超清显示,四屏异显,内置瑞芯微自研三核NPU,综合算力可达6TOPS。
方案特点:
1.6 TOPS算力加持,赋能人工智能应用
2.提供多种显示接口,支持四屏异显
3.提供丰富的CPU接口资源,满足计算链接存储需求
4.支持多种操作系统和二次开发
5.支持双千兆网口通讯
应用场景:
AGV、边缘计算、智慧大屏、高端平板、智能NVR、可视化网关等领域。
瑞芯微3588直播一体机
图片
方案简介:
瑞芯微 3588 直播机是一款即插即用直播机方案,方案可供直播机设备终端制造商开发自定义直播机。该直播机主板采用RK3588高端8核处理器,6T算力,屏幕分辨率最大可支持1920*1080,并配有两个USB3.0、一个Type-C全功能接口,方便客户组合外设,设置WiFi和4G互联,监控外设录像/编辑,快速导入产品创新。
方案特点:
SOC :RockChip RK3588
CPU :4×Cortex-A76+4×Cortex-A55
GPU :ARM Mali-G610 MP4 四核 GPU
NPU :6TOPS
应用场景:
教学培训、直播带货、产品宣传
瑞芯微RK3588边缘计算盒子
图片
方案简介:
瑞芯微RK3588边缘计算盒子,主频高达2.4GHz,适用于边缘计算,广告机,miniPC整机,工控一体机,零售机和快递柜。支持安卓12系统,内嵌高性能AI加速硬件,支持6T算力NPU.板载LPDDR4/LPDDR4X 8G内存,EMMC标配128GB(最大可选512GB),支持WIFI6通信、10000M以太网。可直接驱动1920*1080液晶屏。
方案特点:
1.RK3588超强CPU搭载Android 12系统,速度更快,性能更强。
2.支持PCIE WIFI6,BT5.0,双天线。
3.网口设计,支持一个1000M网口。
4.分辨率最大支持4K@60。
应用场景:
边缘计算,广告机,miniPC整机,工控一体机,零售机和快递柜

扫码可申请免费样片以及获取产品技术规格书

图片


相关资讯
低功耗MCU在智能水表场景中的关键应用价值与实战方案

低功耗、高性能、高安全的MCU产品已经成为了表计行业MCU选型的基本要求,特别是随着国产MCU厂商产品技术的发展和提升,国产MCU产品开始广泛应用到智能表计行业。

代码开源!国产MCU平台开发的EtherCAT工业PLC伺服驱动方案

工业自动化领域,EtherCAT作为一种高效的工业以太网协议,以其出色的实时性能、灵活的拓扑结构和强大的扩展能力,成为众多伺服驱动与步进驱动产品研发的首选。

安防监控方案在工业互联网场景中的应用,附实战方案

网络摄像头是一种结合传统摄像机与网络技术所产生的新一代安防监控方案。它除了具备传统摄像机所有的图像捕捉功能外,还内置了数字化压缩控制器和嵌入式操作系统,无需计算机的协助便可独立工作

开发板上新!ST工业自动化开发板、瑞萨工业千兆网卡开发板等优质方案

在工控领域,设备自动化升级普遍采用购买工控主板或工控机,来快速实现数据采集或控制功能。

高算力MCU开发,实现多屏交互与毫秒级响应功能的汽车仪表盘方案

方案实现快速启动功能,冷启动小于100ms,并于500ms内显示第一屏内容