被指抄袭阿里通义千问!华为盘古团队官方回应......

发布时间:2025-07-10 阅读量:3108 来源: 我爱方案网 作者: bebop

近期大模型领域里面出了个大瓜,华为的盘古大模型被质疑套壳和抄袭了阿里的通义千问开源大模型。

7月初,有自称是哥斯达黎加大学的韩国学生的GitHub用户,发布报告指出:盘古Pro MoE模型与阿里通义千问Qwen-2.5 14B模型的注意力参数指纹相似度高达0.927(接近完全一致的1.0),远超行业0.7以下的正常差异阈值,且在开源代码中发现了阿里的版权声明。 

图片










对比研究报告  图源:Github

截至发稿,上述文章已删稿。

针对质疑,华为官方“诺亚方舟实验室”迅速出面否认,其表示:模型为昇腾平台自主研发,部分代码引用已合规标注,并且符合开源协议。

图片

华为盘古团队的回应中,一个细节值得玩味:盘古大模型部分基础组件代码确实参考了业界开源实践,涉及其他开源大模型的部分开源代码。但严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。至于参考的是不是通义千问,标注出来的是不是通义千问的源代码,就没具体说了。

 

而阿里的沉默,则被解读为一种战术性回避,避免卷入公开论战。


一波未平一波又起,就在7月6日凌晨,一位自称是盘古大模型团队的员工自曝,确实存在套壳、续训、洗水印的现象。


图片

爆料文章截图


该员工表示,由于团队初期算力非常有限,虽做出了很多努力和挣扎,但没有预期效果,内部的质疑声和领导的压力也越来越大。后来小模型实验室多次套壳竞品,领导层被指默许造假行为换取短期成果。


自曝文中称:“经过内部的分析,他们实际上是使用Qwen 1.5 110B续训而来,通过加层,扩增ffn维度,添加盘古pi论文的一些机制得来,凑够了大概135B的参数。”并表示,“听同事说他们为了洗掉千问的水印,采取了不少办法,甚至包括故意训了脏数据。”“他们选择了套壳DeepSeekv3续训。他们通过冻住DeepSeek加载的参数,进行训练。”


最后其也对盘古大模型的未来给出了肺腑之言:其实时至今日,我还是真心希望华为能认真吸取教训,能做好盘古,把盘古做到世界一流,把昇腾变成英伟达的水平。


截至目前,华为并未对此自曝内容发表声明。


笔者认为,这场争论尚无最终定论,但已为行业敲响警钟:国产大模型的崛起,需要超越“规避抄袭争议”的底线思维,向真正的架构创新与技术定义权迈进——因为最终决定市场地位的,从不是参数的相关性系数,技术只是基座,唯有普惠大众才是终极目标。正如工业界所言:“没有落地的大模型如同悬浮的引擎”,唯有扎根产业土壤,AI才能真正成为新质生产力的核心驱动力。

当前,瑞芯微平台的RK3588能很好地承载deepseek-r1 7B和1.5B语言大模型,在端侧运行时,RK3588凭借自身架构和NPU算力,可流畅运行7B/1.5B模型,生成速度每秒十几token。快包平台可提供安全稳定且即插即用的RK3588开发板及主控芯片。


扫码可申请免费样片以及获取产品技术规格书

图片

RK3588是瑞芯微电子推出的一款高性能处理器,采用先进的8nm制程工艺,集成了四核Cortex-A76和四核Cortex-A55 CPU,以及Mali-G610 MP4 GPU。更重要的是,RK3588内置了独立的NPU(神经网络处理单元),可提供高达6TOPS的AI算力,为运行复杂的深度学习模型提供了强劲动力。

AI界新星DeepSeek(中文名:深度求索)在近期迅速崛起,凭借低成本、高性能的AI模型火爆全网。其核心是一个强大的语言模型,能够理解自然语言并生成高质量文本,此外DeepSeek免费向全球开发者开放,加速了AI技术普及。

在RK3588上部署Deepseek可以通过瑞芯微官方的 RKLLM量化部署。

RKLLM-Toolkit 是为用户提供在计算机上进行大语言模型的量化、转换的开发套件。通过该工具提供的Python接口可以便捷地完成以下功能:

1.模型转换:支持部分格式的大语言模型转换为RKLLM 模型转换后的 RKLLM 模型能够在 Rockchip NPU 平台上加载使用2.量化功能:支持将浮点模型量化为定点模型

DeepSeek转换完成的RKLLM模型如下图所示:

图片

(图源讯为,下同)

然后将其传输到开发板上,使用对应的可执行文件运行即可,运行之后如下图所示:

图片

接下来向该模型提出问题即可,回复内容如下所示:

图片

在回复的过程中查看CPU和NPU的利用率,可以看到CPU的占用率为84%,并且调用了NPU的3个核心进行加速推理:

图片


RK3588与DeepSeek的结合,可以有效应用在以下场景:
  • 智能家居: RK3588可搭载于智能摄像头、智能门锁等设备中,利用DeepSeek实现人脸识别、行为分析等功能,提升家居安全性和便捷性。例如,当识别到陌生人闯入时,系统可自动报警;当识别到老人摔倒时,系统可及时通知家人。
  • 工业控制: 在工业生产线上,RK3588可结合DeepSeek实现产品质量检测、设备状态监控等功能,提高生产效率和产品质量。例如,在表面检测场景中,DeepSeek可快速识别产品表面的缺陷,并自动进行分类和记录。
  • 表面检测: RK3588可应用于各种表面检测设备中,例如PCB板检测设备、液晶面板检测设备等,利用DeepSeek实现高精度、高效率的缺陷检测,提高生产效率和产品质量。

快包平台推出了很多设计优化的RK3588主板方案,它们都是稳定出货、即插即用,在具体场景实现应用的产品。

瑞芯微RK3588工控机开发板

图片

方案简介:

方案基于Rockchip新一代旗舰 RK3588处理器开发设计,采用先进8nm制程工艺集成4核Cortex-A76+4核Cortex-A55架构,主频最高达2.4GHZ,支持8K超清显示,四屏异显,内置瑞芯微自研三核NPU,综合算力可达6TOPS。

方案特点:

1.6 TOPS算力加持,赋能人工智能应用

2.提供多种显示接口,支持四屏异显

3.提供丰富的CPU接口资源,满足计算链接存储需求

4.支持多种操作系统和二次开发

5.支持双千兆网口通讯

应用场景:

AGV、边缘计算、智慧大屏、高端平板、智能NVR、可视化网关等领域。

瑞芯微3588直播一体机

图片

方案简介:

瑞芯微 3588 直播机是一款即插即用直播机方案,方案可供直播机设备终端制造商开发自定义直播机。该直播机主板采用RK3588高端8核处理器,6T算力,屏幕分辨率最大可支持1920*1080,并配有两个USB3.0、一个Type-C全功能接口,方便客户组合外设,设置WiFi和4G互联,监控外设录像/编辑,快速导入产品创新。

方案特点:

SOC :RockChip RK3588

CPU :4×Cortex-A76+4×Cortex-A55

GPU :ARM Mali-G610 MP4 四核 GPU

NPU :6TOPS

应用场景:

教学培训、直播带货、产品宣传

瑞芯微RK3588边缘计算盒子

图片

方案简介:

瑞芯微RK3588边缘计算盒子,主频高达2.4GHz,适用于边缘计算,广告机,miniPC整机,工控一体机,零售机和快递柜。支持安卓12系统,内嵌高性能AI加速硬件,支持6T算力NPU.板载LPDDR4/LPDDR4X 8G内存,EMMC标配128GB(最大可选512GB),支持WIFI6通信、10000M以太网。可直接驱动1920*1080液晶屏。

方案特点:

1.RK3588超强CPU搭载Android 12系统,速度更快,性能更强。

2.支持PCIE WIFI6,BT5.0,双天线。

3.网口设计,支持一个1000M网口。

4.分辨率最大支持4K@60。

应用场景:

边缘计算,广告机,miniPC整机,工控一体机,零售机和快递柜

扫码可申请免费样片以及获取产品技术规格书

图片


相关资讯
RK3576 AI边缘计算盒:破解云端传输延迟与网络波动难题!

在人工智能与边缘计算技术加速融合的趋势下,本地智能正成为驱动产业变革的重要力量。瑞芯微RK3576边缘计算盒凭借高计算性能、低功耗设计和灵活的可扩展性,结合其先进的硬件架构与广泛的应用适配能力,为工业视觉检测、工程机械智能化以及智慧城市建设等多个领域的转型升级提供了坚实的技术支撑。

边缘计算方案赋能工业缺陷检测:6~21T高算力实战方案可选!

瑞芯微RK3588边缘计算盒子,主频高达2.4GHz,适用于边缘计算,广告机,miniPC整机,工控一体机,零售机和快递柜。

基于GD32与APM32的变频方案:集成算法,转矩响应小于10ms!

国产MCU通过异构计算架构与高度集成的电力电子外设,为变频控制提供了全新的硬件平台

国产3kW大功率数字电源方案上市,源代码&原理图开源可交付!

该电源方案在紧凑的体积内实现 3000W 的强劲功率输出,功率密度大幅提升,有效节省数据中心宝贵的空间资源, 满足高密度计算场景需求。

方案上新 | 最大工作电流3200A!提升18%响应精度的光伏储能专用并离网无缝切换开关方案

近些年来,随着光伏组件与储能技术的不断成熟和成本下降,光伏储能系统正通过高效存储与智能调度太阳能电力,以提升能源自给率与供电可靠性,并有效平抑间歇性发电对电网的冲击,从而实现清洁能源的稳定利用与供需平衡优化。