关注飞总聊IT,了解IT行业的方方面面。
这几天在大模型领域里面最大的瓜,是的盘古大模型。
具体来说,就是华为的盘古大模型被质疑套壳和抄袭了的通义千问开源大模型。
事情最初起源于2025年7月4日。 一项发布于GitHub的研究指出,华为盘古Pro MoE 模型(总参数720亿)采用了LLM-Fingerprint(模型指纹技术),与阿里通义千问Qwen-2.5 14B模型的注意力参数分布存在高度相似性,平均相关性达0.927(接近完全一致的1.0),显著超出模型间正常差异范围,并指向“非独立开发”的可能性。
作者自称是哥斯达黎加大学的韩国学生。他在文中指出,盘古开源代码文件中发现标注“Copyright 2024 The Qwen team, Alibaba Group”,被质疑复制阿里代码时未删除版权声明。
这个哥斯达黎加大学的韩国学生的身份,发的这篇文章,确实很有意思。
然后就是,有自称是华为盘古大模型内部人士的人在上发了一贴,网站在这里:
https://zhuanlan.zhihu.com/p/1925163876938391923
总结一下省流版就是真正干活的人用910训练很辛苦,认认真真做事情。但是总有一些走捷径的人喜欢套壳,并且还忽悠住了领导,让真正做事情的人毫无前途,做无用功。
至于这个帖子里面说的是真是假,我也不知道。
最后,华为诺亚方舟实验室7月5日发布了一个声明, 全文如下:
盘古团队自己的模型部分基础组件代码参考了业界开源实践,涉及其他大模型的部分开源代码都遵循了开源许可证的要求,在开源代码文件中清晰标注出来了。
总而言之,就是确实有参考,而且确实也把参考了的都标注出来了。至于参考的是不是通义千问,标注出来的是不是通义千问的源代码,就没具体说了。
盘古大模型到底是不是套壳了通义千问这个问题,声明并没有直接给出是,或者否的回答。
因此你要问我的话,负责一点回答,我也只能说,我也不知道。
要是大数据,我大概率还能做个自己的判断。到了大模型,那我真的是不懂。隔行如隔山。看不懂才是常态。
但是知乎这篇文章挺有意思的,不管说的是真的,还是假的,其实都挺有意思的。
我说挺有意思的,是这里面的某些关于华为的描述,包括领导的做事方式的描述,还是很有华为那股味道的。
一个从来都没在华为干过的人,要想写出这股味道来,还是颇有难度的。一般人写不出来。
所以,虽然我无法判断真假,但是我想不管真的还是假的,似乎,写这篇文章的人,都是对华为内部很了解的人。
所以这篇文章的内容就很有意思了。
这篇文章里面对昇腾910的描述也同样就很有意思了。有些时候,我们还是要相信华为的硬件研发能力,910毕竟还是国产卡里能打的。
至于是不是套壳,有没有抄袭,这些事情,有的时候不仅仅很难界定边界在哪里,而且也很难界定到底做了还是没做了。
在这个情况下,我觉得不下结论,也是一种态度。
但是,我有个问题一直想问,为什么DeepSeek一开源,DeepSeek团队的论文一公布,连Meta都要连夜组织好几个小组研读,破解,而盘古大模型一开源,我好像没看到这种动向。
可能,这盘古大模型开源以后,全世界的反应,本身,也就代表了一种投票吧。
推荐飞总知识星球,在私域场合里畅所欲言,聊聊职场发展的事情,和飞总提问交流,这么低的价格不会一直保留,机会难得,一定不要错过这个的机会。
股票配资平台查询提示:文章来自网络,不代表本站观点。