华为最近因大模型开源事件陷入舆论风波。6月30日,华为高调宣布开源自主研发的"盘古ProMoE"大模型核心组件,包含70亿参数的基础版和720亿参数的高配版,称这是构建其昇腾AI生态的重要一步。
但仅过四天,GitHub上一项技术分析称开发者通过"AI模型指纹识别"技术发现,华为该模型与阿里云之前开源的"通义千问Qwen-2.514B"模型存在极高相似性——注意力机制参数分布重合度达0.927(完全一致为1.0),远超行业0.7以下的正常差异值。
面对质疑,华为诺亚方舟实验室7月5日回应称盘古ProMoE是基于自研昇腾硬件平台开发的基础模型,绝非改自其他厂商模型。同时承认部分代码实现参考了业界开源项目,并严格标注了版权信息,强调"符合开源协作精神"。

但剧情在7月6日凌晨反转,自称盘古团队员工的爆料者发文称,项目初期因算力资源严重不足,团队在领导压力下选择"走捷径"——先套用阿里通义千问1.5版的1100亿参数模型进行续训(继续训练),通过增加网络层数、扩展部分模块维度,并加入盘古论文中的技术机制,将参数扩充至1350亿;为掩盖来源,甚至故意用垃圾数据"洗掉"原模型特征。更惊人的是,该员工称团队还套用过另一家公司的DeepSeek-V3模型进行训练。
这位爆料者表示,因无法忍受"造假换成绩"的做法选择离职并公开内幕。
目前华为官方尚未对此最新指控作出回应,事件仍在持续发酵。
1. 产业“卡脖子”下的艰难跋涉
我认为这种“抄袭”或“没抄袭”的二元对立标签,远远不足以概括这场风波的复杂本质,也忽略了华为乃至整个中国AI产业所面临的残酷现实困境。
首先,我们得理解现代AI模型是怎么“长大”的。
你要训练一个超级聪明的“大脑”,就需要给它“喂”海量的数据,进行天文数字级别的运算。这过程极其昂贵耗时,动辄需要成千上万块顶级AI芯片跑上几个月甚至更久。
因此,整个AI行业,尤其是开源的圈子,有一个非常普遍且实用的做法,叫做“续训(ContinualPre-training)”。这就像是:你发现隔壁老王家有个训练得非常不错的“大脑基础版”(比如阿里开源的“通义千问”或者DeepSeek-V3),这个基础版已经学了很多通用知识,理解语言的能力很强。
你拿到这个基础版,不是为了直接冒充自己的,而是把它当作一个高起点,然后,你再给它“喂”更多自己特有的数据(比如华为积累的通信、工程、行业知识),或者按照自己的想法对它进行改造升级——比如增加更多的“思考模块”(网络层),扩展某些“功能区域”(模块维度),甚至加入自己研究出来的独特“思考技巧”(如盘古论文中的技术机制),最终把它变成一个更强大、更符合自己需求的“大脑”,比如这次争议中的1350亿参数“盘古ProMoE”。
这种做法本身,在技术圈子里不仅常见,而且是被鼓励的“站在巨人肩膀上”的智慧,它极大地节省了从头开始训练所需的巨额算力和时间成本。
问题的关键根本不在于“华为有没有用别人的模型作为起点”,而在于两点:一是透明度——你有没有清晰、诚实地告诉大家,“我是基于谁的基础,做了哪些改造和创新”?二是规矩——你有没有严格遵守别人开源时定下的使用规则(开源协议),该标注的版权信息标注清楚了吗?
华为在回应中说“参考了业界开源项目并严格标注了版权信息”,这个方向是对的,这也是开源精神的基石之一。现在争议的焦点在于,华为的披露是否足够清晰、完整,让大家能理解这个“大脑”的血缘和改造过程。
那么,为什么华为(以及爆料中提到的“走捷径”)会选择这么做?这就触及了中国AI产业最痛的缺陷——算力卡脖子。
爆料者直言不讳地指出,核心原因就是“算力资源严重不足”。这是华为一家之痛吗?不!这是整个中国AI产业在美西方严厉技术封锁下的集体难题!
我们造不出或者说很难量产最先进的AI芯片(比如NVIDIA的顶级型号),也买不到足够多。华为自己研发的昇腾芯片,正是为了突破这层铁幕,是在“无中生有”地搭建我们自己的算力地基。
但在最尖端的超大规模模型训练领域,我们与国际顶尖水平在绝对算力规模、效率和先进芯片供应上,差距依然巨大且被刻意限制。
对手开着跑车在高速公路上飞驰,而华为和它的中国同行们,很多时候是在用自己刚刚组装好的、性能还在追赶中的国产发动机(昇腾),拉着同样沉重的货物(训练大模型),艰难地爬坡。
在这种系统性、战略性的算力困境下,要求华为完全从零开始,不借助任何现有的、高质量的开源基础,去训练一个1350亿参数的顶尖模型,无异于要求它在戴着沉重镣铐的情况下,还要在百米赛跑中夺冠。
这不现实,也不经济。
利用现有的、优秀的开源模型作为“火种”进行续训、改造和升级,是在严酷封锁下追求效率最大化的“无奈之举”,更是生存和发展的“现实策略”。
在指责华为“可能操作不当”甚至“造假”时,我们必须充分理解这个沉重得令人窒息的产业大背景。这不是为不当行为开脱,而是理解其发生的深层土壤。
看待华为这次开源事件,绝不能只盯着那个模型本身是不是“纯原创”。
华为真正的野心和核心价值,远在一个模型之上。
它开源“盘古ProMoE”的核心目的,也不仅仅是炫耀一个参数巨大的模型,它的战略核心是推广“昇腾”这个国产AI硬件平台及其配套的软件框架(如MindSpore)。
你可以把昇腾平台想象成未来中国AI世界的“地基”和“高速公路网”。华为开源一个强大的、能在昇腾上跑得又快又好的模型(哪怕它的“初始智力”借鉴了开源成果),就像是在新修的高速公路旁,免费赠送了一辆性能不错的示范车。
这极大地降低了开发者、研究机构、企业尝试使用昇腾平台的门槛——他们不用自己从头造车(训练基础大模型),可以先开这辆“示范车”上路,体验“高速公路”(昇腾平台)的性能,进而基于它开发自己的应用(各种AI产品和服务)。
华为的目标,是打造一个从最底层的芯片(昇腾),到操作系统/框架(MindSpore等),再到上层应用模型,最后到实际应用场景的、完全自主可控的国产AI全栈能力,这是打破封锁、构建中国AI未来的“根技术”体系。
在这个宏大战略面前,“盘古ProMoE”模型本身,更重要的角色是吸引大家进入昇腾生态的“引子”和“敲门砖”。华为投入巨资研发昇腾芯片和平台,这份决心和其对中国科技自主的战略价值,毋庸置疑。
再者,即使“盘古ProMoE”的初始参数并非完全从零开始,华为团队展现的工程能力也绝对值得称道,这正是昇腾生态最需要的证明。
把一个可能是基于阿里或DeepSeek的“大脑基础版”,成功改造成参数膨胀到1350亿的“巨脑”,并且让它能在华为自研的昇腾芯片上稳定、高效地运行起来,特别是采用了更复杂的“专家混合”(MoE)架构(可以理解为让模型的不同部分专注不同任务,需要高超的协调能力),这本身就是一个地狱级的工程挑战和技术壮举!
这证明了什么?它铁一般地证明了:昇腾平台,完全有能力承载和运行当前最前沿的超大规模AI模型!这才是对华为构建昇腾生态最硬核、最有价值的贡献。华为在大规模模型的工程化落地、与自家硬件的深度适配优化、超大规模分布式训练系统的稳定运行等方面的深厚积累,是其在这场AI竞赛中真正的核心竞争力之一。
这份能力,是买不来也抄不走的。
2. 开源的“勇”与“痛”
在当下这个各国科技竞争白热化、技术壁垒高筑的时代,华为选择如此“高调”地开源一个承载着突破封锁期望的“明星项目”,就像把一件珍宝放在聚光灯最亮的舞台中央。
聚光灯能展现它的璀璨,但也会让任何一点微小的瑕疵都暴露无遗、被无限放大。
尤其是在当前异常敏感的国际科技博弈环境,以及国内大模型“百模大战”的激烈竞争格局下,华为其实主动把自己推到了一个“显微镜”之下。
所有人都瞪大了眼睛在看:华为自研的实力究竟如何?昇腾生态的基石是否足够坚实?
这份“高调”的宣传,无形中拉高了所有人的心理预期——大家期待看到一个真正震撼的、代表中国顶尖原创力的里程碑。
结果呢?几天后爆出的“模型高度相似”质疑,就像一盆冷水浇下,巨大的期望和可能存在的现实落差(无论是因为操作瑕疵还是沟通不足),瞬间点燃了舆论的熊熊烈火。
开源的“勇气”,在放大镜效应下,转化成了巨大的舆论“压力”。这份压力,又何尝不是华为拥抱开源时必须承受的“成年礼”?
华为在风波初期的回应里提到“参考了业界开源项目并严格标注了版权信息”,表示这“符合开源协作精神”。这个表态的方向是对的,守住了开源的“底线”——承认借鉴,尊重版权。
但这次事件暴露出,在涉及像大模型这种核心、复杂、且传承关系影响重大的项目时,业界和开发者社区期待的,远不止于守住底线。大家需要的是更高的“透明度”标准。这不仅仅是贴个“参考了XX”的标签那么简单。开发者们渴望知道的是更清晰、更完整的“模型家谱”:
“父辈”是谁?到底基于哪个或哪些具体的开源模型作为起点?
“成长”历程如何?做了哪些关键的手术(修改)?是微调、大改、还是结构性重组(比如扩展成MoE)?
“新基因”是什么?华为自己真正注入的、独特的创新点和技术贡献在哪里?
未来的华为,需要在开源这件事上,建立起一套更严格、更透明、更主动的“模型血统声明”机制。
就像食品包装上清晰列明原料产地和添加剂一样,把模型的“前世今生”在阳光下摊开来讲清楚。
真正的“符合开源精神”,不仅仅是“允许你用”,更要做到“让你看得明白、用得放心”。只有做到这种“阳光下的协作”,才能重建并巩固开发者社区的信任,让开源真正成为昇腾生态壮大的助推器,而不是随时可能引爆的信任危机。
3. 怎么打这场仗?
信任是开源社区的空气,一旦被污染,呼吸都变得困难。开发者们会疑虑:华为的开源项目,还能不能放心地用、安心地学?这份信任的损伤,对华为构建昇腾生态的宏伟蓝图,其潜在的杀伤力可能远超一个模型的得失。
因此,对华为而言,当务之急不再是技术辩白,而是一场必须赢下的“信任重建攻坚战”。
怎么打这场仗?我认为,华为可以做三个关键动作:
第一,是直面阳光,彻底“晒”真相。华为需要拿出壮士断腕的勇气,组织真正独立、透明、彻底的调查,不是关起门来,而是把“盘古ProMoE”这个“孩子”的“出生证明”和“成长记录”摊在阳光下,清晰、详细、无保留地说明:这个模型在孕育过程中,到底“吃”了哪些“营养基”(具体是哪些上游开源模型)?经历了哪些关键的“手术”和“改造”(做了哪些修改、扩展、创新)?整个过程中,有没有“营养师”(开源协议)的叮嘱被忽略或违背?唯有这种级别的坦诚,才能驱散猜疑的迷雾,为重建信任打下第一块基石。发布一份详尽的、经得起技术同行推敲的“模型技术白皮书与研发历程报告”,是迈出这一步最有力的姿态。
第二,是立好规矩,筑牢“防火墙”。亡羊补牢,为时未晚。这次事件暴露了华为在开源项目管理和合规审查上可能存在流程漏洞或标准模糊。华为亟需立即着手,建立一套业界领先的、铁一般的“开源治理”新标准。这意味着:
成立更权威、更独立的“开源合规办公室”,对所有重大开源项目进行“合规体检”,像过筛子一样检查其传承关系披露是否充分、彻底。
制定比行业通用要求更严格、更透明的“模型血统声明规范”。未来任何开源模型,都必须附带一份清晰易懂的“家谱说明书”——谁是“祖宗”?谁是“近亲”?“我”做了哪些独创性贡献?一目了然。
将技术伦理审查深度嵌入研发流程,确保任何可能涉及“模糊来源”、“规避协议”的操作,在萌芽阶段就被有效拦截。目标是让未来的每一个华为开源项目,都成为透明、合规、可信赖的代名词。
第三,要回归核心,亮出“真肌肉”。说到底,开发者们最关心的是什么?是昇腾平台到底好不好用、强不强、值不值得投入!无论“盘古ProMoE”的来历有多少争议,华为团队能把它成功改造、优化,并稳定运行在自家昇腾芯片上,尤其是实现了复杂的MoE架构,这本身就硬核证明了昇腾平台具备驾驭超大规模模型的强悍实力——这份工程能力是实打实的金子!
华为现在最应该做的,是集中火力,持续投入,把昇腾这块“地基”打得无比扎实。用无可辩驳的数据和案例证明在昇腾上训练模型就是快,运行推理就是省,部署应用就是稳!让开发者真切感受到选择昇腾,是选择了一条高效、开放、有未来的技术路径。
这才是吸引生态伙伴、赢得市场口碑的终极王道。与其在模型的“出身”上纠缠,不如用昇腾的卓越性能和开放生态,让质疑者闭嘴,让支持者更坚定。
所以,我是坚定支持华为的战略大方向的!
具体是支持什么呢?首先是我毫无保留地支持华为倾力构建昇腾AI生态、用自研芯片和软件框架突破算力封锁、打造从芯到云、自主可控的国产AI全栈能力的宏大战略!这是关乎中国科技能否在关键领域挺直腰杆的国家工程。在这个战场上,华为是冲锋陷阵、无可替代的主力军和扛旗者,其战略定力和长期投入,值得最高的敬意和支持。
但我也坚决反对在这次事件中暴露出的、任何形式的试图刻意掩盖技术传承、可能违背开源协议精神的“洗特征”等具体操作!理解“算力卡脖子”下追求效率的无奈,但绝不认同损害技术诚信和开源信任的手段。
这些做法如同为解一时之渴而饮鸩,伤害的是比算力更稀缺、更宝贵的“信誉”资产和“信任”生态,得不偿失!
这次事件,无疑是从内部的风波里,迫使华为停下疾驰的脚步,深刻反思:在追求技术高地的征途上,严谨、透明、诚信不是可以牺牲的配重,而是必须系紧的安全带。
华为其实完全有能力,更有责任,将这次教训转化为自我革新、迈向更高标准的动力。
前有技术高山的险峻,后有封锁围堵的寒风,华为作为攀登者之一,其战略方向代表着中国科技自立自强的希望之光。一时的风雨,不应模糊我们对其使命价值的认可。
是支持华为,也是支持这条艰难却必须走通的自研之路。
本文作者 | 东叔
审校 | 童任
配图/封面来源 | 网络
编辑/出品 | 东针-知识频道(未经允许,禁止转载)