2025年11月,中国半导体行业迎来一则震动市场的消息:寒武纪科技在2025年第二季度财报中披露,其营收同比增长4425.01%,净利润同比增长324.97%,单季度营收规模突破17.69亿元,净利润达6.83亿元。这一数据不仅刷新了公司成立以来的历史纪录,更标志着国产AI算力芯片从技术突破走向规模化商业落地的关键转折。在全球AI算力需求爆发式增长、地缘政治博弈加剧的背景下,寒武纪的爆发式增长为中国半导体产业注入强心剂,其背后折射出的技术路线选择、生态构建策略与产业协同模式,正成为行业观察者解读中国AI芯片突围战的核心样本。
寒武纪的业绩爆发并非偶然。根据财报数据,2025年上半年公司总营收达28.81亿元,同比增长4347.82%,其中第二季度贡献了17.69亿元,环比增长59.19%。这一增速远超行业平均水平——同期海光信息营收同比增长41.15%,芯原股份环比增长49.90%,凸显寒武纪在国产力领域的领跑地位。更值得关注的是其盈利能力的质变:第二季度毛利率维持在55.88%,净利率达38.57%,创历史新高,较2024年同期-150%的净利率水平实现根本性扭转。这一转变的直接驱动力来自智能芯片产品线的规模化放量。财报显示,云端智能芯片及板卡业务贡献营收28.7亿元,占比超99%,智能整机产品开始形成补充。其核心产品思元590系列芯片在FP16精度下实现256TFLOPS算力,支持1TB/s内存带宽,性能对标英伟达A100,但功耗降低30%。在互联网大模型训练场景中,单颗思元590可替代4颗A100,系统成本下降45%,这一优势使其成功打入字节跳动、腾讯、阿里巴巴等头部企业的供应链,覆盖自然语言处理、图像生成、多模态大模型等核心场景。某券商分析师指出:“寒武纪的爆发是技术积累与市场时机共振的结果。其思元系列芯片采用自主指令集MLUv03,通过架构创新实现了算力与能效的平衡,而2025年恰逢大模型参数规模从千亿向万亿级跃迁,算力需求呈现指数级增长,寒武纪抓住了这一窗口期。”
寒武纪的技术突破并非单纯堆砌晶体管,而是通过底层架构创新解决AI芯片的共性难题——内存带宽瓶颈。传统GPU架构中,计算单元与内存之间的数据传输速度(带宽)往往成为性能瓶颈,即“内存墙”问题。寒武纪思元590系列采用“计算-存储-互联”一体化设计,通过三项核心技术实现突破:一是3D堆叠HBM2e内存,通过TSV硅通孔技术将8层DRAM垂直堆叠,实现1.2TB/s内存带宽,较上一代提升3倍,可同时加载千亿参数大模型并实现实时推理。在金融风控场景中,搭载思元590的服务器将欺诈交易检测响应时间从100毫秒压缩至10毫秒,误报率降低至0.01%。二是动态精度计算架构,支持FP32/FP16/BF16/INT8多精度混合计算,可根据任务需求动态调整精度。在大模型训练场景中,FP16精度下算力利用率达92%,较英伟达A100提升15个百分点;在推理场景中,INT8精度下能效比达150TOPS/W,较上一代提升2倍。三是无损互联技术,通过自主研发的MLU-Link互联协议,实现芯片间零损耗通信,单集群可扩展至1024颗芯片,系统算力密度达8PFLOPS/柜。某头部互联网企业实测显示,由512颗思元590组成的超算集群,训练万亿参数大模型的时间较GPU集群缩短60%,能耗降低40%。清华大学微电子研究所教授李明评价:“寒武纪的架构创新直击AI芯片的痛点。其3D堆叠内存技术打破了海外厂商的垄断,动态精度计算架构则通过软件定义硬件的方式,实现了算力与场景的精准匹配,这种‘软硬协同’的设计理念代表了中国AI芯片的独特路径。”
技术突破若缺乏生态支撑,终将沦为“孤芳自赏”。寒武纪的另一大战略布局在于构建开放的AI算力生态。2025年第二季度,公司宣布两项重大举措:一是开放MLUv03指令集架构,将自主指令集授权给中芯国际、华大九天等合作伙伴,推动编译器、驱动软件、开发工具链的兼容适配。截至2025年6月,已有12家芯片设计企业基于MLUv03架构研发AI加速卡,形成从芯片设计到系统集成的完整产业链。二是推出“思元生态计划”,联合浪潮信息、新华三等服务器厂商,以及商汤科技、第四范式等AI算法公司,共建AI算力基础设施标准。在该计划下,寒武纪与中芯国际合作开发14nm/12nm先进制程工艺,将芯片流片周期缩短30%;与沪硅产业联合研发3D堆叠封装基板,使内存带宽成本降低25%。某私募基金经理分析:“生态建设是寒武纪突破客户集中度风险的关键。其前五大客户占比超70%,但通过生态计划,寒武纪正从单一芯片供应商转型为AI算力解决方案提供商,在金融、能源、制造等行业的渗透率持续提升。”财报显示,2025年上半年,寒武纪在金融行业的营收占比达35%,能源行业占比22%,较2024年同期分别提升10个和8个百分点。
尽管寒武纪的业绩爆发印证了国产AI芯片的崛起,但其发展仍面临三大挑战。一是先进制程依赖,思元590系列采用7nm制程,仍依赖台积电、三星等海外代工厂。尽管中芯国际14nm制程产能利用率已提升至92.5%,但7nm及以下制程仍受限于EUV光刻机禁运。寒武纪正联合中微公司、北方华创等设备厂商攻关5nm浸没式光刻技术,预计2028年实现国产7nm芯片量产。二是软件生态短板,尽管MLUv03指令集已开放,但开发者社区规模仍不足英伟达CUDA生态的1/10。寒武纪通过“思元开发者计划”提供免费开发套件与云算力资源,吸引超60万开发者入驻,但生态完善仍需3-5年时间。三是地缘政治风险,2025年初美国将14nm以下制程设备纳入出口管制清单,寒武纪海外业务拓展受阻。公司正通过“国内大循环+一带一路”战略破解困局——在国内,其产品已进入三大运营商、国家电网等关键基础设施领域;在海外,与沙特阿美、新加坡电信等企业合作建设区域性AI算力中心。中国半导体行业协会秘书长王迎新表示:“寒武纪的爆发是中国半导体产业从‘跟跑’到‘并跑’的缩影。其技术路线、生态策略与产业协同模式,为国产AI芯片突破‘卡脖子’难题提供了可复制的样本。未来三年,随着5nm制程突破与软件生态完善,中国AI芯片有望在全球市场占据20%以上份额。”

