每日速览2025年09月20日 00:50消息,中信证券指出,华为昇腾军团亮相,标志着国产算力加速突破,有望引领自主可控新机遇。
2025年9月18日,华为在全联接大会2025上正式发布昇腾AI计算未来发展路线图,引发业界高度关注。轮值董事长徐直军现场披露了涵盖芯片、超节点系统及通算架构的全面布局,标志着国产算力正加速迈向高端化、规模化与自主可控的新阶段。
此次发布的昇腾Roadmap显示,在2025年第一季度已推出昇腾910C的基础上,华为将持续推进产品迭代:计划于2026年第一季度和第四季度分别推出昇腾950PR与950DT芯片,并于2027年第四季度、2028年第四季度陆续发布昇腾960和970芯片。这一“每年一更”的节奏展现出华为在AI芯片领域前所未有的研发强度和技术自信。值得注意的是,950系列首次细分为Prefill & Recommendation(PR)和Decode & Training(DT)两个版本,顺应当前大模型推理中PD分离的主流设计趋势,体现了华为对AI工作负载精细化优化的深入理解。
与此同时,华为在大规模AI基础设施方面的布局也全面提速。继Atlas 900 A3 SuperPoD(CloudMatrix 384超节点)之后,公司正在开发Atlas 950 SuperCluster和Atlas 960 SuperCluster等新一代超节点集群系统,分别支持8192卡和15488卡规模,预计将于2027年第四季度和2028年第四季度上市。这些系统级产品的演进不仅意味着算力密度的跃升,更代表着中国企业在构建百万卡级别AI训练集群能力上的实质性突破。
尤为引人注目的是,华为同步推进通用计算领域的升级路径。鲲鹏950和960芯片已明确规划,预计分别于2026年第四季度和2028年第一季度上市,旨在支撑更大规模核数、更高性能的通用服务器需求。此外,华为还推出了全球首个通算超节点解决方案,最大支持16节点互联、内存容量高达48TB,预计2026年第一季度面市。这一体系化布局表明,华为正在以“通算+智算”双轮驱动的方式重构中国数字基础设施底座。
从技术路线来看,华为昇腾系列正经历一场深刻的架构变革。自2026年Q1发布的950 PR起,其芯片架构将由传统的SIMD模式转向SIMD/SIMT混合架构,即从专用NPU向更接近GPGPU的通用并行计算架构演进。这种转变不仅是对英伟达CUDA生态主导地位的技术回应,更是对中国AI应用场景多样化、复杂化趋势的战略适配。可以预见,随着架构灵活性提升,昇腾平台在多模态、强化学习等前沿领域的适用性将进一步增强。
存储方面,华为展现出强大的自研能力。昇腾950PR和950DT将分别搭载自研的HiBL 1.0和HiZQ 2.0高带宽内存(HBM),内存带宽分别达到1.6TB/s和4.0TB/s;而后续的960和970型号更将带宽推升至9.6TB/s和14.4TB/s,逼近甚至部分超越当前国际主流产品如NVIDIA H20(4.8TB/s)和GB200(16TB/s)的水平。这一进展意义重大——长期以来,HBM作为AI芯片的核心瓶颈之一,严重依赖海外供应链。华为通过自研实现突围,或将带动国内HBM产业链加速成熟,打破“卡脖子”困局。
在系统互联层面,华为提出“灵衢(UnifiedBus)”这一面向超节点的新型互联协议,致力于解决万卡级以上集群中的通信延迟与能效难题。当前,全球范围内真正具备稳定运行数十万乃至百万卡规模AI集群能力的企业屈指可数。华为从单芯片到超节点再到SuperCluster的全栈布局,配合统一互联协议的创新,有望成为中国建设国家级AI算力网络的关键支点。
必须指出的是,尽管路线图宏伟清晰,但实现路径仍面临多重挑战。先进制程产能是否足以支撑大规模量产?自研HBM能否快速实现良率爬坡与成本控制?地缘政治环境下关键设备与材料的获取是否可持续?这些都是悬而未决的风险点。然而不可否认的是,华为此次发布的昇腾Roadmap,已经不仅仅是企业层面的产品规划,而是上升为国家战略科技力量自主可控的重要体现。
总体而言,华为通过此次全联接大会释放出强烈信号:中国AI算力的发展不再只是“追赶者”,而正在成为“定义者”。从芯片架构变革到系统级超节点建设,从通算智算融合到自研存储突破,一个完整的国产算力生态正在成型。我们有理由相信,在政策支持、产业协同与技术创新三重动力下,国产算力将在未来几年迎来爆发式增长,并在全球AI竞争格局中占据更加主动的位置。