中信证券：华为昇腾军团震撼登场，国产算力突围在即

每日速览2025年09月20日 00:50消息，中信证券指出，华为昇腾军团亮相，标志着国产算力加速突破，有望引领自主可控新机遇。

　　 2025年9月18日，华为在全联接大会2025上正式发布昇腾AI计算未来发展路线图，引发业界高度关注。轮值董事长徐直军现场披露了涵盖芯片、超节点系统及通算架构的全面布局，标志着国产算力正加速迈向高端化、规模化与自主可控的新阶段。

　　此次发布的昇腾Roadmap显示，在2025年第一季度已推出昇腾910C的基础上，华为将持续推进产品迭代：计划于2026年第一季度和第四季度分别推出昇腾950PR与950DT芯片，并于2027年第四季度、2028年第四季度陆续发布昇腾960和970芯片。这一“每年一更”的节奏展现出华为在AI芯片领域前所未有的研发强度和技术自信。值得注意的是，950系列首次细分为Prefill & Recommendation（PR）和Decode & Training（DT）两个版本，顺应当前大模型推理中PD分离的主流设计趋势，体现了华为对AI工作负载精细化优化的深入理解。

　　与此同时，华为在大规模AI基础设施方面的布局也全面提速。继Atlas 900 A3 SuperPoD（CloudMatrix 384超节点）之后，公司正在开发Atlas 950 SuperCluster和Atlas 960 SuperCluster等新一代超节点集群系统，分别支持8192卡和15488卡规模，预计将于2027年第四季度和2028年第四季度上市。这些系统级产品的演进不仅意味着算力密度的跃升，更代表着中国企业在构建百万卡级别AI训练集群能力上的实质性突破。

　　尤为引人注目的是，华为同步推进通用计算领域的升级路径。鲲鹏950和960芯片已明确规划，预计分别于2026年第四季度和2028年第一季度上市，旨在支撑更大规模核数、更高性能的通用服务器需求。此外，华为还推出了全球首个通算超节点解决方案，最大支持16节点互联、内存容量高达48TB，预计2026年第一季度面市。这一体系化布局表明，华为正在以“通算+智算”双轮驱动的方式重构中国数字基础设施底座。

　　从技术路线来看，华为昇腾系列正经历一场深刻的架构变革。自2026年Q1发布的950 PR起，其芯片架构将由传统的SIMD模式转向SIMD/SIMT混合架构，即从专用NPU向更接近GPGPU的通用并行计算架构演进。这种转变不仅是对英伟达CUDA生态主导地位的技术回应，更是对中国AI应用场景多样化、复杂化趋势的战略适配。可以预见，随着架构灵活性提升，昇腾平台在多模态、强化学习等前沿领域的适用性将进一步增强。

　　存储方面，华为展现出强大的自研能力。昇腾950PR和950DT将分别搭载自研的HiBL 1.0和HiZQ 2.0高带宽内存（HBM），内存带宽分别达到1.6TB/s和4.0TB/s；而后续的960和970型号更将带宽推升至9.6TB/s和14.4TB/s，逼近甚至部分超越当前国际主流产品如NVIDIA H20（4.8TB/s）和GB200（16TB/s）的水平。这一进展意义重大——长期以来，HBM作为AI芯片的核心瓶颈之一，严重依赖海外供应链。华为通过自研实现突围，或将带动国内HBM产业链加速成熟，打破“卡脖子”困局。

　　在系统互联层面，华为提出“灵衢（UnifiedBus）”这一面向超节点的新型互联协议，致力于解决万卡级以上集群中的通信延迟与能效难题。当前，全球范围内真正具备稳定运行数十万乃至百万卡规模AI集群能力的企业屈指可数。华为从单芯片到超节点再到SuperCluster的全栈布局，配合统一互联协议的创新，有望成为中国建设国家级AI算力网络的关键支点。

　　必须指出的是，尽管路线图宏伟清晰，但实现路径仍面临多重挑战。先进制程产能是否足以支撑大规模量产？自研HBM能否快速实现良率爬坡与成本控制？地缘政治环境下关键设备与材料的获取是否可持续？这些都是悬而未决的风险点。然而不可否认的是，华为此次发布的昇腾Roadmap，已经不仅仅是企业层面的产品规划，而是上升为国家战略科技力量自主可控的重要体现。

　　总体而言，华为通过此次全联接大会释放出强烈信号：中国AI算力的发展不再只是“追赶者”，而正在成为“定义者”。从芯片架构变革到系统级超节点建设，从通算智算融合到自研存储突破，一个完整的国产算力生态正在成型。我们有理由相信，在政策支持、产业协同与技术创新三重动力下，国产算力将在未来几年迎来爆发式增长，并在全球AI竞争格局中占据更加主动的位置。