2026年3月2日,世界移动通信大会(MWC2026)上,华为正式发布Atlas 950 SuperPoD与TaiShan 950 SuperPoD两大超节点产品,首次将国产算力集群推向全球舞台。这两款产品以8192颗昇腾NPU芯片为核心,算力规模达8 EFLOPS(FP8精度),内存容量1152TB,互联带宽16.3PB/s,多项指标超越英伟达同期产品,成为应对万亿级AI大模型训练的核心算力底座。 华为此次突破的核心在于系统级创新:通过自研“灵衢”全光互联协议、模块化架构设计及多精度算力动态调节技术,解决了传统集群“规模越大效率越低”的行业痛点,为金融、医疗、智能制造等场景提供高实时性、低时延的算力支持。
技术突破:国产算力如何“以量变引质变”? 架构革命:打破CPU中心桎梏 Atlas 950采用全平等互联架构,CPU、NPU、内存单元直接交互,通信效率提升30%,训练中断率降低90%。 内存池化:1152TB资源“零迁移”调用 内存统一编址技术让跨节点数据调取速度提升10倍,支撑万亿参数大模型训练。 能耗挑战:单卡性能追赶,集群规模制胜 昇腾950DT芯片虽受限于制程(等效5nm),但通过8192卡集群实现算力跃升,功耗达英伟达方案的4.1倍,凸显国产替代的规模优势。
华为昇腾超节点的海外亮相,不仅是技术突破,更是国产算力生态全球化的宣言。从芯片到服务器,从散热到软件,A股产业链公司已形成完整闭环。在AI算力需求爆发与国产替代的双重驱动下,这些企业或将书写新的增长传奇。 举


