华为发布新超节点,徐直军称远超英伟达在华为全联接大会2025上,华为轮值董事长徐

立士说汽车啊 2025-09-19 10:52:17

华为发布新超节点,徐直军称远超英伟达

在华为全联接大会2025上,华为轮值董事长徐直军表示:“华为将在今年四季度推出最强超节点 Atlas 950 SuperPoD,相比英伟达同样在明年下半年上市的NVL144,Atlas950超节点的【规模是它的56.8倍,总算力是它的6.7倍】,内存容量是它的15倍,达到1152TB,互联带宽是其62倍,达到16.3PB/s。”

华为新发布的超节点既可以用于推理,也可以用于超算训练 。

Atlas 950 SuperPoD基于Ascend 950DT芯片打造,Ascend 950DT更注重推理Decode阶段和训练场景,同时也能兼顾推理Prefill阶段的部分需求。从应用场景来看,Atlas 950 SuperPoD可以为人工智能的长期快速发展提供可持续且充裕的算力,无论是千亿参数大模型训练,还是未来万亿乃至10万亿参数大模型,超节点集群都能提供高效稳定的算力支持。

华为Atlas 950 SuperPoD能够超过英伟达NVL144的原因及实现方法主要有以下几点:

芯片技术创新:Ascend 950DT芯片新增支持业界标准的FP8、MXFP4等低精度数据格式,提升了训练效率和推理吞吐。同时,采用创新的新同构设计,支持SIMD/SIMT双编程模型,提升了向量算力,并把内存访问颗粒度从512字节减少到128字节,更好地支持了离散且不连续的内存访问。

自研HBM内存:华为自研了两种HBM内存——HiBL 1.0和HiZQ 2.0,分别针对Prefill推理/推荐场景和Decode/训练场景进行优化。Ascend 950DT采用HiZQ 2.0,使内存容量达到144GB,内存访问带宽达到4TB/s,满足了训练和推理Decode阶段对内存和带宽的高要求。

灵衢互联技术:华为开创了灵衢互联技术,这是面向超节点的互联协议,也是构建算力集群产品最优的互联技术。其创新的UB-Mesh递归直连拓扑网络架构,支持单板内、单板间和机架间的NPU全互联,以64卡为步长按需扩展,最大可实现8192卡无收敛全互联,大大提升了互联带宽,Atlas 950 SuperPoD的互联带宽达到16.3PB/s,是英伟达NVL144的62倍。

大规模集群架构设计:Atlas 950 SuperPoD支持8192张昇腾卡,通过合理的机柜设计和全光互联等技术,实现了大规模算力的高效集成和协同工作,【而英伟达NVL144的卡规模相对较小,仅为Atlas 950 SuperPoD的56.8分之一】,在整体算力规模上存在较大差距。

人工智能华为华为发布会

0 阅读:6

猜你喜欢

立士说汽车啊

立士说汽车啊

感谢大家的关注