在华为全联接大会2025上 ,华为轮值董事长徐直军分享了昇腾芯片的规划路线,并推出全球最强超节点和集群 。
他透露,未来三年 ,直至2028年,华为开发和规划了三个系列,分别是Ascend(昇腾)950系列 ,包括两颗芯片:Ascend950PR和Ascend 950DT,以及Ascend 960 、Ascend 970系列,更多具体芯片还在规划中。
结合已经推出或正在研发中的昇腾芯片 ,华为将带来更多超节点和集群产品。包括Atlas 950超节点和Atlas 960超节点,分别支持8192张和15488张的昇腾卡 。并将在2027年第四季度,基于Atlas 960超节点同步推出Atlas 960 SuperCluster,集群规模提升到百万卡级。
以下为徐直军针对昇腾芯片、超节点和集群的演讲内容 ,经过《科创板日报》删减和整理:
算力的基础是芯片,昇腾芯片是华为AI算力战略的基础。未来3年,至2028年 ,我们在开发和规划了三个系列,分别是Ascend 950系列,包括两颗芯片:Ascend 950PR和Ascend 950DT ,以及Ascend 960、Ascend 970系列,更多具体芯片还在规划中 。
目前正在开发 、且即将推出的芯片叫Ascend 950系列,包括Ascend 950 PR和Ascend 950 DT。
与前一代昇腾芯片相比 ,Ascend 950 在以下几个方面实现了根本性提升。
第一,新增支持业界标准FP8/MXFP8/MXFP4等低数值精度数据格式,算力分别达到1P和2P ,提升训练效率和推理吞吐 。并特别支持华为自研的HiF8,在保持FP8的高效的同时,精度非常接近FP16。
第二,大幅度提升了向量算力。这主要通过三个方面实现:其一 ,提升向量算力占比;其二,采用创新的新同构设计,即支持 SIMD/SIMT 双编程模型 ,SIMD能够像流水线一样处理“大块”向量,而SIMT便于灵活处理“碎片化 ”数据;其三,把内存访问颗粒度从512字节减少到128字节 ,内存访问更精细,从而更好地支持了离散且不连续的内存访问。
第三,互联带宽相比Ascend 910C提升了2.5倍 ,达到2TB/s 。
第四,结合推理不同阶段对于算力、内存、访存带宽及推荐 、训练的需求不同,我们自研了两种HBM ,分别是:HiBL 1.0和HiZQ 2.0。不同的自研HBM与Ascend 950 Die合封,分别构成芯片Ascend 950PR:面向Prefill和推荐场景,以及Ascend 950DT:面向Decode和训练场景。
其中,Ascend 950PR主要面向推理Prefill阶段和推荐业务场景 ,将在2026年一季度推出,首先支持的产品形态是标卡和超节点服务器 。
而Ascend 950DT,更注重推理Decode阶段和训练场景。由于推理Decode阶段和训练对互联带宽和访存带宽要求高 ,华为开发了HiZQ 2.0,使内存容量达到144GB,内存访问带宽达到4TB/s。同时把互联带宽提升到了2TB/s 。其次 ,支持了FP8/MXFP8/MXFP4/HiF8数据格式。Ascend 950DT 将在2026年Q4推出。
第三颗是在规划中的芯片Ascend 960,在算力、内存访问带宽、内存容量 、互联端口数等各种规格上相比Ascend 950翻倍,大幅度提升训练、推理等场景的性能;同时还支持华为自研的HiF4数据格式 。它是目前业界最优的4bit精度实现 ,能进一步提升推理吞吐,并且比业界FP4方案的推理精度更优。Ascend 960将在2027年四季度推出。
最后一颗是在规划中的Ascend 970,这颗芯片的一些规格还在讨论中 。总体方向是 ,在各项指标上大幅度升级,全面升级训练和推理性能。目前的初步考虑是,相比Ascend 960,Ascend 970的FP4算力、FP8算力、互联带宽要全面翻倍 ,内存访问带宽至少增加1.5倍。Ascend 970计划在2028年四季度推出。
总体上,我们将以几乎一年一代算力翻倍的速度,同时围绕更易用 ,更多数据格式 、更高带宽等方向持续演进,持续满足AI算力不断增长的需求 。
可以看到,相比Ascend 910B/910C ,从Ascend 950开始的主要变化包括:
引入SIMD/SIMT新同构,提升编程易用性;
支持更加丰富的数据格式,包括FP32 /HF32 /FP16/BF16/FP8/MXFP8/HiF8/MXFP4/HiF4等;
支持更大的互联带宽 ,其中950系列为2TB/s,970系列提升到4TB/s;
支持更大的算力,FP8算力从950系列的1 PFLOPS提升到960的2 PFLOPS、970的4 PFLOPS;FP4算力从950的2 PFLOPS提升到960的4 PFLOPS、970的8 PFLOPS;
内存容量逐渐加倍 ,而内存访问带宽将翻两番。
从大型AI算力基础设施建设的技术方向看,超节点已经成为主导性产品形态,并正在成为AI基础设施建设的新常态。超节点事实上就是一台能学习 、思考、推理的计算机,物理上由多台机器组成 ,但逻辑上以一台机器学习、思考 、推理 。
今年3月份,华为正式推出了Atlas 900超节点,满配支持384卡 ,最大算力可达300 PFLOPS。CloudMatrix384超节点,则是华为云基于Atlas 900超节点构建的云服务实例。Atlas 900超节点自上市以来,已经累计部署超过300套 ,服务20多个客户,涵盖互联网、电信、制造等多个行业 。
结合已经推出或正在研发中的昇腾芯片,将带来更多超节点和集群产品。今天发布的第一款产品——Atlas 950超节点 ,是基于Ascend 950DT打造。
Atlas 950超节点支持8192张基于Ascend 950DT的昇腾卡,是Atlas 900超节点的20多倍,我们习惯称呼的昇腾卡 ,每张卡对应一颗Ascend 950DT芯片,8192张昇腾卡等同于8192颗Ascend 950DT芯片 。
Atlas 950超节点满配包括由128个计算柜 、32个互联柜,共计160个机柜组成,占地面积1000平方米左右 ,柜间采用全光互联。总算力大幅度提升,其中,FP8算力达到8E FLOPS ,FP4算力达到16E FLOPS。互联带宽达到16PB/s,这个数字意味着,Atlas 950一个产品的总互联带宽 ,已经超过今天全球互联网峰值带宽的10倍有余 。
Atlas 950超节点的上市时间是:2026年四季度。
我们很自豪的看到,Atlas 950超节点,至少在未来多年都将保持是全球最强算力的超节点 ,并且在各项主要能力上都远超业界主要产品。其中,相比英伟达同样将在明年下半年上市的NVL144,Atlas 950超节点卡的规模是其56.8倍 ,总算力是其6.7倍,内存容量是其15倍,达到1152TB;互联带宽是其62倍,达到16.3PB/s。即使是与英伟达计划2027年上市的 NVL576相比 ,Atlas 950超节点在各方面依然是领先的 。
算力、内存容量、内存访问速度 、互联带宽等能力的大幅度增强,为大模型训练性能和推理吞吐带来显著提升。相比华为已经推出的Atlas 900超节点,Atlas 950超节点的训练性能提升17倍 ,达到4.91M TPS。通过支持FP4数据格式,Atlas 950超节点的推理性能提升达26.5倍,达到19.6M TPS 。
8192卡超节点并不是终点。今天发布的第二款超节点产品Atlas 960超节点 ,其基于Ascend 960,最大可支持15488卡。Atlas 960超节点由176个计算柜,44个互联柜 ,共220个机柜,占地面积约2200平方米 。
Atlas 960超节点的上市时间是:2027年四季度。
基于Ascend 960,Atlas 960超节点总算力、内存容量、互联带宽在Atlas 950基础上再翻倍。其中 ,FP8总算力将达到30E FLOPS,而FP4总算力将达到60 EFLOPS;内存容量达到4460TB,互联带宽达到34PB/s 。大模型训练和推理的性能相比Atlas 950超节点,将分别提升3倍和4倍以上 ,达到15.9M TPS 和80.5M TPS。
在通用计算领域,我们同样认为,超节点技术能够带来很大的价值。TaiShan 950超节点 ,基于Kunpeng 950打造,全球首个通用计算超节点,其最大支持16节点 ,32个处理器,最大内存48TB,同时支持内存、SSD 、DPU池化 。
超节点的价值 ,不仅仅体现在智算和通算传统业务领域。互联网产业广泛应用的推荐系统,正在从传统推荐算法向生成式推荐系统演进。我们可以基于TaiShan 950和Atlas 950打造成混合超节点,为下一代生成式推荐系统打开全新架构方向。
一方面 ,通过超大带宽、超低时延互联以及超大内存,混合超节点构成超大共享内存池,支持PB级推荐系统嵌入表,从而支撑超高维度用户特征;另一方面 ,混合超节点的超大AI算力,能够支持超低时延推理和特征检索 。因此,混合超节点是面向下一代生成式推荐系统的解决方案的全新选择。
为了达成Atlas 950/960超节点对互联的技术要求 ,为了实现万卡超节点还能是一台计算机,华为开创了超节点架构并开创了新型的互联协议,能够支撑万卡级超节点架构。基于这个互联协议的超节点架构的核心价值主张是:万卡超节点 ,一台计算机,也就是说,通过该互联协议 ,把数万规模的计算卡,联接成一个超节点,能够像一台计算机一样工作、学习 、思考、推理 。
万卡级超节点架构应该具备6大特征 ,分别是总线级互联、平等协同 、全量池化、协议归一、大规模组网 、高可用性。我们为这个面向超节点的新型互联协议取名“灵衢”,英文名称:UB,UnifiedBus。今天,我们正式发布灵衢UnifiedBus ,一个面向超节点的互联协议 。
同时,华为将开放灵衢2.0技术规范,欢迎产业界伙伴基于灵衢研发相关产品和部件 ,共建灵衢开放生态。
接下来带来两个集群产品:首先是Atlas 950 SuperCluster 50万卡集群。
Atlas 950 SuperCluster集群由64个Atlas 950超节点互联组成,把1万多机柜中的52万多片昇腾950DT组成为一个整体,FP8总算力可达524 EFLOPS 。上市时间与Atlas 950超节点同步 ,即2026年Q4。
在集群组网上,我们同时支持UBoE与RoCE两种协议,UBoE是把UB协议承载在以太网上 ,让客户能够利用现有以太交换机。相比传统RoCE,UBoE组网的静态时延更低、可靠性更高,交换机和光模块数量都更节省 ,所以,我们推荐UBoE 。
Atlas 950 SuperCluster集群,相比当前世界上最大的集群 xAI Colossus,规模是其2.5倍 ,算力是其1.3倍,是当之无愧的全世界最强算力集群!无论是当下主流的千亿稠密、稀疏大模型训练任务,还是未来的万亿 、十万亿大模型训练 ,超节点集群都可以成为性能强悍的算力底座,高效稳定地支持人工智能持续创新。
在2027年Q4,我们还将基于Atlas 960超节点 ,同步推出Atlas 960 SuperCluster,集群规模进一步提升到百万卡级,FP8总算力达到2 ZFLOPS ,FP4总算力达到4 ZFLOPS。并且,它同样也支持UBoE与RoCE两种协议,在UBoE协议加持下 ,性能与可靠性同样更优,并且,静态时延和网络无故障时间优势进一步扩大,因此继续推荐UBoE组网。通过Atlas 960 SuperCluster ,我们将持续加速客户应用创新,探索智能水平新高 。
买股票要去哪里开户正规:关于股票交流群-积极信号!减产控销破“内卷” 多因素支撑光伏硅料价格上涨!
天津买股票到哪里开户:交易杠杆是什么意思-墨西哥总统称正考虑对华加征关税 外交部:坚决反对在他人胁迫下对华设限
杠杆股市:股票网上开户哪家佣金低-中欧基金葛兰二季度加仓科伦药业、三生制药,业绩回暖难挡高份额净赎回
股市中杠杆啥意思:手机买股票如何开户-复牌第一天 *ST广道走出30cm“地天板”行情!连续多年财务造假 此前一个月内三次停牌核查
股票杠杆强制平仓:买股票新手入门开户流程-凌晨!特朗普重大宣布!美军发动袭击
新手如何开户买股票费用:什么是股市杠杆-又见基金经理道歉 有人反思“获利了结”过早 有人坦言“有些难熬”
优倍网-优倍网平台-实盘配资公司_网上配资平台开户提示:文章来自网络,不代表本站观点。
华金资本公告称,公司接到控股股东华发科技通知,其上层股权结构拟发生变动。根据珠海市国资委的通知,华发集团与珠海格力集团将...
福建省商务厅官网消息,为推动福建省外贸企业拓展国内市场,《福建省深化内外贸一体化发展实施方案(征求意见稿)》公开征求意见...
记者王珍中国国际经济交流中心副理事长、国务院发展研究中心原副主任王一鸣周一在“中国发展高层论坛2025...
3月24日,易方达国证自由现金流ETF公开发售。该产品跟踪国证自由现金流指数,这个指数是什么?有哪些优势?投资价值如何?...
记者辛圆3月25日,博鳌亚洲论坛旗舰报告《亚洲经济前景及一体化进程2025年度报告》(以下简称《报告》...
3月24日,海洋王照明科技股份有限公司(以下简称“海洋王”,002724.SZ)早盘一字跌停,此后股价拉涨,尾盘封涨停板...
记者|赵阳戈年初,证监会就修改《证券发行与承销管理办法》部分条款向社会公开征求意见,市场也将注意力投向了...
近日,开源证券大连分公司遭大连证监局处罚,暂停其办理需要合格投资者认定相关业务六个月。该惩处力度在近年来券商分支机构中并...
国海富兰克林基金国富深化价值基金经理刘晓日前发表了对 2025 年市场的展望。刘晓指出,国内经济正处于复苏通道,市场大幅...
2025年3月25日,倍轻松(688793.SH)公告称,公司股东宁波倍松投资有限公司(简称“宁波倍松”)拟通过大宗交易...
3月24日,AI眼镜概念股开盘拉升,瀛通通讯直线涨停,明月镜片涨超10%,比依股份、博士眼镜、恒玄科技、国光电器等跟涨。...
3月24日,业内权威专家表示,MLF(中期借贷便利)不再有统一的中标利率,标志着MLF利率的政策属性完全退出。3月24日...
记者辛圆给补贴、建平台,为了吸引更多高层次人才,各地纷纷放出“大招”。据央广网周一发布消息,湖...
沪深两市成交额连续第44个交易日突破1万亿,较昨日此时缩量超900亿。...
【隔夜行情】•周五(2025年3月21日),A股三大指数集体下跌,截至收盘,截止收盘,沪指跌1.29%,报收33...