
上周火星电竞CHINA,华为全连合大会围聚展示了华为最新最强的一系列篡改。
本年最受真贵的当然是超节点技能带来的算力风暴和突破。但超节点带来的算力突破还不是沿路,超节点架构带动的开源绽开,还会把这场风暴推得更深更远。
愈加直不雅类比来说,这是一场华为发起的" AI 高速路"修路尝试,绽开硬件十分于绽开了修路材料,开源软件和灵衢组件十分于开源了修路法子和圭臬契约。
华为用开源绽开,给出了中国 AI 高速公路枢纽成立的有接洽——
一个惠及各行业全场景,技能红利袒护大中小种种玩家的生态。
大杀器超节点,华为决定开源绽开
在华为全连合大会上,华为重磅发布篡改的超节点架构,推出袒护数据中心到职责站的全场景超节点新品。
Atlas 950 SuperPoD是面向超大型 AI 谋划任务的最好弃取,从基础器件、契约算法到光电技能,终明晰系统级的篡改突破。
其通过正交架构,让 Atlas 950 终了零线缆电互联,给与液冷辩论浮动盲插假想作念到零漏液,始创的材料和工艺让光模块液冷可靠性进步一倍。
此外,Atlas 950 SuperPoD 篡改的 UB-Mesh 递归直连拓扑麇集架构,支抓单板内、单板间和机架间的 NPU 全互联,以 64 卡为步长按需推广,最大可终了 8192 卡无握住全互联。
即便与英伟达居品对比,Atlas 950 超节点也上风显耀。
比较盘算来岁下半年上市的 NVL144,其限制、总算力、内存容量、互联带宽分辩达到后者的 56.8 倍、6.7 倍、15 倍(1152TB)、62 倍(16.3PB/s)。
即便对标英伟达 2027 年盘算上市的 NVL576,依旧遥遥着手。

Atlas 850是业界首个企业级风冷 AI 超节点行状器,里面搭载 8 张昇腾 NPU,灵验闲隙企业模子后测验、多场景推理等需求。
Atlas 850 支抓多柜活泼部署,最大可造成 128 台 1024 卡的超节点集群,是面前业内独一可在风冷机房终了超节点架构的算力集群,企业无需矫正现存风冷机房即可部署算力集群。

Atlas 350 标卡给与最新的昇腾 950PR 芯片,向量算力进步 2 倍,支抓更细粒度的 Cacheline 走访,在保举推理场景可终了 2.5 倍性能进步,且单卡即可启动。
Atlas 350 支抓灵衢端口互联,终了算力、内存等资源池化,让更大参数模子、更低时延应用不错在标卡上终了。

TaiShan 950 SuperPoD是华为推出的业界首款通算超节点,具备百纳秒级超低时延、Tb 级超大带宽和内存池化才调,能大幅进步数据库、虚机热移动和大数据场景等业务性能,为通算性能进步开辟全新旅途。
这一系列的超节点新品能终了从数据中心、企业部署、袖珍职责站的全场景袒护,从而在硬件层面协同用户终了个性化部署,股东 AI 高速公路互通互联。
而就在超节点发布的同期,华为弃取了全面的绽开和开源。
着手是硬件层面的绽开。
华为晓谕全面绽开超节点技能,与产业界分享技能红利,共同股东超节点技能走向普惠与协同篡改。
一方面,绽开灵衢契约和超节点参考架构,允许产业界基于技能规范自研干系居品或部件。
另一方面,全面绽开超节点基础硬件,包括 NPU 模组、风冷刀片、液冷刀片、AI 标卡、CPU 主板和级联卡等不同形态的硬件,陋劣客户和伙伴进行增量开垦,假想基于灵衢的多样居品。
其次是软件层面的开源。
超节点的启动离不开操作系统的深度支抓,操作系统灵衢组件也将沿路开源,组件代码将持续合入 openEuler 等多个上游操作系统开源社区。
用户不错凭证施行需求,将部分或沿路源代码集成到现存操作系统中,自行迭代贯注版块,也不错将通盘组件平直合入现存操作系统,将来演进与开源社区版块同步。
开源是驱动技能篡改和产业跳动的中枢力量,昇腾 CANN 全面开源绽开,Mind 系列组件也同步开源,并支抓 PyTorch、vLLM 等业界开源社区,加速开垦者自主篡改。
不错说,华为这一手硬件、一手软件平直开源了个烦扰!

华为为何要开源?
一方面,开源大概和产业界、开垦者社区基于超节点架构自研干系居品或部件、自界说调试调优、分享技能红利,加速产业协同发展。
另一方面,开源还有益于残害者按需取用、裁减适配资本,打造面向行业的超节点场景化责罚有接洽。
华为董事、ICT BG CEO 杨超斌示意:
华为将围绕超节点架构抓续篡改,让超节点技能不但用于大型数据中心,也不错用于企业级的数据中心和袖珍职责站。同期,坚抓硬件绽开,支抓各个伙伴,活泼打造面向各个行业的超节点场景化责罚有接洽。坚抓软件开源,让路发者活泼高效篡改,共建茁壮生态。

这就意味着,超节点技能不再是少数大型数据中心的专属利器,而是一个绽开分享的算力生态。
每个行业、每个企业、每位开垦者齐能凭证自己需求,活泼搭建我方的算力"高速路"。
不管是大型模子测验、复杂推理任务,如故企业级应用场景,用户齐能按需获得硬件和软件才调,终了算力资源的高效垄断和活泼推广。
刻下,超节点已庸碌行状于互联网、金融、运营商、电力、制造等行业,匡助种种企业进步算力恶果和业务才调:
把各个谋划单位、存储单位等组件通过大带宽、低时延互联麇集对等互联。
接济通讯契约,省去独特契约转机支出。接济内存编址,终了全局资源池化,使灵验算力大概随集群限制线性推广。
通过灵衢契约的高可靠机制,并融入华为在通讯上几十年的积攒,大幅进步集群可靠性。

诚然多芯片互联、大限制谋划节点以取代单芯片成为行业共鸣,但传统集群通过"行状器堆叠 + 以太网连合"推广算力,时常带宽受限、时延高,而且跟着限制越大恶果也会越低、可靠性难以保险。
基于这一痛点,华为以超节点架构为"路基",通过灵衢互联契约,把散布的行状器深度互联,让集群像一台机器相同学习、推理与合作,为 AI 大模子和行业应用提供信得过高效、雄厚、可推广的算力底座。
那么,什么是灵衢呢?
肤浅来说,灵衢(UnifiedBus)是一个面向超节点的互联契约,咱们不错把它意会成一个绽开共建的修路契约。
依托灵衢的超节点架构具备资源池化、线性推广、长稳可靠等枢纽特点,从而终了谋划、存储单位的大带宽和低时延互联,责罚了传统集群限制高潮可靠性裁减的痛点。
不仅如斯,灵衢如故开源的。
这就意味着,不门径独一的修路时势,契约全面公开,环球不错因地制宜,在不同路况的搭建合乎的车说念。
限定等于——环球能解放开垦系统、调遣软件,生态越跑越茁壮。
绽开共建:修路不独占
AI 算力生态,实质上是 "修建数据传输与调遣的高速路"。
以英伟达的 NVLink 为例,它就像"工业园里面高速",行状 GPU 单机或机架内的数据传输——
这条路带宽高、延长低,却因给与私有契约而相对紧闭。
编译、传输、通讯、驱动等国法均由其独家制定,无法与其他生态互联互通。
而华为则通过灵衢契约与超节点架构,走出了一条绽开之路:
它构建的不是孤单路段,而是一套接济圭臬的 "空洞交通枢纽"—— 从卡间互联的 "超高速磁悬浮",到机柜内互联的 "城市环线",再到机柜间互联的 "宇宙高铁网",均给与归并套契约国法。
这意味着数据如同车辆,从开端到绝顶无需换说念、恭候,可全程畅达。
同期,统共谋划、内存、存储资源在此被打散、池化,系统能自动匹配最高效的调遣旅途,终了全局资源优化。
更枢纽的是,华为不仅我方 "修路",还将这套技能圭臬向全社会公开,邀请硬件厂商("建筑公司")、芯片企业("汽车制造商")共同参与,按接济圭臬研发硬件、适配居品,破裂 "园区式" 紧闭生态的隔膜,股东通盘国产算力生态作念大作念强。
此前,AMD、Intel、Apple 等企业发布的开源 UALink,虽有访佛绽开尝试,但受限于软硬件积淀不及,难以扶植大限制推广的算力麇集。
就像杨超斌在会上提到的:刻下,荆棘文长度和测验数据量激增,模子迭代速率加速、多任务协同与多轮推理、摩尔定律失效,行业的低时延等一系列条目,促使多芯片互联、大限制谋划成为势必。
而思充分开释百亿亿次谋划和万亿参数 AI 模子的后劲,枢纽在于行状器集群中每个 NPU 间能否终了快速、无缝的通讯。
这些节点与集群,实质是数万到数十万个 NPU 拼接成的 "高性能引擎",其协同编排才调,恰是算力生态的枢纽。
而华为的灵衢契约与超节点架构,不仅为绽开硬件与开源软件提供了可行有接洽,也在信得过的可用性上提供了另一种弃取。
如同华为轮值董事长徐直军先容,华为行将上线的 Atlas 950 超节点、Atlas 960 超节点、TaiShan 950 超节点以及 Atlas 950 SuperCluster 50 万卡集群和 Atlas 960 SuperCluster,齐基于灵衢终明晰更大的算力限制、更高的带宽和更低的时延。

对比刻下全球最大集群 xAI Colossus,Atlas 950 SuperCluster 的限制是其 2.5 倍,算力是其 1.3 倍,号称全球最强算力集群。
而就像咱们开头提到的,Atlas 950 超节点较英伟达居品的性能也绝不忘形。
除了性能上的完全上风,华为更以 "绽开" 股东产业普惠。
让不同限制、需求的用户齐能搭建我方的 " AI 高速路",参与全场景算力生态成立,最终终了硬件、软件、算法的共建共赢。
而关于中国 AI 算力生态乃至通盘 AI 产业来说,这更是一种安全可靠可抓续的弃取,把 AI 成立在我方的基座之上,造成 AI 期间的圭臬和语言权。
何况因为咱们领有最大的阛阓,这种生态一朝闭环,将会造玉成新的篡改飞轮,如同新动力汽车一经终了的相同。
要致富,先修路。
AI 成立亦然相同,但面前,华为率先提供了一条开源绽开共赢的中国之路。
一键三连「点赞」「转发」「谨防心」
迎接在褒贬区留住你的思法!
— 完 —
� � 点亮星标 � �
科技前沿明白逐日见火星电竞CHINA

 
       
      