华为和阿里巴巴押注“超级节点”:非旋转单卡
“科学与技术创新委员会每日”报道,10月4日,人工智能以前所未有的速度降低了各种行业。这种变化的背后是计算大量力量的支持。当AI模型参数从1亿次增至1亿次时,“超级节点”开始逐渐取代独立和传统群集,这成为新一代的“计算能力魔术武器”。超级节点(或超pod)是一种技术体系结构,用于产生大量的计算能力群。 NVIDIA首先提出了这个概念,该概念指的是将数千个GPU集成到逻辑单元中,以产生类似于“超级计算节点”的系统。与传统的体系结构不同,超节点可以使pagrunting服务器的带宽不足和高速互连技术的高潜伏期,以优化计算强度效率。在2025年的云Qi会议上,阿里巴巴云发布了Panjiu 128 Super Node AI服务器。据报道,该服务器包括阿里巴巴的自开发的CIPU 2.0芯片和EIC/MOC高性能网卡,并且单个机柜支持128 AI计算芯片。具有相同的计算能力,与传统体系结构相比,服务器识别的性能可以提高50%。除了了解场景外,超节点还可以用于AI培训。今年4月,华为推出了CloudMatrix 384超级节点,通过开发超过10,000件的大型簇来增强计算能力。对于具有数万亿个参数和10万亿个参数的大型训练模型实践,可以用超大群集级联432个超节点,在云数据中心中最大卡路里160,000卡路里。华为在华为的完整连接会议上说,出售了300多个CloudMatrix 384个超级节点,总共为20多个客户提供服务,主要需求来自政府和B用餐。将来,华为还将推出Atlas 950 SuperPod Supernode,其计算力量表为8192张卡片,预计将在2026年的四分之一季度推出。各州从“单卡绩效”转移到“系统水平效率”,中国通过构建AI的生态学 + Engineering + Engineering + Engineering的基础设施。实际上,当前有国内硬件制造商加快了超级节点的加快:8月7日,Insers在超级节点AI Server“ Yuanna SD200”上发布信息,以实现数万亿美元的参数模型。 Muxi Co,Ltd发布了各种超级节点形式,包括光学互连超级节点,YAOL 3D网格超级节点,上海多维数据集,国内高密度液体冷却柜和高密度液体冷却计算功率POD。 8月28日,百度智能云发布了5.0版的Baige AI计算平台。在计算能力方面,kunlun核心超级节点正式la未束缚。从技术的角度来看,超级节点正成为AI基础设施构建的新常态。 Minsheg Securities认为,市场以前更加关注芯片计算能力,但是随着规模提高行业的增加,超节点将重新定义Theai基础设施的范式。以华为的超节点为例,其橱柜使用全光互连,这是高度可靠的,高带宽,低潜伏期和其他优势;另一方面,华为的950 Atlas通过正交结构实现中性电缆电缆互连,其原始材料和过程提高了光学模块液体冷却的可靠性。与将于明年下半年推出的NVL144相比,Atlas950超节点卡的尺寸为56.8次,最终计算能力为6.7次,其内存容量为15次,互连带宽为62次,领先To所有方面。该机构进一步教导说,当超级节点率显着上升时,AIDC Power将带来Newchallenge。由于包括华为CloudMatrix 384和NVIDIA GB200NVL72在内的超节点单柜的电力消耗通常超过100kW,因此,当计算密度强度呈指数增长时,超节点柜的控制和电源系统将面临挑战。当ATAS950超节点采用全流体冷却模式时,相互关联的带宽率和计算速率预计将导致显着增加。从投资的角度来看,郭金证券表示,华为超级节点等新平台通常会导致关键指标,例如计算,带宽和记忆力,并有望促进国内计算能力基础设施的加速实施。我们对超节点渗透率的持续增加感到乐观上链。
特别声明:上面的内容(包括照片或视频(如果有))已由“ NetEase”自助媒体平台的用户上传和发布。该平台仅提供信息存储服务。
注意:上面的内容(包括照片和视频(如果有))已由NetEase Hao用户上传和发布,该用户是社交媒体平台,仅提供信息存储服务。
- 上一篇:计费仍然是一个问题:173.48亿堆堆无法满足1400万
- 下一篇:没有了
