kaiyun之是以搞超节点这种加强版Scale Up-kaiyun网页版
发布日期:2025-05-12 07:39 点击次数:178
kaiyun
最近,“超节点”在AI圈马上走红,在各大展会论坛时时亮相,行业大佬也以为它是智算发展遑急趋势。那么,究竟什么是超节点?为何需要超节点?本文将真切解读。
超节点英文为SuperPod,由英伟达伊始建议。跟着大模子参数规模增长,对GPU集群规模需求束缚增大,构建大规模GPU集群的时势有Scale Up(朝上膨胀,加多单节点资源数目)和Scale Out(向外膨胀,加多节点数目) 。但Scale Up受限于单台做事器空间、功耗、散热及里面通讯才能,英伟达推出NVLINK总线合同及NVLink交换机处分此问题,历经发展,NVLINK已到第五代。2024年3月,英伟达发布NVL72,可集成大皆CPU和GPU,收场高AI教师性能。
之是以搞超节点这种加强版Scale Up,是因其在性能、资本、组网、运维等方面有高大上风。比拟Scale Out选择的Infiniband和RoCEv2技艺,超节点在带宽、时延上贯通更优,还相沿内存语义才能。从组网和运维角度,超节点可攻讦组网复杂度与网罗部署难度,缩小部署周期,便捷后期运维,不外也要沟通资本成分。
因超节点上风显耀,受到业界温顺,好多厂商加入相干。现时主流超节点决策有:格外合同决策,如英伟达,还有华为发布的CloudMatrix 384,以384张昇腾算力卡构成超节点,提供高密集BF16算力;灵通组织决策,以以太网技艺为基础发张灵通轨范,攻讦行业门槛,其中ETH - X灵通超节点花样有30余家产学研机构参与,基于以太网构建HBD,具备多种特质,其技艺范例1.0已发布,首台原型机已下线。
跟着AI发展kaiyun,业界对超节点需求将更热烈,更多厂商会加入干系灵通轨范。
#超节点 #AI技艺 #GPU集群 #灵通轨范