📋 OEM厂商解读国产超节点专家交流 【核心要点】: 1) 2026年是超节点元年,互联网厂商的超节点方案机柜预计于2026年9月左右开始起量。 2) 相对传统计算节点,超节点需要计算节点、GPU卡之间实现互联,所以交换芯片、线缆、连接器、铜缆的费用有所增加。超节点方案成本为传统计算节点的2-2.5倍。
OEM厂商解读国产超节点专家交流
【核心要点】:
1) 2026年是超节点元年,互联网厂商的超节点方案机柜预计于2026年9月左右开始起量。
2) 相对传统计算节点,超节点需要计算节点、GPU卡之间实现互联,所以交换芯片、线缆、连接器、铜缆的费用有所增加。超节点方案成本为传统计算节点的2-2.5倍。
3) 国内仅5家厂商可做超节点研发和生产,分别是浪潮、新华三、华勤、超聚变和中兴通讯。
【详细全文】:
1、超节点方案相较于传统计算节点有哪些核心优势?
一是实现GPU、CPU及交换节点的一体化互联,整合于单个机柜;二是相较于传统八卡机,可承载更大的模型数据量。
超节点对训练和推理的性能增益,因模型不同而有所差异。超节点主要针对数万亿及更大模型的训练或推理而设计研发。传统八卡机通过交换机连接,相比超节点,存在时延相对较高、GPU间传输效率低的问题,无法充分发挥卡间传输性能,而超节点可提升整体性能。
2、下游客户对超节点方案需求的紧迫性和必要性如何?
2026年是超节点元年,互联网厂商及品牌机厂商的超节点方案估计于2026年下半年9月左右开始起量,时间匹配互联网模型需求及上游供应商产能。
不同客户的应用场景不同:腾讯超节点方案更多用于推理型场景;阿里平头哥超节点方案可用于训练型场景;字节自研ASIC卡规划用于训练型场景;国产卡中可用于训练场景的较少,仅平头哥3.0、字节自研ASIC卡及昇腾的950 PR或DT。
什么条件下需切换至超节点:一是寻求更高算力和性能,超节点可聚合多子节点算力及存储带宽;二是对单节点容错能力和可靠性要求更高,会使用超节点;三是要求更高扩展和弹性,扩容更灵活;四是要求负载均衡、低延时性及高速率。
3、2026年互联网厂商的超节点需求量?供应商产能情况?
头部三家互联网厂商需求:从2026年3月到2027年3月,阿里超节点需求为2000-2300柜磐久128,腾讯需2500柜ETH-64超节点,字节需将近2300柜超节点,国内可做超节点的厂商最多5家。为满足互联网客户需求,每家供应商在2026年9月需至少达到200柜/月的产能,这是互联网厂商对供应商的最低产能要求。
目前已经进入量产阶段。
4、各云厂商超节点方案的适配芯片、计算节点、交换节点数量配置如何?
阿里磐久128超节点:128卡,32个计算节点(每节点4张GPU卡),同时配置16个交换节点,GPU与交换节点芯片配比8:1。适配平头哥3.0、海光深算3号、寒武纪590和690。
腾讯ETH-64超节点:64卡,16个计算节点(每节点4卡),对应配8个交换节点,卡和交换芯片芯片配比8:1。适配燧原、百度昆仑T800、海光深算3号,规划昇腾950PR和DT。
字节72卡超节点:72卡,18个计算节点(每节点4卡),卡和交换节点芯片的配比6:1。适配寒武纪690、字节自研ASIC卡,规划昇腾950DT和PR。
5、各云厂商超节点方案的设计差异主要在哪些方面?
1) 互联网方案:国内现在都是以太网的超节点方案。阿里虽然是128卡结构,实际是64卡间互联,然后64卡再与64卡互联;腾讯为纯64卡互联;字节为72卡互联,因字节方案出得比较晚,在铜缆这一块,找到了一家可实现72卡互联的厂商协助。
2) GPU与交换节点配比:字节为6:1,阿里和腾讯为8:1,字节技术更先进一些,按照超节点方案的最终发展,计算节点与交换节点未来目标配比是1:1。
6、国产芯片超节点与海外NV的GB200或GB300性能差距多大?
单卡性能方面,平头哥3.0性能仅能对标H200的80%,而H200性能不到B300的1/2(GB300为两颗B300芯片组合);整体服务器性能,海外方案至少是国内方案的3到4倍。
7、超节点架构在PCB、液冷、电源、网络解决方案等硬件环节有哪些升级?
1) PCB:计算节点PCB板需达到18-20层,51.2T交换节点的PCB板需达到32-36层,而传统计算节点PCB大多为14层。
2) 液冷:超节点必须采用液冷方案,包含CDU、液冷管、冷板等,供应商从液冷厂商采购整套设备。传统方案用风冷即可。
3) 电源:传统计算节点方案为单节点供电,供电技术这块要求也不是很高,因为单一计算节点损坏不会影响到整个机柜。而超节点方案需集中供电power shelf设计,约3.5千瓦,未来向5.5千瓦及更高规格发展。
4) 网络:传统方案一个计算节点只需要一台交换机,计算节点里都是通用型服务器。超节点方案中,交换机芯片规格需51.2T起,传统方案的交换机芯片规格为12.8T-25.6T。
8、超节点架构中哪些硬件环节单位价值量提升,幅度如何?
1) 散热模块:风冷占传统计算节点成本的2%,超节点中液冷方案价值量占比提升至4%-5%。
2) 电源:电源方案的价值量增长约为30%,按照瓦数来计算,增长不算特别多。
3) PCB:因制程升级,价值量提升40%-50%。
4) 新增环节价值量:传统计算节点不需要计算节点之间实现互联、不需要GPU卡之间互联,所以超节点方案中交换芯片、线缆、连接器、铜缆的费用有所增加。
整体成本来看,超节点方案成本为传统计算节点的2-2.5倍。传统方案机柜通常为2台八卡机+10台通用型服务器+1台交换机。
9、超节点中包含哪几块PCB产品?背板规格、配置数量?
计算节点的主板,交换节点中交换芯片的主板,正交背板,交换节点里有管理模块板,硬盘使用的存储背板和电源板等。
单个计算节点中包括一个主板,一个电源供电板;计算节点之间互联使用到背板,例如,在磐久128超节点中,32个计算节点对应16个正交背板(2个计算节点对应1个),每家互联网厂商方案中正交背板用量不太一样。正交背板需30层以上PCB。
10、阿里磐久、字节、腾讯超节点单柜整体价值量在什么区间?
阿里磐久128(按PPU 3.0卡计算)约2000万;腾讯(按燧原卡计算)单机柜价值量为1000万,按海光卡计算为1200万;字节(按寒武纪卡计算)单柜价值量为1500万。
11、随着超节点卡数量(如64卡、128卡、512卡等)提升,架构会有哪些变化?
当前,卡数量增加不代表方案更先进,需关注卡间的连接速率和延时性,速率越高、延时性越低越好。现在国产超节点最多能做到72卡互联,未来发展方向是实现144卡的卡间互联。
伴随卡间互联的卡数增加,需以最小成本解决整机柜散热问题,集中供电需向5.5千瓦及更高发展;互联方式需升级,预计未来国内主流互联方式为NPO,CPO因功耗高、制程复杂,仍待各家供应商解决突破。
12、各云厂商与哪些ODM厂家合作开发生产超节点?合作方式与生产流程?
国内可做超节点研发+生产的厂商共5家,浪潮、新华三、华勤、超聚变和中兴通讯。浪潮与锐捷合作,浪潮做计算节点,锐捷做交换节点;新华三既具备交换机研发能力,同时具备服务器研发能力。
合作情况:阿里磐久128的研发标厂商为华勤和浪潮;腾讯ETH-64研发标厂商为华勤;字节大于72卡超节点的研发标厂商为超聚变。
合作方式:由云厂商整体的超节点方案架构,ODM供应商去做细节性的具体代工实践,包括PCB板画图等,最终实现机柜的生产组装。互联网厂商再使用超节点样品去跑相应的模型,若验证通过,互联网厂商会从供应商端把研发资料和生产资料全部收回。研发标厂商做的事情包含基础设计、研发代工、生产代工、出样品、小批量出货,之后资料会被收回。然后互联网厂商再去招量产标。
各互联网厂商的超节点均已进入量产阶段。
13、ODM厂商分别在研发标和量产标中的利润分配情况?
研发标厂商仅赚取NRE(研发费用报价)与实际生产成本的差额利润;量产标现阶段ODM厂商净利润率约4.5%-5%,现阶段由于市场物料供应的一些原因,超节点的利润点数相对高一点,未来随着市场竞争可能降至2%-3%。
传统代工利润率,如NV H200八卡机约1%,国产八卡约1.2%;超节点利润率为传统的2-3倍。
14、云厂商超节点的量产标份额格局?影响量产份额的决定因素有哪些?
1) 阿里:浪潮一供,份额为40%-45%左右;华勤二供,份额约为30%-35%;新华三是三供,份额约20%。
2) 腾讯:华勤一供,份额为40%-45%;新华三为二供,份额为30%;浪潮份额为28%,超聚变有少量份额。
量产招标份额主要受三个因素影响:商务报价占60%、生产制造技术能力占15%,含技术团队、人员供应及生产制造能力;招标时的质量因素占20%,参考供应商往年质量数据。
15、超节点相较传统八卡或通用服务器,更考验ODM厂商哪些能力?是否有较高进入门槛?
主要技术门槛在交换节点研发能力。1)技术资料获取:互联网厂商的超节点方案都是基于博通交换芯片来设计的,首先要拿到博通的交换芯片设计资料,需通过博通资质审核并缴纳会员费(如华勤交了6年2000万美元的会员费用)。2)芯片供应:ODM厂商需能独立从博通获取交换芯片,互联网厂商buy sale给ODM厂商的交换芯片数量有限。3)液冷研发设计能力:需投2-3亿改造工厂,将风冷机型产线升级为液冷机型的生产线,包含产线、产测系统升级。产测系统针对液冷漏液的检测,以及整机柜、交换节点和计算节点的产测能力。互联网厂商不报销费用。4)集中供电方案设计:需研究集中供电电源板设计,传统服务器仅需单节点供电。
16、浪潮、曙光是否推出自研超节点方案?下游客户有哪些?
浪潮、曙光等厂商有自研的超节点方案,非互联网厂商合作方案,但自研超节点方案目前国内无实际客户。除互联网客户外,其他客户无技术和资金实力采购,且需改造数据中心。当前服务器厂商自研方案多为展示性技术方案,对外秀技术肌肉。
17、参与国产超节点中,交换芯片、液冷、PCB等硬件环节的主要供应商有哪些?
从三家互联网厂商超节点的供应链来看,各环节主要包含以下供应商。
液冷:英维克、曙光数创、中航光电、吉嘉热控;
交换芯片(以太网):博通、盛科通信;
PCIe Switch:博通、无锡中芯微电子、澜起科技;
连接器:安费诺、莫仕Molex,立讯、华丰;线缆:安费诺、泰科电子,立讯;
电源:台达(台系),欧陆通、长城;
PCB:深南、胜宏、生益、广合。
18、交换芯片方面,盛科通信与博通的对比差距?交换芯片后续份额格局如何?
盛科通信51.2T芯片刚刚回1个月,到供应商手上刚1个月左右,测试显示延时为博通的2-3倍,按丢包率来看,弱于博通3倍。
目前三家云厂商节点均使用51.2T交换芯片,盛科通信最快2026年10-11月发货,预计份额仅10%-20%,博通仍为主流。虽然博通芯片整体供应紧张,但锐捷、新华三、华勤等部分供应商有备货,他们提前备货保障供应。
19、除了H,寒武纪、海光、壁仞等国产芯片厂家,是否自主设计超节点方案?
海光与曙光同体系,曙光会去做超节点方案;寒武纪、天数、壁仞、燧原、摩尔线程等GPU厂商无服务器和交换机研发经验,其展示的超节点方案是与前述5家供应商联合开发,非自主设计。
20、字节超节点方案中自研芯片的使用比例如何?
字节2026年自研芯片产能有限,2300柜需求中预计仅500柜左右可能使用自研芯片,实际量或更低。
21、下游客户2027年超节点需求的增长预测?
2027年超节点机柜需求量预期较2026年上升50%,卡需求数量翻一倍。
22、超节点大规模上量应用的时间节点?
2026年Q4为大规模应用阶段,目前已进入量产阶段。目前各家供应商的月产能约50柜。现阶段供应商交50柜需3-4周时间。
23、下游云厂H200采购量变化对国产超节点是否有影响?
H200采购量变化对超节点无影响,但会影响国内传统八卡机需求。
个人了解到,H200目前进国内较困难,虽然之前各家互联网厂商已分好相应份额,但因其可能对现阶段国产卡带来冲击,实际进口难度大。
Q&A:
1、立讯和华丰在线缆模组方面的竞争格局如何?
往年在互联网客户这块,安费诺占50%、Molex占30%、立讯占20%;超节点起量后,预估立讯占60%-70%,安费诺和Molex各占20%左右。三家都进入供应链之后,主要看报价和供应的情况。互联网客户追求性价比,报价低、交期好的厂商份额高。立讯与华丰的竞争格局尚不明确,但预计立讯份额高于华丰。
