📋 字节采购国产芯片专家交流 【核心要点】: 1) 字节的GPU整机采购预算方面,最初约为1600亿元人民币,随后上调至1800亿元,目前已进一步增至2300亿元。 2) 今年年初公司获批采购8万张H200芯片,且该批采购已完成合规报备。此外,还买了10多万张A100芯片。相关预算从50多亿元增加至2
字节采购国产芯片专家交流
【核心要点】:
1) 字节的GPU整机采购预算方面,最初约为1600亿元人民币,随后上调至1800亿元,目前已进一步增至2300亿元。
2) 今年年初公司获批采购8万张H200芯片,且该批采购已完成合规报备。此外,还买了10多万张A100芯片。相关预算从50多亿元增加至200多亿元。
3) HWJ一月至五月累计交付约10万590,单价是62000-63000。从五月中下旬至六月初开始,到年底还将交付约10万690,单价估计在11-11.5万元,主要基于中芯南方的版本。
—
【详细全文】:
1、字节对GPU和CPU的采购预算?
GPU整机采购预算方面,最初约为1600亿元人民币,随后上调至1800亿元,目前已进一步增至2300亿元。
通用CPU整机采购预算方面,则从700多亿元提升至1000亿元左右。
IDC基建方面,今年1-2月已完成首批招标,规模约为1GW。值得注意的是,这仅是第一次招标。今年年内,即八、九月份左右,还将启动第二次国内招标,同时推进海外IDC的投产工作,重点布局内蒙古等绿电资源丰富区域。
综合来看,若将CPU、GPU以及IDC相关设备全部纳入统计,整体基础设施预算预计将达到4200亿至4300亿元人民币,涵盖国内及海外项目。该预算不包括未来的业务租赁支出。
从经营费用角度看,上述规模在国内市场已属较大,但放在全球范围内比较,仍然处于偏低水平。
2、国外的GPU采购情况?
总预算大概是2300亿元的整机采购额。其中,大约有1200亿元的服务器物理量放置在境外,剩下的部分放在境内。
境外方面,从芯片供应商来看,NVIDIA占比最高,约65%,B200和B300都可以买得到。AMD占比约30%,主要是MI350、MI400、MI450等。还有大概5%来自博通。这就是整体算力大盘的基本构成。
3、H200的采购情况?
与今年年初相比,目前情况已发生变化。市场上有所谓的“水货”NVIDIA芯片,但公司始终坚持不碰水货,任何阶段都明确表态对此不感兴趣、不关注。
当前一个有重要信息是NVIDIA芯片进入国内市场的通道,实际上已打开了一个口子。基于这一变化,字节跳动申请了20万卡,至少能够拿到8万卡的订单量,阿里也是一样的情况。目前的政策是买英伟达的卡需满足1:4国产芯片配套比例,后面国产化的比例会越来越高。
具体而言,今年年初公司相关预算从50多亿元增加至200多亿元,原因在于公司获批采购8万张H200芯片,且该批采购已完成合规报备。此外,还有10多万张A100芯片,这两部分共同构成了今年NVIDIA芯片的主要供给来源。
4、HWJ的采购情况?
当前国内AI算力市场的核心矛盾,并不在于需求不足,而在于供给端的交付能力受限。整体算力需求量非常大,但短期内可获取的卡量有限。即便中芯南方N+1和N+2的产能有所释放,仍然无法完全满足现有的需求。HWJ和昇腾等主要国产算力厂商的交付节奏,成为决定市场可用算力的关键变量。
从HWJ来看,2026年字节的采购预算是250-300亿元,交付计划整体乐观预期。具体而言,一月至五月累计交付约10万590,单价是62000-63000。从五月中下旬至六月初开始,到年底还将交付约10万690,单价估计在11-11.5万元,主要基于中芯南方的版本。此外,全年还有约30万张590,单价约为20000出头,字节拿货价便宜,用的是N+1工艺。这些是当前明确能供应的量,后续仍会根据订单变化、履约资源及供给策略,可能额外新增或拓展采购量。总体而言,对HWJ的供应能力持相对乐观态度,希望其能多卖一些。
HWJ不太接三方需求,一般都是字节的订单结束之后,或者说冗余产能接一些外部订单,客户是腾讯、京东、快手,没有那么多量。
5、690的测试情况?
在此之前,国产芯片还没有批量做过N+2的这种封装,所以在封测层面目前做得并不算很好,一直存在一些封装上的问题,导致出来的效果不太理想,性能上略有不足。到目前为止,字节已经测过了第三版,马上要测第四版。只要能够解决双芯封装的问题,综合考虑成本和效果,性能上应该没有太大问题,用起来是OK的。剩下的就看交货的节奏问题。
6、690的产能和情况?
关于HWJ 690的供给情况,目前看来并不乐观。除了字节这边之外,市面上基本没有太多余量了。字节和HWJ签了6万卡的罚则协议,无论如何对方都得交付这6万张。690是否能全部上还不确定,但根据现有情况,那6万张保供应该问题不大,因为有罚则协议兜底。至于更多的新增需求,存在很大的供给风险。
虽然听说中芯南方下半年要扩产,但即便N+2的总量扩到30万或40万张,H拿走大头,HWJ分的不多。中芯南方的产能今年仍然不够解渴,因为Token增长带来的算力消耗比预期要快得多,字节现在的策略还是倾向于多买一些卡。价格方面,690的价格不算贵,海光的产品算力不如690,价格差不多,真正贵的是海光和其他国产芯片,字节更愿意多买一些690。
7、昇腾的采购情况?
今年公司至少能给昇腾贡献220-230亿元的订单,甚至可能更多。产能方面,结合当前形势,中芯南方的产能与订单情况已比较明确。从各家分配来看,昇腾拿到的份额最多,占比50%以上。
具体产品方面,一半是910,一半是950。具体配置由双方协商确定,整体进展比较顺利。关于昇腾950PR,也是双芯封装,用的是N+1工艺,产能充足,字节买的是不带HBM的版本,价格大概是45000-47000。因为需求旺盛,昇腾的订单价格可能会涨价。
去年市场上普遍认为的超节点价格较高,销售情况不太理想。但今年随着N+1工艺的应用,从字节的角度来看,性价比已经变得可以接受。价格方面,H的超节点方案实际上做了妥协,现在并不强制要求超节点必须捆绑自己的全套方案销售,而是可以融入第三方生态。例如,H可以单卖模组、单卖机器,超节点底层的建设资源可以根据客户自身需求进行配置和定制。总体来说,这种模式还是比较灵活的。虽然H在利润上可能有所牺牲,但更多厂商愿意接受和使用。否则如果强行做捆绑,与客户的选型不一致,客户也不会使用,字节买了很多模组,价格不算太贵。
8、字节自研芯片的进展?
自研芯片将于5月份左右从三星流片批量回来,预计回片量对应应七、八万张卡。2026年全年自研芯片最少回片30万张卡,占整体大盘订单的10%左右。明后年这一量级会继续扩大,预计到2027至2028年,自研芯片占比能够达到整体大盘的30%左右,这一确定性相对较高。
在成本与用途方面,自研芯片的成本明显低于采购HWJ或昇腾的芯片,自研芯片的成本大约能便宜一半(不算设计费用和后台IP成本不足3万),但其使用场景是确定的。自研芯片主要用于推理场景,而非训练场景。在推理需求下使用自研芯片效果较好。用自研芯片做训练则不现实,公司也没有这方面的诉求。
自研团队从2022年底成立,目前约300人。团队历史上曾连续三年没有实质性产出,经历了一段较为艰难的时期。但近期情况已发生变化。过去自研芯片的量产先后经历了博通与台积电的组合,以及三星与芯原的组合,最终在三星与芯原的路径上实现了突破。当前的核心挑战在于供应链的可靠性。由于台积电路径已无法依赖,只能选择三星或国内厂商。国内厂商产能有限,排产困难,因此主要依赖三星。只要三星能够正常保障产能供应,并与公司在量上持续扩展,自研芯片的推进就能比较顺利地进行。预计这款芯片在整个生命周期内有望实现百万级别的出货量。
展望未来,到2027年7月左右,公司将推出二代芯片的流片。目前二代芯片的架构设计已经完成,预计2026年12月出图纸,随后将前往三星进行流片。CPU方面,字节跟中兴微电子合作,第一代产品已经流片回来了,第二代产品明年去流片。从行业趋势来看,越来越多厂商正在寻求定制化芯片方案,以降低对外部芯片厂商的依赖,减少中间环节的高毛利。字节增加自研比例会降低对HWJ的依赖,HWJ也会拓展其他客户。
9、字节的模型对token的消耗?
在Token用量方面,2025年1月份的Token用量约为5万亿。到2025年11月这一数字已增长至50万亿。截至当前,公司Token用量已达到140-150万亿。预计到2026年七、八月份,Token用量将进一步增长至500万亿;到2026年年底,最低目标为1000万亿。
Token用量的翻倍速度正在加快,每翻十倍所需的时间在不断缩短,从中国大陆整体大盘来看,预计整体用量将以每年十倍的速度增长,只有在基数过大之后,增速才可能放缓。届时Token用量的计量单位可能不再是“万亿”,而可能上升到“兆亿”级别,但这也需要进一步观察。
在算力需求方面,当前140万亿Token的用量,大约使用了90万张卡。如果要达到500万亿Token,则需要约330万张卡。到年底实现1000万亿Token,最低需要约560万张卡。其中,大约80%需要等效于A800算力水平的卡,20%需要等效于H100算力水平的卡。目前来看缺口有200万张卡。无论采用何种方案,等算力不足是一个客观存在的问题。
为应对算力缺口,公司正在积极调整采购策略,正在大规模收货,包括天数智芯、摩尔线程、海光等国产芯片。虽然部分芯片存在价格偏高、使用体验一般等问题,但公司愿意通过价格调整等方式进行优化配置。
Q&A
1、国内其他厂商的情况?
昆仑芯:腾讯近期又向昆仑芯下了一笔大额订单。字节对昆仑芯的测试评价为还不错,目前正在持续跟进相关测试工作。关于昆仑芯的产品路线,目前主要是M100,这是今年在国内基于N+1工艺生产的产品。后续还有M300,将基于三星4纳米工艺。此前市场预期M300在2027年初设计完成并回片,但目前预计会提前。M300的性能有望对标英伟达B200,这是一个值得期待的突破。
天数智芯:天数芯片的工程能力没有问题,是一款不错的产品。但天数最大的问题在于其完全依赖台积电,产能不大,难以看到订单的连续性。目前主要销售的产品严格来说并不是一款特别出色的芯片,性能大约与580相当,价格在2万多元。天数的新品在6月份左右回片。天数在台积电涨价前囤积了几万张卡,没有涨价,基本按原价销售,公司采购了几万张,单价两万多,性价比很高。这批库存基本已经消化完毕。
其他厂商:沐曦的特点是便宜,但性能一般。优势在于愿意国货,在国内通过三星渠道备货了大约二十万张卡,这是一个很强的资源储备。今年之前很多厂商比较挑剔,不愿意采购沐曦,但今年的销量应该不会有太大风险。燧原主要专供腾讯,不太对外销售,产能和性能都比较一般。海光智算中心的业务做的不错。
HWJ、昇腾、昆仑芯算国内第一梯队,天数智芯、海光则属于第二梯队,再往后的厂商就比较弱。
