【小熊团队】谷歌云交流总结:

🌹限制Meta调用Gemini事件解读

1. 算力供给先天不足
谷歌2026年TPU总供给400-450万颗,60%-70%自留!仅100-150万颗对外
Meta调用量近数月数倍增长,为GCP全球前三外部客户,缺口太大!

当前算力需求是供给的10倍(含跨平台重复询价需求),2026全年、2027上半年算力持续紧缺,缓解看看2028年。

2.谷歌内部资源矛盾突出
对外大量供货挤压内部Gemini模型迭代算力,Gemini研发资源受限、迭代放缓,谷歌被迫外购第三方GPU弥补算力缺口(租赁马斯克X算力)

🌹主流GPU/TPU租赁价格大幅暴涨(美国市场,按小时计价)

1. B200
2025年底三年预留合约价3美元;2026年三年预留涨价至6美元(翻倍),一年期预留超7美元。

2. H100

低位(2025年底)三年预留1.8-1.9美元;2026年续约价格达3.35美元,涨幅翻倍;老客户续约统一涨价30%,新客户价格较低点翻3倍。

3. TPU

• TPU V7:订单2025年锁定,无闲置资源;

• TPU V8:2026年4月新发布,无历史基准价,现价较前期预期上涨20%-30%,剩余产能由中小客户争抢。

🌹谷歌Token降价宣传为营销包装
所谓单价下调并非同等模型降价:通过推出参数量更小的Lite轻量模型、迭代新一代Flash模型(性能提升但对标旧Pro版本)制造低价噱头,厂商实际推理业务利润率持续上行。
算力消耗结构:当前推理算力需求占60%,训练占40%;

作者 AI财经

AI财经提供的财经数据以及其他资料均来自互联网其他第三方,仅作为用户获取信息之目的,并不构成投资建议。
AI财经以及其他第三方不为本页面提供信息的错误、残缺、延迟或因依靠此信息所采取的任何行动负责。市场有风险,投资需谨慎。