Research & InsightsMETA: M…

【Research & Insights】META: META出租H100与购买先进算力并不矛盾

【Author】Andy

【Commentary】Meta 做 NeoCloud 与继续租 Crusoe 1.6GW，并不矛盾

今天盘前，Meta 被报道正在考虑把多余 AI 算力对外商业化，甚至做成类似 NeoCloud 的业务。市场第一反应非常剧烈：Meta 盘前上涨接近 6%，但 AI算力和neocloud相关股票受到负面Narrative影响，市场担心的是：如果 Meta 也开始把 GPU 算力对外卖，是否会直接导致算力过剩？

这个反应可以理解，但我们认为市场把问题想简单了。

首先，Meta 这件事本质上不是”AI 算力需求见顶”，也不是”Meta 不需要继续买算力”。相反，Meta 同时还在继续锁定非常大规模的新算力。根据 Bloomberg/Reuters 报道，Meta 最近与 Crusoe 签署了新的 AI computing capacity 协议，将从 Crusoe 位于 Texas Childress 和 Missouri Warrenton 的两个数据中心获得合计约 1.6GW 的容量；Reuters 也特别说明，目前金额和交付时间尚未明确，且报道未被 Reuters 独立验证。(Reuters)

同时，Meta还在向其他Neocloud购买算力。我们在去年3Q25 META Preview中就提到过META正在向NeoCloud寻求购买3GW算力。

所以表面上看，这里确实有一个矛盾：如果 Meta 自己已经有多余算力，为什么还要继续向 Crusoe 租 1.6GW？

我们的理解是，这不是矛盾，而是算力代际切换。

过去两年，Meta 已经采购和部署了大量 H100/H200。这些 GPU 不是没价值，恰恰相反，它们对 inference、fine-tuning、企业模型服务、图像/视频生成、传统 ML workload 仍然非常有价值。但对于下一代 frontier model training，尤其是 3T+ 参数规模的 MoE、长上下文、多模态和 RL-heavy post-training，H100/H200 的训练经济性会明显下降。

关键不是 H100 不能训练，而是单位有效 token 成本变差。

当模型进入 3T+ 规模后，瓶颈不再只是单卡 FLOPS，而是 HBM 容量/带宽、GPU 间通信、scale-up 网络、checkpoint/restart、expert routing、sequence parallel、pipeline bubble、以及大规模 collective communication。H100 集群当然还能跑，但训练 wall-clock 更长，通信开销更高，集群利用率更难维持，最终表现为同样训练一个 frontier model，成本和时间都不如 GB200/GB300，未来更不如 Vera Rubin。

因此，Meta 现在面对的是一个很典型的资产配置问题：

最先进的 GB200/GB300/Rubin，要优先留给下一代模型训练；上一代 H100/H200，则应该尽量转成 inference 或外部商业化收入。

这也是为什么”做 NeoCloud”和”继续租 Crusoe 1.6GW”可以同时成立。

Meta 继续向 Crusoe 锁定 1.6GW，本质上是在为更长期、更先进、更大规模的 AI infrastructure 做准备。这种资源对于 Meta 来说，更多是未来 GB200/GB300/Rubin 时代的战略性产能，而不是简单补 H100 的缺口。

另一方面，Meta 既然已经买了大量 H100/H200，就不可能让这些资产在 frontier training 代际切换后闲置。Meta 内部当然有广告、推荐、内容排序等大量推理 workload，但这和 OpenAI/Anthropic 那种直接面向外部客户卖 token 的 LLM inference 业务并不完全一样。Meta 如果没有足够多可以直接 monetization 的外部 token demand，把 H100/H200 做成 cloud capacity 或 hosted model API 对外销售，是非常合理的资本回收方式。

这其实和 xAI / SpaceX 的思路有相似之处。xAI 今年公开宣布与 Anthropic 达成 compute partnership，向 Anthropic 提供 Colossus 1 算力；xAI 官方称 Colossus 1 包含超过 22 万张 NVIDIA GPU，包括 H100、H200 和 GB200，并可支持 training、fine-tuning、inference 和 HPC workload。(xAI) 这说明即使是 frontier AI 公司，也可能把一部分已有 GPU fleet 对外出租，同时把最新、最稀缺、训练效率最高的下一代集群保留给自己的 frontier model。

所以今天市场担心”Meta 进入 NeoCloud 会打垮所有 NeoCloud”，我们觉得有些过度。

更准确的判断应该是：

AI 算力市场正在从单一的 GPU shortage，进入多代 GPU 分层定价和分层使用阶段。

第一层是最新训练算力：GB300、Rubin，以及后续更大 scale-up domain 的系统，主要服务 frontier model training。这部分供给仍然稀缺，客户仍然会向 Crusoe、CoreWeave、Nebius、Oracle、Microsoft 等各类供应商锁产能。

第二层是上一代高端算力：H100/H200/部分 GB200，更适合 inference、fine-tuning、enterprise AI、hosted model、agent workload 和中小模型训练。这部分不是没有需求，而是从”最稀缺的训练资源”变成”可以规模化商业化的推理资源”。

第三层是更通用的 GPU cloud 和 long-tail enterprise workload，对价格更敏感，但需求弹性也更大。

在这个框架下，Meta 的行为其实很合理：它不是停止建设 AI infrastructure，而是在把不同代际的 GPU 放到最适合的经济用途上。

因此，我们不认为这是 AI infrastructure 的大问题。真正重要的判断是：下一代 frontier model training 对 GB200/GB300/Rubin 的需求仍然非常强；同时，H100/H200 这类上一代 GPU 也不会被废弃，而会进入 inference monetization 和外部算力销售阶段。

这对整个 AI supply chain 的含义反而是：

GPU fleet 开始变成多代际资产，而不是一次性训练工具。旧 GPU 不归零，新 GPU 继续稀缺。Meta 做 NeoCloud，不是需求崩了，而是算力资产终于开始金融化和商业化。

Meta 做 NeoCloud 与继续租 Crusoe 1.6GW，并不矛盾

今天盘前，Meta 被报道正在考虑把多余 AI 算力对外商业化，甚至做成类似 NeoCloud 的业务。市场第一反应非常剧烈：Meta 盘前上涨接近 6%，但 AI算力和neocloud相关股票则受到负面Narrative影响，市场担心的是：如果 Meta 也开始把 GPU 算力对外卖，是否会直接导致算力过剩？