📌📝与 Token 相关的投资者争议探讨
💡几周前我们发布的 Token 优化专题研报,引发了大量投资者围绕该主题展开交流,本章节我们将梳理各类市场争议,并分享我们目前尚且初步的研究观点。
📊📌量化 Token 增速放缓幅度
🤔我们有充分依据得出结论:各大公司落地的大量 Token 优化举措会形成叠加效应,正如本篇报告与两周前发布的报告所提及,该行为至少会阶段性压制整体 Token 消耗的增长曲线。
❓但放缓幅度有多大、持续多久,这是难以精准回答的核心问题,当下行业内可参考的 Token 消耗可靠数据十分稀缺。
📌坦白来说,我们对接的很多机构甚至不清楚自身的 Token 支出规模,而随着 Token 监控类软件持续迭代,这种数据透明度缺失的问题终将得到解决。
📞我们和多位投资者沟通交流,对方均引用某投资机构发布的《Tokenomics》研究报告;该报告完整阐述了 Token 优化行业大趋势,点明市场向低成本模型切换的结构变化(和我们此前观点一致),同时尝试量化测算 Token 消耗增速的回落幅度。
🔍目前我们尚未建立一套精准、标准化的方法体系,用于追踪、测算 AI Token 消耗量,因此现阶段我们只能依靠客户调研、与算力服务商沟通获取的定性反馈做判断,Databricks 将本轮变化形容为 “一次显著的增速颠簸”。
🧮我们做出最优情景估算:多数推行 Token 精简优化的机构,此前每月 AI Token 支出为 100 美元,原本预计数月后将上涨至 150 美元;而各类关于 Token 优化的行业反馈显示,优化落地后该支出大概率会落在120 至 130 美元区间。
⚠️我们并未收到任何 “大幅削减 Token 使用” 的市场观点,因此并不认为原本 100 美元的支出会回落至 80 美元。
📈下图为这类 Token 精简优化机构的 Token 消耗变化趋势示意图:
图表横轴代表时间,纵轴代表 Token 消耗量;曲线前期快速上行,在 Token 优化落地节点后增长斜率阶段性走缓,后续再度恢复上行走势。
💭然而,无论企业客户选择部署哪一类模型,它们始终都需要云端部署的推理算力资源。
🗣或许会有人提出反驳观点:为完成相同业务任务,市场全面切换至成本更低、Token 消耗更少的 AI 模型,会直接减少 Token 使用量,进而降低超大规模云服务商的算力需求。
✅这个观点本身成立,但该影响会被另一客观事实完全抵消:超大规模云服务商与新兴云服务商当前面临极度失衡的供需格局,市场对 AI 算力资源的需求近乎无限。
📌除此之外,有逻辑可以合理推断:当下定价偏高的头部前沿 AI 实验室,正面临低价模型带来的激烈竞争;它们大概率会复刻此前应对 DeepSeek 冲击时的操作,进一步加码训练基础设施投入,布局下一代芯片、迭代优化算法,以此压低单位 Token 成本,同步下调终端定价。
📈显而易见,这一发展方向会为它们的算力合作服务商带来长期利好。
📌客户对 AI 成本敏感度提升,引发 AI 云基础设施服务商份额争夺的重要市场争议
📈随着客户群体对 AI 使用成本的敏感度大幅上升,市场诞生了一项关注度极高的投资者议题:各大 AI 云基础设施服务商的市场份额或将迎来重构。
⚖️在其他条件保持不变的前提下,客户对价格、Token 成本的关注度提升,会利好单位 Token 成本更低的服务商。
🏢多数投资者认为,谷歌云、AWS具备显著优势,核心依托自研芯片(TPU、Trainium 芯片)与自研大模型(谷歌 Gemini)构筑成本壁垒。
🤔想要推翻这套逻辑存在一定难度,但存在两点反向论据:
a) 当前市场算力需求近乎无限,谷歌云与 AWS 大概率不会选择下调 AI 算力定价,放弃自身成本优势;
b) 微软正加速补齐自身短板,自研专用芯片与 AI 大模型,缩小与前两者的差距。
📌🇨🇳中国大模型服务商板块分析
📈市场向低成本国产模型倾斜、企业愿意尝试国产模型的行业趋势,显然会利好阿里巴巴(通义系列模型)、智谱 AI(GLM 系列模型),同时也利好 MiniMax、深度求索、月之暗面(Kimi 模型)等公司。
📌这类国产模型大多开源免费,商业化变现的盈利空间相对有限,但行业或将出现更多类似宝马与阿里巴巴达成的通义模型商用合作协议。
⚠️部分投资者提出疑问:企业大规模切换至国产 AI 模型,是否会引发美国政府的干预或限制措施?
📰投资者援引近期新闻:Airbnb 使用阿里巴巴通义大模型搭建客户智能客服,美国政府已就此发起调查。
📉结合 Airbnb 案例来看,该风险客观存在,但我们的观点是:目前美国本土机构使用国产 AI 模型的场景已经十分普及,美国政府很难从实操层面全面限制相关使用行为。
✅尤其是美国本土公司在可控环境(本地私有化部署、AWS / 微软 Azure 云端托管)中部署国产模型时,监管干预的难度会进一步提升。
📌Meta 开源 Llama 大模型板块分析
📊此前我们提到,瑞银科技团队大约每半年发布一份企业 AI 行业调研,2026 年 5 月最新一期报告基于 2026 年 3 月回收的企业问卷完成统计。
🔎本次调研覆盖约 130 家企业,调研问题为企业正在搭建业务所用的 AI 模型;调研数据显示,企业选型高度集中于全球三大前沿 AI 实验室。
🏆在开源模型赛道中,Meta 开源 Llama 模型的选用占比最高,市场份额达 16%;深度求索与其他国产模型合计份额仅 8%,我们预计下一轮调研中国产模型的份额会进一步攀升。
📌一个值得关注的现象:根据我们近期客户走访,企业在面对超出预期的高额 AI 成本、转向低成本开源模型时,选择通义、深度求索模型的比例,远高于 Meta 开源 Llama 模型。
💡表面来看,Meta 本有机会迭代优化 Llama 系列模型、对外商业化变现,但 Meta 明确选择了截然不同的发展路线:逐步缩减开源 Llama 资源投入,转而重金自研闭源专属 Muse Spark AI 模型,用于支撑 Meta 内部全部 AI 业务。
📌Meta 官方将这款新品定义为 “公司全栈 AI 体系重构后的首款产品”。
📉Meta 战略转向后,AI 模型市场出现供给缺口,而国产开源模型、各大厂商推出的轻量化小模型(其中包括微软数周前刚发布的产品),顺势填补了这片市场空白。
