【东方通信-半导体】CPU是Agent推理的核心增量环节,或催生亿颗服务器CPU需求
1、Agent推理的核心要求是极低延迟与复杂编排。极低延迟:对于数百步的Agent任务,每步延迟多10s,整个任务用户需要等待多30分钟以上,用户体验被极大破坏。根据《a cpu-centric perspective on agentic ai》,复杂Agent任务中90.6%的延迟集中在CPU,因此Agent延迟的降低必须依赖CPU性能与数量的提高;复杂编排:Agent包括思考+执行,任务执行的过程是数百步复杂的流程规划与工具调用,本质是一连串的逻辑处理。Chatbot重思考,最底层是数十万行简单的矩阵乘法运算。GPU芯片包括数万颗核心,每颗核心都可以做1+1=2的简单计算,但对复杂计算无能为力。CPU单颗100多个核心,每个核心都能做高等数学,非常匹配Agent的复杂逻辑处理,因此Agent任务必须依靠更多更强的CPU。
2、服务器CPU远期需求在2亿颗。假设未来全球Agent用户数10亿人,每人单日执行20次Agent任务,每次Agent任务交由5个子Agent执行(加速执行速度),对应1000亿次Agent执行。每次执行对应0.5颗CPU核心(CPU单核对应双线程),远期需要500亿颗CPU核心,假设单颗CPU核心数256颗,大概对应2亿颗CPU需求(对应外资行CPU与GPU配比10:1)。我们的假设仍然保守,10亿日活的假设仍然是互联网思维,未来的时代是Agent与Agent的交互,交互频率较人类用户数量级增长,未来的CPU需求只会更多。
3、坚定看好CPU产业趋势,大行情刚刚起步。每次大模型范式的变化都会带来极强的新一轮硬件产业趋势,2023-2024年的Chatbot时代,大模型智能是核心,产业需要更多更强的GPU以适配更聪明的大脑,英伟达市值从5000亿美金增长至3万亿美金;2025年,大模型记忆是核心,产业需要天量存储匹配AI大模型生成的数据,三星市值1年翻3倍,SK海力士市值1年翻4倍;Agent时代,极低的推理延迟与复杂的逻辑编排是核心,CPU是最核心的受益环节之一,我们长期看好服务器CPU的产业趋势。
投资建议。英特尔、AMD、高通;海光(国产CPU)、杰华特(DRMOS)、澜起(配套DDR的内存接口芯片)。
联系人:舒迪/刘梦磊
