【开源海外|阿里云峰会要点】芯云模一体,构建Agentic时代基础设施
– 2025年,智能体定义发生巨大变化,能够独立完成诸多人类无法完成的任务,企业愿意为智能体解决实际问题的能力付费,正式迈入agentic时代。关键要素包括自主规划、调用工具、记忆管理、反思迭代、多体协作。衡量AI从看重流程执行变为看重业务结果完成,且能实现人类过去难以执行的场景。
(1)基础设施:agentic cloud要求云计算从资源调度转向任务调度;为Agent打造全新工具体系;推理服务需高吞吐、低延迟、稳定性高,阿里云全栈就绪,正建设中国AI工厂;在预训练阶段,阿里云灵骏集群支持单集群10万卡规模,万卡线性扩展效率大于96%;后训练阶段支持微调(finetune)和代理强化学习(agentic rlvr);推理阶段优化网络、KV cache、算力支持和调度。
(2)应用方向:Agent应用层将阿里巴巴全域服务MCP化和skill化封装,推出Coder工具和应用化产品;模型服务层通过上下文缓存、调优和强化学习、安全治理等提升性能。
(3)模型升级:千问3.7夯实知识和逻辑基础能力,全面升级原生的agentic能力,在全球权威榜单上名列前茅。工具调用:实现从语义理解到真实业务行动的升级,在多步规划、表格控制等评测上领先全球;编程能力:从简单代码补全发展到覆盖软件开发全生命周期,能解决代码缺陷,支持主流harness框架;视觉能力:实现视觉编程,在移动端操控、图表解析等评测中位居中国第一,全球机构排名第五;多模态融合:推出omni模型,实现文本、语音、视觉能力原生融合,提供高可靠流式交付能力和Live Translate功能。
(4)平头哥芯片
-芯片适配:阿里巴巴已将真武PPU大规模用于千问大模型的训练和推理,真武AI芯片在Day 0提供千问模型服务,与云团队和模型团队深度协同,加速上线,以最快速度和最优性价比服务客户。
-商业落地:截至26年4月,真武芯片出货56万片,服务20多个行业、400多家客户,在智驾、金融等行业大规模部署,单机推理性能平均提升50%以上。
-技术特点:全端到端全自研,算力、显存带宽等指标保持行业前沿,易用性强;软件栈THead Seal提供统一编程接口,兼容性出色且迭代频率快。
-后续规划:未来真武芯片将提速到一年一代,继26年上市的M890之后,2027年Q3将上市V900芯片,2028年Q3将上市G900芯片。V900芯片性能将有3倍提升,配备216GB显存和1200GB带宽。
