【国盛计算机臻选】Gemini 3.5 flash/Omni/Spark三连发,谷歌I/O大会速递
☀️Gemini Omni首发,原生多模态生成实现”阶跃变化”。谷歌发布Gemini Omni,支持图片、音频、视频、文字任意组合输入,直接生成高质量视频输出。Hassabis称其突破了以往系统在重力、动能等物理概念模拟上的翻车问题,将Gemini的”世界知识”与”推理能力”注入视频生成。现场演示中,一句”用粘土动画解释蛋白质折叠”即可生成科学准确、视觉精致的定格动画;自拍视频可随手魔改(画圈变黑洞、街道变赛博朋克),且支持多轮对话式编辑。
☀️Gemini 3.5 Flash碾压前代旗舰,编码与Agent能力断层领先。3.5 Flash在多项benchmark上胜出三个月前发布的3.1 Pro,且输出速度较快,比GPT-5.5和Opus 4.7快4倍以上。3.5 Flash已同步成为Gemini App和Google搜索AI Mode的默认模型。
☀️Agent基础设施与个人AI管家同日升级,生态闭环加速。
Antigravity 2.0从IDE升级为独立桌面应用,支持子Agent动态生成与并行执行、异步任务管理、Scheduled Tasks定时任务等新特性,内部日处理token量从3月5000亿飙升至3万亿。Gemini Spark定位为”个人AI Agent”,基于3.5+Antigravity框架、跑在云端专用虚拟机,7×24小时后台执行跨Gmail/Docs/Sheets/Slides任务,支持自定义skills与语音多任务并行。
☀️我们认为,谷歌一夜之间补齐”全模态理解+全模态生成+全天候Agent”三块拼图,模型层(Omni/3.5 Flash)、Agent基础设施层(Antigravity 2.0)、应用层(Spark)三线齐发,其竞争策略已从”追赶OpenAI”转向”以工程化速度+生态整合能力重新定义ASI入口”。国内大模型厂商面临的竞争将从”单点模型对标”升级为”模型+Agent平台+生态”的全栈竞争,建议持续关注Agent开发平台及多模态生成相关产业链。
风险提示:AI技术迭代不及预期;AI应用商业化落地不及预期;宏观经济波动的风险。
联系人:孙行臻,陈泽青。
