你的位置:2026世界杯赛事竞猜中国官网 > 世界杯直播 >
发布日期:2026-05-23 08:28 点击次数:179


文:王智远 | ID:Z201440
Google I/O 2026 就这样开结束。
两个小时,几十个居品更新,一股脑全砸出来。今天翻开自便一家科技媒体都能看到居品清单,我就别随着念了。
我想说的是另一件事:
Pichai 在 keynote 上放了张图,Google 里面各居品每月处理的 token 量,2024 年 5 月 9.7 万亿,客岁 I/O 的时候 480 万亿,本年到了 3.2 千万亿。一年,翻了 7 倍。
你别以为是用户变多,Google 核心居品的用户量级一年下来根本没变,并吞批东谈主,初始用 AI 作念以前根底不会作念的事,这是看懂整场 I/O 最要道的一把钥匙。
Google 此次发的统统东西,模子、Agent、搜索升级、订价疗养、基础法子,都在追一个观念:
把 Agent 跑起来的成本压到一条线以下,然后,用我方最大的成本,把它塞进十几亿东谈主每天都在用的居品里。
这场游戏限定,跟往时两年的模子竞赛,不一个门路。
01
Pichai 此次把一个模子推到了 keynote 最中间。最低廉的阿谁。
Gemini 3.5 Flash,名字里就带 Flash;按 Google 我方的居品线逻辑,这是轻量款,不是旗舰。旗舰是 3.5 Pro,还没发,Pichai 说夏天见,原话是「里面也曾在用,还在打磨」。
先上的却是 Flash,况且给了最中间的位置,排序自己即是立场。
我翻了翻它的基准测试:
3.5 Flash 在 Terminal-Bench 2.1 上跑出 76.2%,3.1 Pro 是 70.3%。
在 GDPval-AA 这个成心商量「真实经济价值任务」的基准上,3.5 Flash 拿了 1656 Elo,3.1 Pro 是 1314。MCP Atlas 器具调用基准,83.6%。

翻译成东谈主话即是:
一个轻量款模子,在编码和 Agent 任务上,把自家上一代旗舰全干翻了。
这种事以前险些不会发生,Flash 和 Pro 之间一直有明确的智商代差,你选 Flash 即是要拿智商换速率和价钱。3.5 Flash 把这个默许假定砸碎了。
速率这边更夸张,Pichai 在台上报了个数:
每秒输出 289 个 token,是其他前沿模子的 4 倍;在 Antigravity 2.0 里跑优化版块,能到 12 倍,订价每百万 token 输入 1.5 好意思元,输出 9 好意思元。
我算了一下,比 3.1 Pro 的输入价钱低 40%,输出也低 40%。淌若再用上缓存,长凹凸文场景下的本体成本还能再降一个台阶。
这些数字单看都是参数,放一皆看,就讲了一件事:Agent 的角落运行成本,到了一个新的量级。
Pichai 我方把账算给了在场的东谈主听,大意是,一家头部企业每天处理一万亿 token,把 80% 的负载从其他前沿模子迁到 3.5 Flash,一年能省进步 10 亿好意思元。
这是给 CIO 看的财务测算。
Google 我方也曾是最大的受益者,本年 3 月,Google 里面每天处理 5000 亿 token。当今这个数进步 3 万亿,每隔几周翻一倍。
增长的来源就一条:
工程团队全面切到 Antigravity 加 3.5 Flash 的设备经过之后,蓝本跑不起的任务,须臾跑得起了。
这就回到了开头说的数据,token 挥霍一年翻 7 倍,是成本降到某条线以下之后,用法我方长出来的。
3.5 Flash 的意旨,不在于「又一个更强的模子」,它真实作念的事,是把 Agent 从「本领上可行」推到了「经济上可行」。
往时两年寰球聊 Agent,聊能不可作念获取;这个模子一出来,问题变了,造成谁能把它铺出去。
02
谁能把 Agent 铺出去,Google 的第一个回答叫 Gemini Spark,一个 24 小时挂在云霄的个东谈主智能体。
你条记本合上,手机锁屏,它还在后台干活,底层跑的是 3.5 Flash,框架是 Google 里面的 Antigravity Harness,部署在 Google Cloud 的专用虚拟机上。
进口就在 Gemini 讹诈里,9 亿月活用户,翻开就能摸到,Google Labs 的副总裁 Josh Woodward 在台献技示了几个场景:
给雇主发周报,Spark 我方去你的邮箱、文档、表格、演示文稿里把事实拉出来,用你的口吻写好草稿。
办邻居约会,Spark 追踪谁回复了谁没回,自动在在线表格里建一个及时更新的 RSVP 表,给没回的东谈主草拟催促邮件。
听起来都是小事,这些小事值得讲,因为全程不需要你盯着。
B体育官方网站首页入口第一批接入的第三方器具是 Canva、OpenTable、Instacart,走的是 MCP 契约。
道理是 Spark 不单帮你在 Google 自家居品里跑腿,它还能帮你订餐厅、下单买菜;接下来几周会敞开更多第三方接入,夏天还会加 Chrome 浏览器集成和 macOS 土产货文献拜访。
敞开节律值得疑望,Spark 当今只给受信任测试者用,下周以测试版推给好意思国的 AI Ultra 订阅用户,是一层一层放。

这个节律背后藏着一个问题:用户凭什么把邮箱、日期、购物车交给一个 AI。
Google 此次成心花了时候讲这件事,Spark 在作念什么,每一步都展示念念考轨迹,用户随时不错打断;本质敏锐操作之前会停驻来征求许可,比如要发一封邮件、订一个日期会议,它会先问你一声。
Woodward 的原话里还有一句:
你不需要一直开着电脑阐述它在跑,这句话既是居品特质,也在恢复用户心里阿谁不安。
Spark 是抵消费者的回答。对企业的回答是 Antigravity 2.0;Antigravity 1.0 客岁 11 月发的,定位是智能编程环境,对标的是 Cursor,用了半年,Google 说也曾非凡百万设备者。
2.0 此次换标的了,它从编程器具造成了多智能体编排平台;具体分三层:
第一层,一款舒适桌面讹诈,Google 管它叫「与智能体交互的核心」。
你不错同期起多个智能体,一个写代码,一个生制品牌素材,一个作念居品架构,并行跑,互不烦嚣;还能设定计较任务,让智能体按期间表自动在后台本质。
第二层,Antigravity 敕令行器具,给俗例待在终局里的设备者用;这个器具奏凯取代了之前的 Gemini 敕令行,6 月 18 日旧版停服,所灵验户必须迁徙。
第三层,Antigravity SDK。
这一层是要道。Google 给的评释是,SDK 让外部设备者不错用编程方式调用驱动 Google 自家居品的并吞套智能体框架,跟 Gemini 模子协同优化,部署在我方的基础法子上。
翻译一下:
Google 试着把我方里面正在用的智能体基础法子,以 SDK 的阵势交到设备者手里,这是对 Claude Code 和 Codex 的正濒临位。
Antigravity 这条线底下还有一个单独发布,叫 CodeMender;一个安全智能体,用 Gemini 的推明智商自动发现并栽培要道代码缝隙,奏凯动笔改代码,不仅仅论说问题。
Google 的逻辑很直白:智能体写的代码越来越多,安全就得跟上,安全自己也得由智能体来作念。
把 Spark 和 Antigravity 2.0 放在一皆看,Google 作念的事情就很知晓了。
消费者这边,一个 24 小时在线的个东谈主智能体,接着 9 亿月活的 Gemini 讹诈落地;企业这边,一个从编程器具进化成编排平台的设备者器具,附带 SDK 和敕令行,奏凯竞争 Claude Code。
两条路同期铺,2026世界杯赛事竞猜中国官网中间跑的都是并吞个引擎,3.5 Flash。
是以,谷歌的解法是:准备两条腿一皆跑,消费者和设备者一个都不放。
03
铺出去之后,智能体往哪跑?说出来细目惊到下巴,谜底藏在 Google 最老的阿谁居品里:搜索。
Google 我方给此次搜索框校阅下的界说是「符号性搜索框 25 年来最大的一次升级」;智远觉得,这话有营销因素,但看完具体更动之后,如实不是小修小补。
先说一个数据:
AI Mode 客岁 I/O 才发布,一年时候月活过了 10 亿。上线以来每个季度查询量翻一倍,上季度 Google 搜索的总查询量创了历史新高。
这个数字反直观,往时几年行业里一直有个叙事:
AI 聊天机器东谈主会蚕食搜索,本体发生的正好反过来;东谈主们发现搜索能作念更多事之后,搜索量不降反升,况且涨得很猛。
新搜索框的变化从交互层就初始了,它会随着你输入的内容自动蔓延,容纳更长更白话化的问题。
蓝本的自动补全换成了一套 AI 驱动的查询提议系统,是帮你想知晓你到底想问什么,同期赈济多模态输入,翰墨、图片、视频、Chrome 标签页都能往里丢。
AI Overviews 和 AI Mode 此次合到一皆了,你问一个问题,看到 AI 概览,奏凯在原页面追问就滑入 AI Mode,凹凸文持续,越聊越深,保举的相连和来源也越来越精确。5 月 19 日全球同步上线。
这些都是居品层面的更新,真碰巧得疑望的是搜索框里长出来的智能体。
Google 管它叫信息智能体,你不错在搜索里创建一个冒失多个后台智能体,24 小时帮你盯着某件事。
比如:
你让它追踪某个领域的市集变动,智能体会我方制定监控计较,决定该用哪些数据源,包括 Google 的及时金融数据、新闻、博客、酬酢帖子,要求触发的时候合成一份带相连的更新推给你,今夏上线,先给 AI Pro 和 Ultra 订阅用户。

再往前一步,搜索里还接入了 Antigravity 的编程智商。
Google 管它叫生成式界面,你搜一个问题,搜索不单给你谜底,还能现场给你生成一个可交互的迷你讹诈。
台献技示的例子是一个个性化健身讹诈,能接入及时天气、读你的日期、知谈你的饮食偏好,自动生成饮食计较并附带食谱相连。
这是搜索在帮你造东西。搜索除外,智能体也在进 Google 的其他居品。
Daily Brief 是 Gemini 讹诈里的第一个开箱即用的智能体。每天早上帮你整理收件箱、日期和待办,排好优先级,给出下一步提议。
它的前身是客岁 12 月在 Google Labs 上线的一个实验名目 Cici,很快成了最受接待的实验之一,此次直接管编进了负责居品线。
和解购物车是购物场景的智能体,一个跨 Google 搜索、Gemini 讹诈、YouTube、邮箱责任的和解购物车,能追踪降价、监控库存、稽查价钱历史,以致能发现你买的电脑配件之间的兼容性问题。
Ask YouTube 从新界说了视频搜索,你问一个问题,它不给你一行视频列表让你我方翻,而是奏凯跳到最关系的阿谁视频里最关系的阿谁片断。
把这些更新摊开看,一个论断就浮出来了。
模子竞赛时,比谁的基准分数高,纯 AI 公司和平台公司站在并吞皆跑线上。
智能体竞赛的逻辑完满不同,智能体要推敲真实的邮箱、日期、文档、购物车、搜索历史、视频库,谁手里有这些东西,谁就有先天上风。
Google 有 13 个居品进步 10 亿用户,5 个进步 30 亿。这不是本领能补的差距。
Anthropic 和 OpenAI 不错作念出很好的模子,不错作念出很好的智能体框架;它们作念不出邮箱,作念不出搜索,作念不出 YouTube。
这是 Google 在智能体期间最大的成本,亦然这场 I/O 真确凿讲的故事,模子再强也拼不外管谈有多粗。
04
管谈粗,得有东西在底下撑着。
Pichai 在 keynote 后半段把话题转到了基础法子,开头就甩了一个数字:2022 年 Google 的资本开支是 310 亿好意思元,本年瞻望 1800 到 1900 亿。6 倍。四年时候。
这笔钱的一大块砸在了自研芯片上,Google 发布了第八代 TPU,第一次作念了双芯片单干。
TPU 8t 专作念磨练,原始算力接近上一代的 3 倍;TPU 8i 专作念推理,速率拉满,两颗芯片的性能功耗比都提高了约 2 倍。
磨练这边还有一个值得单独讲的变化。
Google 我方搞了一套磨练辗转框架,磨练任务能跨好几个数据中心跑,全球辗转进步 100 万颗 TPU。Pichai 管这叫「宇宙上最大的磨练集群」。
这意味着磨练不再被一个机房的物理上限卡住,模子越来越大,磨练周期从几个月压到几周。
推理这边,TPU 8i 的辩论标的就一个字,快。Pichai 原话提到,Google 作念了 27 年搜索,学到的最深的一课即是蔓延很蹙迫。
3.5 Flash 每秒 289 个 token 的输出速率,底下撑着的即是这套推理芯片。
把上头几段的逻辑串起来:3.5 Flash 的速率和价钱不是诬捏来的,是 1800 亿好意思元的资本开支、自研芯片、全球散播式磨练集群共同托出来的。
纯 AI 公司不错在模子层追上来,基础法子层想追上,难度高了一大截。这是另一层「管谈」。
05
终末一块拼图是 Gemini Omni,这趴是 DeepMind 的 CEO Demis Hassabis 亲身上台讲的,重量够重。
Omni 闪耀啥?你给它什么,它给你什么,先从视频初始,以后图片和翰墨也会跟上来。
第一款上线的叫 Gemini Omni Flash,5 月 19 日初始在 Gemini 讹诈、Google Flow 和 YouTube Shorts 里能用,统统生成的内容自带水印。
3.5 Flash 不休的是「让智能体跑起来」,Omni 指向的是更远的事:让 AI 不光会写字,还会造东西。
Omni 不是一个舒适的新东西,以前 Google 的 Veo 管视频生成,Nano Banana 管图片剪辑,各管各的,互不搭嘎;Omni 把这些全塞进 Gemini 一个框里了。
你上传一段我方拍的视频,说一句话让它改,它就能改里面正在发生的事,加个东谈主进去,换个立场,时候线还给你接得上。
冒失你纯用翰墨形色一个观念,Omni 奏凯给你生成一段带画面带声息的视频。
这个智商单看是个很强的演示,放回整场 I/O 的逻辑里看,它在讲一件更大的事。
我翻了一下时候线:
本年 4 月 29 日,OpenAI 把面向消费者的 Sora 2 讹诈关了,只留了付费 API;意义是基础法子成本和分发战略要疗养。11 天之后,Google 的 Gemini 讹诈里初始出现 Omni 的影子。
并吞个标的,一家因为扛不住成本退了一步,另一家采用往前走。
两家濒临的本领勤苦差未几。判袂在哪?Google 有自研的 TPU 推理芯片压成本,有 Gemini 讹诈 9 亿月活摊派算力,有 YouTube Shorts 这种现成的台子来消化视频生成的产能。
OpenAI 莫得;这不单谁的模子更好的问题,是谁的结构撑得住。
把整场 I/O 重新到尾串一遍,Google 讲的就一件事:
模子层,3.5 Flash 用速率和价钱把智能体的成本压到谁都接得住的位置。
居品层,Spark 给凡俗东谈主,Antigravity 2.0 给法子员,搜索里长出来的智能体和生成式界面把搜索造成了进口,和解购物车把智能体塞进了真实来去。
基础法子层,1800 亿好意思元的资本开支、第八代 TPU、百万颗芯片的磨练集群在底下兜着;每一层都不是孤苦存在,属于一个系统里的不同齿轮。
Pichai 在 I/O 前的小领域雷同里说过一句话:
咱们为什么这样执着于作念出既强又快又低廉的前沿模子,因为咱们要把它带给尽可能多的东谈主。这是咱们真实会发光的场所。
这句话的潜台词不难读,Google 觉得智能体期间的终局,是谁能把好的模子、大的管谈、深的地基绑在一皆,让智能体真是跑进凡俗东谈主的生涯。
往时两年,纯 AI 公司掌持着行业叙事的主场,这场 I/O 之后,一个老问题值得从新想想:
当竞争从「作念出最佳的模子」造成「让智能体跑进真实生涯」,窗口在给谁翻开专业赛事推荐平台,又在给谁关上。