2026世界杯赛事竞猜中国官网

热点资讯

世界杯直播

你的位置：2026世界杯赛事竞猜中国官网 > 世界杯直播 >

专业赛事推荐平台 Google I/O 2026 不打模子仗了

发布日期：2026-05-23 08:28 点击次数：179

专业赛事推荐平台 Google I/O 2026 不打模子仗了

文：王智远 | ID:Z201440

Google I/O 2026 就这样开结束。

两个小时，几十个居品更新，一股脑全砸出来。今天翻开自便一家科技媒体都能看到居品清单，我就别随着念了。

我想说的是另一件事：

Pichai 在 keynote 上放了张图，Google 里面各居品每月处理的 token 量，2024 年 5 月 9.7 万亿，客岁 I/O 的时候 480 万亿，本年到了 3.2 千万亿。一年，翻了 7 倍。

你别以为是用户变多，Google 核心居品的用户量级一年下来根本没变，并吞批东谈主，初始用 AI 作念以前根底不会作念的事，这是看懂整场 I/O 最要道的一把钥匙。

Google 此次发的统统东西，模子、Agent、搜索升级、订价疗养、基础法子，都在追一个观念：

把 Agent 跑起来的成本压到一条线以下，然后，用我方最大的成本，把它塞进十几亿东谈主每天都在用的居品里。

这场游戏限定，跟往时两年的模子竞赛，不一个门路。

Pichai 此次把一个模子推到了 keynote 最中间。最低廉的阿谁。

Gemini 3.5 Flash，名字里就带 Flash；按 Google 我方的居品线逻辑，这是轻量款，不是旗舰。旗舰是 3.5 Pro，还没发，Pichai 说夏天见，原话是「里面也曾在用，还在打磨」。

先上的却是 Flash，况且给了最中间的位置，排序自己即是立场。

我翻了翻它的基准测试：

3.5 Flash 在 Terminal-Bench 2.1 上跑出 76.2%，3.1 Pro 是 70.3%。

在 GDPval-AA 这个成心商量「真实经济价值任务」的基准上，3.5 Flash 拿了 1656 Elo，3.1 Pro 是 1314。MCP Atlas 器具调用基准，83.6%。

翻译成东谈主话即是：

一个轻量款模子，在编码和 Agent 任务上，把自家上一代旗舰全干翻了。

这种事以前险些不会发生，Flash 和 Pro 之间一直有明确的智商代差，你选 Flash 即是要拿智商换速率和价钱。3.5 Flash 把这个默许假定砸碎了。

速率这边更夸张，Pichai 在台上报了个数：

每秒输出 289 个 token，是其他前沿模子的 4 倍；在 Antigravity 2.0 里跑优化版块，能到 12 倍，订价每百万 token 输入 1.5 好意思元，输出 9 好意思元。

我算了一下，比 3.1 Pro 的输入价钱低 40%，输出也低 40%。淌若再用上缓存，长凹凸文场景下的本体成本还能再降一个台阶。

这些数字单看都是参数，放一皆看，就讲了一件事：Agent 的角落运行成本，到了一个新的量级。

Pichai 我方把账算给了在场的东谈主听，大意是，一家头部企业每天处理一万亿 token，把 80% 的负载从其他前沿模子迁到 3.5 Flash，一年能省进步 10 亿好意思元。

这是给 CIO 看的财务测算。

Google 我方也曾是最大的受益者，本年 3 月，Google 里面每天处理 5000 亿 token。当今这个数进步 3 万亿，每隔几周翻一倍。

增长的来源就一条：

工程团队全面切到 Antigravity 加 3.5 Flash 的设备经过之后，蓝本跑不起的任务，须臾跑得起了。

这就回到了开头说的数据，token 挥霍一年翻 7 倍，是成本降到某条线以下之后，用法我方长出来的。

3.5 Flash 的意旨，不在于「又一个更强的模子」，它真实作念的事，是把 Agent 从「本领上可行」推到了「经济上可行」。

往时两年寰球聊 Agent，聊能不可作念获取；这个模子一出来，问题变了，造成谁能把它铺出去。

谁能把 Agent 铺出去，Google 的第一个回答叫 Gemini Spark，一个 24 小时挂在云霄的个东谈主智能体。

你条记本合上，手机锁屏，它还在后台干活，底层跑的是 3.5 Flash，框架是 Google 里面的 Antigravity Harness，部署在 Google Cloud 的专用虚拟机上。

进口就在 Gemini 讹诈里，9 亿月活用户，翻开就能摸到，Google Labs 的副总裁 Josh Woodward 在台献技示了几个场景：

给雇主发周报，Spark 我方去你的邮箱、文档、表格、演示文稿里把事实拉出来，用你的口吻写好草稿。

办邻居约会，Spark 追踪谁回复了谁没回，自动在在线表格里建一个及时更新的 RSVP 表，给没回的东谈主草拟催促邮件。

听起来都是小事，这些小事值得讲，因为全程不需要你盯着。

B体育官方网站首页入口

第一批接入的第三方器具是 Canva、OpenTable、Instacart，走的是 MCP 契约。

道理是 Spark 不单帮你在 Google 自家居品里跑腿，它还能帮你订餐厅、下单买菜；接下来几周会敞开更多第三方接入，夏天还会加 Chrome 浏览器集成和 macOS 土产货文献拜访。

敞开节律值得疑望，Spark 当今只给受信任测试者用，下周以测试版推给好意思国的 AI Ultra 订阅用户，是一层一层放。

这个节律背后藏着一个问题：用户凭什么把邮箱、日期、购物车交给一个 AI。

Google 此次成心花了时候讲这件事，Spark 在作念什么，每一步都展示念念考轨迹，用户随时不错打断；本质敏锐操作之前会停驻来征求许可，比如要发一封邮件、订一个日期会议，它会先问你一声。

Woodward 的原话里还有一句：

你不需要一直开着电脑阐述它在跑，这句话既是居品特质，也在恢复用户心里阿谁不安。

Spark 是抵消费者的回答。对企业的回答是 Antigravity 2.0；Antigravity 1.0 客岁 11 月发的，定位是智能编程环境，对标的是 Cursor，用了半年，Google 说也曾非凡百万设备者。

2.0 此次换标的了，它从编程器具造成了多智能体编排平台；具体分三层：

第一层，一款舒适桌面讹诈，Google 管它叫「与智能体交互的核心」。

你不错同期起多个智能体，一个写代码，一个生制品牌素材，一个作念居品架构，并行跑，互不烦嚣；还能设定计较任务，让智能体按期间表自动在后台本质。

第二层，Antigravity 敕令行器具，给俗例待在终局里的设备者用；这个器具奏凯取代了之前的 Gemini 敕令行，6 月 18 日旧版停服，所灵验户必须迁徙。

第三层，Antigravity SDK。

这一层是要道。Google 给的评释是，SDK 让外部设备者不错用编程方式调用驱动 Google 自家居品的并吞套智能体框架，跟 Gemini 模子协同优化，部署在我方的基础法子上。

翻译一下：

Google 试着把我方里面正在用的智能体基础法子，以 SDK 的阵势交到设备者手里，这是对 Claude Code 和 Codex 的正濒临位。

Antigravity 这条线底下还有一个单独发布，叫 CodeMender；一个安全智能体，用 Gemini 的推明智商自动发现并栽培要道代码缝隙，奏凯动笔改代码，不仅仅论说问题。

Google 的逻辑很直白：智能体写的代码越来越多，安全就得跟上，安全自己也得由智能体来作念。

把 Spark 和 Antigravity 2.0 放在一皆看，Google 作念的事情就很知晓了。

消费者这边，一个 24 小时在线的个东谈主智能体，接着 9 亿月活的 Gemini 讹诈落地；企业这边，一个从编程器具进化成编排平台的设备者器具，附带 SDK 和敕令行，奏凯竞争 Claude Code。

两条路同期铺，2026世界杯赛事竞猜中国官网中间跑的都是并吞个引擎，3.5 Flash。

是以，谷歌的解法是：准备两条腿一皆跑，消费者和设备者一个都不放。

铺出去之后，智能体往哪跑？说出来细目惊到下巴，谜底藏在 Google 最老的阿谁居品里：搜索。

Google 我方给此次搜索框校阅下的界说是「符号性搜索框 25 年来最大的一次升级」；智远觉得，这话有营销因素，但看完具体更动之后，如实不是小修小补。

先说一个数据：

AI Mode 客岁 I/O 才发布，一年时候月活过了 10 亿。上线以来每个季度查询量翻一倍，上季度 Google 搜索的总查询量创了历史新高。

这个数字反直观，往时几年行业里一直有个叙事：

AI 聊天机器东谈主会蚕食搜索，本体发生的正好反过来；东谈主们发现搜索能作念更多事之后，搜索量不降反升，况且涨得很猛。

新搜索框的变化从交互层就初始了，它会随着你输入的内容自动蔓延，容纳更长更白话化的问题。

蓝本的自动补全换成了一套 AI 驱动的查询提议系统，是帮你想知晓你到底想问什么，同期赈济多模态输入，翰墨、图片、视频、Chrome 标签页都能往里丢。

AI Overviews 和 AI Mode 此次合到一皆了，你问一个问题，看到 AI 概览，奏凯在原页面追问就滑入 AI Mode，凹凸文持续，越聊越深，保举的相连和来源也越来越精确。5 月 19 日全球同步上线。

这些都是居品层面的更新，真碰巧得疑望的是搜索框里长出来的智能体。

Google 管它叫信息智能体，你不错在搜索里创建一个冒失多个后台智能体，24 小时帮你盯着某件事。

比如：

你让它追踪某个领域的市集变动，智能体会我方制定监控计较，决定该用哪些数据源，包括 Google 的及时金融数据、新闻、博客、酬酢帖子，要求触发的时候合成一份带相连的更新推给你，今夏上线，先给 AI Pro 和 Ultra 订阅用户。

再往前一步，搜索里还接入了 Antigravity 的编程智商。

Google 管它叫生成式界面，你搜一个问题，搜索不单给你谜底，还能现场给你生成一个可交互的迷你讹诈。

台献技示的例子是一个个性化健身讹诈，能接入及时天气、读你的日期、知谈你的饮食偏好，自动生成饮食计较并附带食谱相连。

这是搜索在帮你造东西。搜索除外，智能体也在进 Google 的其他居品。

Daily Brief 是 Gemini 讹诈里的第一个开箱即用的智能体。每天早上帮你整理收件箱、日期和待办，排好优先级，给出下一步提议。

它的前身是客岁 12 月在 Google Labs 上线的一个实验名目 Cici，很快成了最受接待的实验之一，此次直接管编进了负责居品线。

和解购物车是购物场景的智能体，一个跨 Google 搜索、Gemini 讹诈、YouTube、邮箱责任的和解购物车，能追踪降价、监控库存、稽查价钱历史，以致能发现你买的电脑配件之间的兼容性问题。

Ask YouTube 从新界说了视频搜索，你问一个问题，它不给你一行视频列表让你我方翻，而是奏凯跳到最关系的阿谁视频里最关系的阿谁片断。

把这些更新摊开看，一个论断就浮出来了。

模子竞赛时，比谁的基准分数高，纯 AI 公司和平台公司站在并吞皆跑线上。

智能体竞赛的逻辑完满不同，智能体要推敲真实的邮箱、日期、文档、购物车、搜索历史、视频库，谁手里有这些东西，谁就有先天上风。

Google 有 13 个居品进步 10 亿用户，5 个进步 30 亿。这不是本领能补的差距。

Anthropic 和 OpenAI 不错作念出很好的模子，不错作念出很好的智能体框架；它们作念不出邮箱，作念不出搜索，作念不出 YouTube。

这是 Google 在智能体期间最大的成本，亦然这场 I/O 真确凿讲的故事，模子再强也拼不外管谈有多粗。

管谈粗，得有东西在底下撑着。

Pichai 在 keynote 后半段把话题转到了基础法子，开头就甩了一个数字：2022 年 Google 的资本开支是 310 亿好意思元，本年瞻望 1800 到 1900 亿。6 倍。四年时候。

这笔钱的一大块砸在了自研芯片上，Google 发布了第八代 TPU，第一次作念了双芯片单干。

TPU 8t 专作念磨练，原始算力接近上一代的 3 倍；TPU 8i 专作念推理，速率拉满，两颗芯片的性能功耗比都提高了约 2 倍。

磨练这边还有一个值得单独讲的变化。

Google 我方搞了一套磨练辗转框架，磨练任务能跨好几个数据中心跑，全球辗转进步 100 万颗 TPU。Pichai 管这叫「宇宙上最大的磨练集群」。

这意味着磨练不再被一个机房的物理上限卡住，模子越来越大，磨练周期从几个月压到几周。

推理这边，TPU 8i 的辩论标的就一个字，快。Pichai 原话提到，Google 作念了 27 年搜索，学到的最深的一课即是蔓延很蹙迫。

3.5 Flash 每秒 289 个 token 的输出速率，底下撑着的即是这套推理芯片。

把上头几段的逻辑串起来：3.5 Flash 的速率和价钱不是诬捏来的，是 1800 亿好意思元的资本开支、自研芯片、全球散播式磨练集群共同托出来的。

纯 AI 公司不错在模子层追上来，基础法子层想追上，难度高了一大截。这是另一层「管谈」。

终末一块拼图是 Gemini Omni，这趴是 DeepMind 的 CEO Demis Hassabis 亲身上台讲的，重量够重。

Omni 闪耀啥？你给它什么，它给你什么，先从视频初始，以后图片和翰墨也会跟上来。

第一款上线的叫 Gemini Omni Flash，5 月 19 日初始在 Gemini 讹诈、Google Flow 和 YouTube Shorts 里能用，统统生成的内容自带水印。

3.5 Flash 不休的是「让智能体跑起来」，Omni 指向的是更远的事：让 AI 不光会写字，还会造东西。

Omni 不是一个舒适的新东西，以前 Google 的 Veo 管视频生成，Nano Banana 管图片剪辑，各管各的，互不搭嘎；Omni 把这些全塞进 Gemini 一个框里了。

你上传一段我方拍的视频，说一句话让它改，它就能改里面正在发生的事，加个东谈主进去，换个立场，时候线还给你接得上。

冒失你纯用翰墨形色一个观念，Omni 奏凯给你生成一段带画面带声息的视频。

这个智商单看是个很强的演示，放回整场 I/O 的逻辑里看，它在讲一件更大的事。

我翻了一下时候线：

本年 4 月 29 日，OpenAI 把面向消费者的 Sora 2 讹诈关了，只留了付费 API；意义是基础法子成本和分发战略要疗养。11 天之后，Google 的 Gemini 讹诈里初始出现 Omni 的影子。

并吞个标的，一家因为扛不住成本退了一步，另一家采用往前走。

两家濒临的本领勤苦差未几。判袂在哪？Google 有自研的 TPU 推理芯片压成本，有 Gemini 讹诈 9 亿月活摊派算力，有 YouTube Shorts 这种现成的台子来消化视频生成的产能。

OpenAI 莫得；这不单谁的模子更好的问题，是谁的结构撑得住。

把整场 I/O 重新到尾串一遍，Google 讲的就一件事：

模子层，3.5 Flash 用速率和价钱把智能体的成本压到谁都接得住的位置。

居品层，Spark 给凡俗东谈主，Antigravity 2.0 给法子员，搜索里长出来的智能体和生成式界面把搜索造成了进口，和解购物车把智能体塞进了真实来去。

基础法子层，1800 亿好意思元的资本开支、第八代 TPU、百万颗芯片的磨练集群在底下兜着;每一层都不是孤苦存在，属于一个系统里的不同齿轮。

Pichai 在 I/O 前的小领域雷同里说过一句话：

咱们为什么这样执着于作念出既强又快又低廉的前沿模子，因为咱们要把它带给尽可能多的东谈主。这是咱们真实会发光的场所。

这句话的潜台词不难读，Google 觉得智能体期间的终局，是谁能把好的模子、大的管谈、深的地基绑在一皆，让智能体真是跑进凡俗东谈主的生涯。

往时两年，纯 AI 公司掌持着行业叙事的主场，这场 I/O 之后，一个老问题值得从新想想：

当竞争从「作念出最佳的模子」造成「让智能体跑进真实生涯」，窗口在给谁翻开专业赛事推荐平台，又在给谁关上。