2026年世界杯官网 Google I/O杀疯了: 视频大模子超炸裂, 音频眼镜登台, Gemini秉承一切

千呼万唤始出来,北京时辰 2026 年 5 月 20 日凌晨,Google I/O 2026 终于开幕。因为 Google 提前用 The Android Show「分流」了 Android 17 的新功能,AI 终于成为了 Google I/O 2026 的主角。
但不同于其他 AI 企业,Google 同期掌捏 Gemini、YouTube、Google 网页搜索、Android 等多个不同的互联网生态进口。因此「如何用 AI 为这些生态处事『赋能』」,也成了这次 Google I/O 的重心。
视频模子 Omni和 3.5:新模子双王炸让 Google AI 更万能
Gemini 模子方面,Google 在 Google I/O 上崇敬发布了最新、最万能的 Gemini Omni。有多万能?用一句话来综合,即是「Gemini Omni 能从任何体式的输入,得到任何体式的输出」,且 Gemini Omni 还不错径直在生成经由中,以对话体式进行修改。

以 MV 生成为例,唯独把音乐、视频、图片素材和对画面的约莫需求「喂」给 Gemini Omni,Gemini Omni 就能径直输出对应的短视频。在行动上,Google 还演示了一个至极夸张的 AIGC 案例:
在一张白纸上手绘一个圆圈,再加上一句翰墨刻画,Gemini Omni 就能径直输出一个好意思满的殊效视频。但这还没完,若是你对画面元素或格调不安靖,唯唯一句话就能在不变动其他画面元素的情况下,精确修改指定元素,比如「把玻璃建筑替换为肥皂泡」,后者致使还领有我方的物理碰撞扫尾。

用 Google 我方的话来说,「Gemini Omni 就像是视频领域的 Nano Banana」。
把柄 Google 的先容,Google Omni Flash 模子即日起将在 Gemini App、Google Flow、YouTube Shorts 等平台上线,对应 API 将在之后开放。

除了「万能模子」Google Omni,Gemini 在 Google I/O 上也升级到了 Gemini 3.5 版块(Gemini 3.5 Flash)。和 Gemini 3.1 Pro 比较,Gemini 3.5 Flash 在编程、现实环境智能体(Real-World Agentic)、大鸿沟器具调用等测试上王人有所普及。
诚然了,关于 AI 模子而言,「有轻量级的 Flash 就势必有专科级的 Pro」——在行动上 Google 也预报 Gemini 3.5 Pro 将鄙人个月登场,但并未公布其他信息。
用一句话来总结,那即是「多快好省」四个字,Google 这次充足作念到了。
Google Antigravity、Gemini Spark:智能体重构Google搜索
底层模子才调变强了,那基于 Gemini 的 AI Agent 当然也得到了升级。

斥地者侧,Google 的 AI 斥地环境 Antigravity 也用上了 Gemini 3.5 Flash。把柄 Google 先容,在 Gemini 3.5 Flash 的营救下,Antigravity 只用了 12 个小时就搭建了一个操作系统内核,而统统斥地经由的 AI API 资本还不到一千好意思元。

Google 致使用 Antigravity 和 Gemini 3.5 Flash 重构了 Google 搜索的交互界面,提议了全新的「生成式 UI」见地。对等闲用 Google 或其他 AI 搜索引擎的一又友应该知说念,即使在搜索页面开启了 AI 模式(此处指的不是在 AI App 中以「斟酌」达成的常识库搜索),这个 AI 模式依旧是以对话框(ChatBox)的体式输出扫尾。

关于一般的 AI 搜索来说,对话框的交互模式确乎够用了。但若是用户问出的某个问题需要一些直不雅的演示,比如「陀飞轮是怎样责任的?」,文本框模式就排不上用场了。对此,Google 基于 Antigravity 的编程才调,打造了一个「自稳当、自生成」的 AI 搜索 UI。

精真金不怕火来说,濒临复杂问题时 Google 搜索会用「Vibe Coding」的形态,径直写一个不错互动的前端网页,径直以互动的形态回应用户的问题。
可惜的是,这项功能要比及 26 年夏令才会向用户开放。但好音信是,这项功能属于 Google 搜索的更新,不需要费钱订阅 Gemini 也能使用。另外,Gemini App 自身的 UI 也得到了升级,与新的 Android 视觉元素愈加和洽。
收成于 Gemini 3.5 Flash 的多模态才调,Google 搜索的 AI 预测和多模态才调也得到了普及。除了翰墨、以图搜图外,全新的 Google 搜索也不错径直输入视频或文档;也曾按照大数据智能排序的搜索推选,目下也升级成了基于 Gemini 3.5 Flash 的 AI 搜索补全。

除了前台可见的升级,Google 还全面普及了搜索 Agent 的「后台才调」:全新的 搜索 Agent 不错在后台全天开动,按照用户的条款继续监控特定信息。比如小雷在就寝前就不错让搜索 Agent 时刻崇尚 OpenAI、Anthropic、Grok、Perplexity 等 AI 企业和 X 上的 AI 新闻,在出现鉴别错过的热门时径直邮件轰炸我的手机,让我爬起来写稿。
说到 Agent,Google 还在互动上崇敬发布了面向个东说念主用户的全新 Agent——Gemini Spark。和其他 AI Agent 一样,Gemini Spark 相通不错 24×7 全天秉承用户的手机和浏览器。但不同于刻下主流的托管类 Agent,Gemini Spark 会开动在极端的虚构化环境中。

很清楚,Gemini Spark 相通由 Gemini 3.5 Flash、Antigravity 驱动,当然也营救语音交互和后台反应。而在外部联动上,Gemini Spark 不仅不错径直和 Google 生态的其他组件(Google Docs、Google Calendar、Gmail 等)径直联动,还不错通过 MCP 契约与外部 App 互联互通,达成更全面的任务托管。
Google 并未在行动中公布 Gemini Spark 的平台适配情况,雷科技预测 Gemini Spark 会以 Gemini App(iOS)、Google 搜索组件(Android)的形态登陆手机。

而在 AI Agent 开动时(不管前后台),新加入的 Android Halo 功能会在 Android 手机屏幕左上角常驻一个 Agent 情状符号,精真金不怕火用户随时跳转到 Agent 界面,嗅觉就和目下手机的「录像头领导」「麦克风领导」差未几。
在雷科技看来,Android Halo 的出现,2026年世界杯官网其实也从另一个角度强调了 Agent 的要紧性:尽管从本事上讲,Gemini Spark 仅仅一个「软件功能」,但其地位早已和录像头和麦克风一样,是手机弗成或缺的中枢构成。

电脑方面,Google 提到 Gemini Spark 将在 26 年夏令登陆 Chrome 浏览器。
但不同于豆包等部分付费的国内 AI Agent,Gemini Spark 为全订阅功能,下周会开放给 Google AI Ultra 订阅用户。
值得一提的是,为了划分企业用户和高用量个东说念主用户,Google 在原来的 AI Pro(每月 20 好意思元)、AI Ultra(每月 250 好意思元、限时降价至每月 200 好意思元)之间,稀奇加入了一个「芳华版」AI Ultra 等第(每月 100 好意思元)。

看得出,即使是「财大气粗」的 Google ,也难以靠免费模式保管这种全面 AI 带来的弘大算力资本。说到底,AI 的绝顶是算力,算力的绝顶是硬件,而硬件的绝顶是钱。在 AI 时期,互联网巨头照旧难以靠硬件销售和处事订阅来保管 AI 的资本了。
夸张点说,跟着 AI Agent 的才调进一步膨胀,付费 AI 处事很有可能会变得跟手机套餐一样,成为咱们「刚性败坏」的一部分。
音频眼镜初次登台,Gemini 硬件生态日渐完善
在旧年,Google 展示了带涌现功能的 AI 眼镜。在本年的 google I/O 上,Google 也带来了「音频版」智能眼镜的预览。最初,尽管名字叫「音频智能眼镜」,但这类 Gemini 眼镜并不是界环那种纯音频眼镜,而是搭载录像头、领有 AI 视觉和多模态输入才调的音频眼镜。
由于眼镜要 26 年秋季才发布(高概率是配合高通骁龙峰会上的新芯片),是以 Google 并未在 Google I/O 上公布分量、传感器型号、续航等居品具体信息,只展示了居品外不雅和约莫的功能。

计算方面,Google I/O 上提到了三星与 Gentle Monster、Warby Parker 两大盛名眼镜品牌配合打造的智能眼镜。功能上,两款眼镜和现存的 AR1 智能眼镜访佛,不错用语音或右边镜腿的触控板叫醒 Gemini。
收成于 Gemini 底层模子和 Spark 智能体的才调,Gemini 眼镜不错全自动把用户的语音指示拆解成 Agent 当作,并在用户的手机上后台履行。用户不错在眼镜上用语音条款 Gemini「买一杯前次点的咖啡」;手机上的 Gemini 就不错自动灵通咖啡 App、自动添加商品到购物车,并在用户语音阐述(应该和国内 AI 眼镜一样取舍声纹考证本事)后径直下单。

值得一提的是,Google 还提到 Gemini AI 音频眼镜将营救 Android 和 iOS 两个平台。不错细宗旨是,在 iOS 极为严格的 App 沙盒机制下,Gemini 音频眼镜的才和洽 Android 平台比较势必大打扣头。
为了拓展 Gemini 的才调界限,Google 也把我方的办公套件(Google Workspace)全面 AI 化:用户不错用语调子用 Gemini 查找邮件信息(Gmail Live)、写稿(Docs Live)致使是生成图像(Google Pics)。

聚首此前 Android 17 选题里提到的高端 Googlebook,谷歌本年是在不遗余力地把 Gemini 塞进我方能掌控的每一个生态硬件里。
Google I/O 的主题演讲的到这里就告一段落了,看到这里,可能有东说念主会认为这次 Google I/O 只不外是 Google 在 AI 大战逾期后的「画饼」步履。但在雷科技看来,Google I/O 2026 主题演讲提到的践诺,其实意味着谷歌终于摸到了 AI 时期的正确门票。
比如针对「AI 颖异什么」这个问题,Google 径直对我方的「发财业务」开刀,用生成式 UI 调动了 AIGC「回合制」「单向交互」的设定。这种从单向到双向的滚动也出目下了 Gemini 智能硬件中。夙昔很长一段时辰里,AI 硬件赛说念王人莫得出现真确的「双向 AI 建筑」:硬件是硬件,AI 是 AI,两者割裂极为严重。

而这一次,Gemini 3.5 Flash 的多模态才调,真确让音频眼镜等建筑成为了 Gemini 的「物理器官」,再加上上周发布的 Googlebook,Gemini 终于领有了主动感知天下、主动输出扫尾的才调。
更要紧的是,Gemini 正欺骗其在 Android 系统中的「特权」,构筑一起其他厂商无法跨越的护城河。当国外的 Anthropic、国内的种种大模子智能体还在沙盒机制的角落试探,用 MCP 契约致力于地搞跨 App 协同操作时,Gemini 照旧在 Android 底层达成了畅达无阻的原生互通。
还铭记咱们开始是说过的「Google 同期掌捏 Gemini、YouTube、Google 网页搜索、Android 等多个不同的互联网生态进口」吗,在 Google I/O 2026 上,这些四面「吐花」的生态进口,终于等来了「扫尾」的季节。
但话又说追想,Gemini 高度依靠 Google 生态,这对 OpenAI、Grok 来说大致是个挑战;但对国内 AI 企业来说,这亦然 Gemini 留给他们的机遇。
毫无疑问,Gemini 在国外再怎样大杀四方、原生互通,这套全家桶生态在国内依旧「水土挣扎」。但这套「多模态输入输出 + 独到系统 + 全天候托管 Agent」的业务逻辑,却给国内 AI 企业指明了发展的说念路:
国外有谷歌在原生底层大刀阔斧地淹没沙盒戒指,国内厂商相通能在定制安卓系统里搞起我方的「孤独王国」。
更要紧的是,中国品牌在智能体原土化落地上的卷度,致使比原生安卓还要激进,还更接地气。在 Google I/O 2026 上2026年世界杯官网,Google 亮出了 Gemini 的底牌,接下来就看国内 AI 巨头们和手机品牌们如何强强联手,用配合「破局」了。