语言选择 📢


Google Gemini人工智能发布计划:谷歌人工智能创新月度发布新节奏——2025年7月发布计划

发布日期:2025年7月25日 / 更新日期:2025年7月25日 – 作者:Konrad Wolfenstein

双子座人工智能滴答:谷歌每月发布人工智能创新成果的新节奏

双子座人工智能发布会:谷歌每月发布人工智能创新成果的新节奏——图片来源:Xpert.Digital

Gemini Drops:谷歌如何一步步改变人工智能世界

人工智能的未来:谷歌的智能创新路线图

谷歌正转向持续解释其人工智能生态系统的模式:通过全新的“Gemini Drops”,该公司将与其多模态Gemini模型、开发者API、Gemini应用以及互联产品(Pixel、Wear OS、Chrome、Workspace、云服务等)相关的所有最新功能整合到一个月度更新包中。这一理念借鉴了Android和Pixel的常规功能更新,但更进一步:每个更新包不仅提供简洁明了的变更列表,还讲述了谷歌人工智能的未来发展方向——从视频和音频生成到日常自动化操作。.

本文将详细概述这一概念,阐述其背景,介绍首批产品的具体创新之处,并将其置于 Gemini 的整体发展蓝图中,同时展望未来。文中所有引自新闻稿、博客或演示文稿的内容均以流畅的文字呈现,写作风格力求清晰易懂。.

适合:

谷歌人工智能战略的新篇章

自 2023 年底推出第一代 Gemini 以来,谷歌的创新步伐稳步加快。最初,Gemini 只是一个语音和图像模型,但很快便发展成为一个原生多模态系统,能够平等地处理文本、图像、音频、视频和代码。Gemini 生态系统也同步发展:包括终端用户应用、开发者 API,以及与 Chrome、搜索、Workspace 应用、Pixel 功能、Wear OS 手表、智能显示屏乃至未来车载界面等的集成。.

随着每次产品更新,问题数量也会增加:

  • 哪些功能是所有人都可以免费使用的,哪些功能只有 AI Pro 或 AI Ultra 订阅用户才能使用?
  • 基本款有哪些功能?高级版 Gemini 2.5 Pro、Flash 或 Flash-Lite 又有哪些功能?
  • Veo 3 视频生成、原生音频输出或定时操作等新功能都藏在哪里了?

为了帮助用户梳理海量信息,谷歌推出了 Gemini Drops。每月一次,谷歌会发布一份简明扼要的概述,重点介绍关键功能,提供应用示例,解答常见问题,并提供更多资源链接。小的错误修复或增量改进会立即发布,但 Gemini Drops 会总结所有内容并进行清晰的解释。.

为什么这些双子座水滴有意义

谷歌通常会在后台以微小的步骤开发其人工智能模型。虽然这些更改会在开发者的变更日志中记录,但普通用户很少会注意到。而这正是 Drops 的用武之地。它们……

  • 捆绑功能:用户不会收到零散的小更新,而是会收到精心挑选的新功能目录。.
  • 他们设定了优先级:每次更新都重点介绍谷歌认为特别有价值的 4-6 项核心改进。.
  • 他们提供了实际示例:短视频、动画 GIF 或分步 GIF 指南,演示如何立即尝试新功能。.
  • 它简化了支持:明确的截止日期使帮助论坛更容易,因为每个人都知道指的是哪个版本的功能。.
  • 加强营销:功能发布在安卓和Pixel粉丝中拥有极高的地位。这一理念可以借鉴到人工智能领域,以吸引用户注意力并激发好奇心。.

更多相关信息请点击这里:

首批 Gemini 产品将于 2025 年 7 月上市——巡回宣传

首映内容丰富,充分展现了谷歌人工智能计划的多层次性。其关键组成部分包括:

Veo 3:带声音的照片转视频

最大的亮点是Veo 3视频生成器的升级,它现在已直接集成到Gemini应用程序中。用户从图库中选择一张图片——人像、风景照或素描——Veo即可生成一段8秒的720p高清视频,并自动添加音效和背景音乐。如有需要,用户还可以将多张图片组合成故事板序列。.

  • 选项:社交媒体帖子、动画生日贺卡、用于演示的简短情绪视频。.
  • 控制:风格参数(电影、漫画、定格动画)、否定提示(要排除的元素)和运动预设(相机移动、缩放、360 度平移)。.
  • 技术背景:Veo 3 拥有一致的角色渲染、相机控制和原生音频合成;它采用了与 Gemini 2.5 Pro 相同的扩散和变换构建模块。.

在 Wear OS 上运行 Gemini

谷歌正逐步向所有 Wear OS 4 及更新版本的智能手表推出 Gemini 聊天机器人。这款聊天机器人取代了经典的 Google Assistant,但提供了更出色的语音识别功能、电子邮件和日历访问、导航快捷方式,以及直接在手腕上提供的即时编程或数学解决方案。.

– Google 应用依然保留;或者,您可以按住侧边按钮或点击新的应用图标。–
情境访问:会议前查看近期邮件摘要,健身房储物柜号码提醒,以及出行途中通过地图片段获取路线指引。–
硬件功能:旧款手表会将数据流传输到配对的智能手机;新款芯片(例如骁龙 W5+)支持本地推理以完成基本任务。

计划性行动——强化版的例行程序

借助“定时操作”功能,Gemini 可以成为您的个人工作流程自动化工具。用户可以为任何提示设置定时任务:每日、每周、每月或一次性任务。.

  • 例如:早上 7 点,提供日历、天气、电子邮件和待办事项清单的摘要。.
  • 每周一提供五个博客选题;每周五提供本地餐厅推荐;每周日提供每周评论。.
  • 体育赛事结束后,自动将比赛统计数据发送到您的手机。.
  • 限制:最多可同时执行 10 个操作,此功能目前包含在 AI Pro/Ultra 订阅或符合条件的 Workspace 计划中。.
  • 操作方式:通过聊天命令创建,在设置的“计划操作”下进行管理;可暂停/恢复。.

Gemini 2.5 Pro – 更多推理,更多背景信息

除了面向最终用户的功能外,谷歌还将正式发布 Thinking 模型 Gemini 2.5 Pro。.

  • 性能数据:100万个标记窗口,多模态输入,编码基准测试中取得优异结果,LMArena排名第1。.
  • 开发者好帮手:链式思维流、异步函数调用、实时 API 音频对话、代码执行工具。.
  • 定价:可在 Gemini 应用中作为 AI-Pro(每月 20 美元)或 AI-Ultra(每年 120 美元)的一部分提供 – 早期测试者可在限定时间内免费使用。.

Gemini Live 的实时字幕

Gemini Live实时对话模块现在可以实时显示字幕。这有利于提高可访问性,尤其适用于嘈杂环境,同时也方便在会议中做笔记。.

即使是小事也会引发麻烦。

  • Gemini-in-Apps:更深入地访问文档、Keep 和消息,包括将 AI 结果拖放集成到应用中。.
  • Gemini Cloud Assist:改进了 Google Cloud 中的代码辅助前端,支持自然语言连接器配置。.
  • Lyria-Realtime:实时音乐创作(预览)。.
  • Flash-Lite:一款更便宜的大规模推理任务模型。.

掉落机制

每一滴水都遵循着清晰的顺序:

  1. 逐步推出——各个功能逐步发布,通常与服务器端标志配合使用。.
  2. Drop 标签 – Google 发布博客文章、社交媒体素材、YouTube 短片,并更新 Gemini Drops 中心页面。.
  3. Hub 更新 – 常见问题解答部分、视频演示、开发者深度解析链接。.
  4. 反馈窗口 – 48 小时内,用户反馈将转化为紧急修复;内部团队将调整功能标志。.

通过这种方式,谷歌将敏捷性(持续推出)和叙事性(每月故事情节)结合起来,而没有牺牲创新速度。.

Gemini Drops 与 Android 和 Pixel 功能更新的比较

在瞬息万变的科技世界中,软件更新策略也在不断演变。Android 和 Pixel 传统上按季度发布新功能,而 Gemini 则采用月度更新周期,以更好地反映人工智能技术的快速发展。.

功能更新不仅频率不同,而且侧重点也不同:Android 更新侧重于操作系统功能,Pixel 更新为 Google 设备提供独家福利,而 Gemini 更新则针对 AI 模型和应用程序功能。.

用户群体也各不相同:Android 更新会从某个版本开始推送至所有设备,Pixel 更新仅限于当前的 Pixel 设备,而 Gemini Drops 会影响 Gemini 应用、API 和联网产品。.

分发机制涵盖补丁推送、Google Play 系统更新、服务器端标志以及云端部署等多种方式。创新之处包括密码支持、通话屏幕升级以及 Veo 3 视频生成器等。.

Gemini 的月度更新周期反映了人工智能的快速发展,与 Android 和 Pixel 更为传统、较慢的更新周期明显不同。.

适合:

开发者如何从掉落中获益

对于开发者社区而言,Gemini Drops 的意义远不止于市场营销:

  • 规划:固定日期有助于同步路线图和时间兼容性测试。.
  • 文档:API Hub 中的发行说明提供了精确的模型 ID、弃用警告和迁移路径。.
  • 沙盒时间:可以提前评估像 `gemini-2.5-flash-preview-native-audio-dialog` 这样的预览模型。.
  • 开源示例:Google 发布了配套的 Colab 笔记本、GitHub 代码片段和 Cloud Codelabs。.
  • 社区活动:每次发布后,都会有开发者直播、Discord 问答环节以及 AI Studio 的办公时间。.

企业和教育客户的收益

企业和教育机构会收到这些水滴……

  • 清晰的许可信息:工作区计划包含哪些功能,哪些功能需要额外购买?
  • 安全更新:重点介绍了合规性变更,例如 Gemini 2.5 Pro 的数据驻留选项。.
  • 用例故事:客户服务机器人、CRM自动化和研究评估的实际示例。.
  • 培训资料:幻灯片、演示账户和案例研究支持内部培训。.

批评和未决问题

  1. 订阅门槛:许多亮点功能(计划操作、2.5 Pro、完整质量的 Veo 3)需要通过 AI-Pro/Ultra 付费才能使用。.
  2. 产品型号碎片化:Flash-Lite、Flash、Pro、Native Audio、TTS——非专业人士很快就会搞不清楚。.
  3. 数据隐私:增强上下文访问(邮件、日历、云端硬盘)需要对谷歌的安全架构抱有信任。.
  4. 生态系统碎片化:某些功能有时会先出现在 Pixel 设备上,然后出现在 iOS 设备上,之后才会出现在网页上;Wear OS 的推出需要时间。.

谷歌正通过透明度门户网站、详细的模型卡、政策更新和加强信任营销来应对。.

展望未来——即将推出的产品会带来什么?

  • Gemini-in-Maps 导航:实时路线规划,并带有对话叠加层。.
  • Project Astra 集成:可视语音助手,具备实时摄像头流分析功能。.
  • 深度研究代理:自动化文献综述、市场分析、竞争对手报告。.
  • Gemini Studio 插件:无需代码即可构建网上商店、聊天前端或学习平台。.
  • 边缘推理工具包:Gemma 的衍生产品,用于物联网硬件中的设备端 AI。.
  • 沉浸式AR支持:AR眼镜中的视频上下文窗口,包括实时转录。.

每月人工智能奇迹:谷歌的新创新节奏

Gemini Drops 标志着谷歌战略的转变:谷歌不再仅仅依赖 I/O 大会或独立的产品博客等大型活动,而是致力于建立持续的 AI 对话。这不仅能为用户创造清晰的预期节奏,还能让开发者在规划时更加确定,并为市场营销部门提供一个每月都能带来新鲜内容的平台。.

任何已经在使用 Gemini 的人——无论是出于创意、专业还是单纯的好奇——都应该关注 Drop 日历。每个月都可能带来全新的 AI 惊喜——无论是智能每日计划表、用你的照片制作的八秒钟迷你艺术作品,还是在你掏出手机之前就能回答复杂问题的智能手表。.

最终,或许最大的进步不在于单个功能,而在于谷歌兑现其人工智能承诺的可靠性——透明、有节奏,并始终关注现实世界的好处。.

适合:

 

您的AI转换,AI集成和AI平台行业专家

☑️我们的业务语言是英语或德语

☑️ 新:用您的国家语言进行通信!

 

数字先锋—— Konrad Wolfenstein

Konrad Wolfenstein

我很乐意作为个人顾问为您和我的团队提供服务。

您可以通过填写此处的联系表,或者直接致电+49 89 89 674 804 (慕尼黑)。我的电子邮件地址是: wolfenstein xpert.digital

我很期待我们的联合项目。

 

 

☑️ 为中小企业提供战略、咨询、规划和实施方面的支持

AI策略的创建或重组

☑️ 开拓业务发展


⭐️人工智能 (AI) - AI 博客、热点和内容中心⭐️  数字智能⭐️XPaper