网站图标 专家数码

Google的新AI现在可以“深入思考”:不仅仅是答案 - 更快,更聪明,听起来比以往任何时候都更加人性化

Google的新AI现在可以“深入思考”:不仅仅是答案 - 更快,更聪明,听起来比以往任何时候都更加人性化

谷歌的全新人工智能现在可以“深度思考”:它不仅能给出答案,而且速度更快、更智能,听起来也比以往任何时候都更像人类——图片来源:Xpert.Digital

Gemini 2.5 让谷歌成为人工智能市场领导者:这对用户意味着什么

谷歌推出新款 Gemini 2.5 机型并扩大访问权限

谷歌宣布其 Gemini 2.5 模型取得重大进展,大幅扩展了其最先进人工智能技术的使用范围。这些最新进展标志着谷歌人工智能战略的一个重要里程碑,并巩固了该公司在人工智能领域的领导地位。

适合:

Gemini 2.5 闪光灯和 Pro 的全面上市

2025年6月17日,谷歌发布了Gemini 2.5 Flash和Pro的稳定版本,供公众使用。这些模型已结束测试阶段,现在可以放心地用于生产应用。开发者和企业可以通过Google AI Studio和Vertex AI使用这些模型,也可以在Gemini应用中使用。

正式发布意味着谷歌将长期支持这些模型,并且它们适用于大规模生产应用。像 Spline、Rooms、Snap 和 SmartBear 这样的公司最近几周已经成功地使用了最新版本。

Gemini 2.5 手电筒简介

作为 Gemini 2.5 系列的最新成员,谷歌推出了 Gemini 2.5 Flash-Lite,它是该系列中性价比最高、速度最快的型号。Flash-Lite 最初以预览版的形式发布,旨在满足需要执行大量、对延迟要求严格的任务(例如翻译和分类)的开发者的需求。

新款闪存芯片在编程、数学、科学、逻辑推理和多模态基准测试方面,性能均显著优于 Gemini 2.0 Flash-Lite。同时,其价格仅为全价型号的一小部分,并且延迟也低于前代产品。

高级思维能力和深度思考

Gemini 2.5 模型的一项关键特性是其先进的“思考”能力。这些模型能够在做出反应前充分考虑其思考过程,从而提高性能和准确性。开发者可以通过“思考预算”来控制模型在生成反应前的思考强度。

谷歌还宣布为 Gemini 2.5 Pro 推出一项实验性的“深度思考”模式。该模式允许模型并行进行多条推理路径,最终得出答案,这对于复杂的数学和编程任务尤为有利。在测试中,“深度思考”模式在 2025 年美国数学奥林匹克竞赛中取得了优异成绩,在难度极高的 MMMU 基准测试中获得了 84% 的高分。

新增功能和改进

原生音频输出和 Live API

Gemini 2.5 新增了原生音频输出功能,实现了更自然流畅的对话。增强的 Live API 支持音视频输入,并允许用户与 AI 直接交互。用户可以控制语音的语调、口音和表情,例如,让模型以富有戏剧性的语气朗读故事。

新增的实验性功能包括:

  • 情感对话:该模型能够识别声音中的情绪并做出相应的反应。
  • 主动音频:自动过滤背景对话
  • 文本转语音:支持超过 24 种语言的多说话人语音

提高了编程技能

Gemini 2.5 Pro 在 WebDev Arena 排行榜上名列前茅,并在 Web 开发方面展现出显著的改进。该模型在 SWE-Bench Verified(基于代理的代码评估行业标准)中取得了 63.8% 的成绩。它在构建视觉效果出色的 Web 应用和基于代理的代码应用程序方面表现卓越,同时在代码转换和编辑方面也表现出色。

VideoMME 基准测试展现了其卓越的多模态能力:Gemini 2.5 Pro 的得分达到 84.8%,而 Gemini 1.5 Pro 和 GPT-4o 的得分分别为 75% 和 71.9%。这一能力使得利用视频内容创建完整的应用程序成为可能。

增强的多模态和上下文处理

Gemini 2.5 延续了 Gemini 模型的优势:原生多模态处理能力和更大的上下文窗口。该模型初始版本拥有 100 万个词元的上下文窗口,不久后将扩展至 200 万个词元。它能够理解大型数据集,并处理来自各种信息源的复杂问题,包括文本、音频、图像、视频以及整个代码库。

可用性和访问权限

对于开发者

  • Google AI Studio:可立即用于实验
  • Vertex AI:适用于具有高级功能的企业
  • Gemini API:与 SDK 完全集成

面向最终用户

  • Gemini App:适用于桌面和移动设备上的 Gemini 高级用户。
  • Google 搜索:Flash Lite 和 Flash 的特别适配版本

教育领域

谷歌将为巴西、印度尼西亚、日本和英国的学生免费提供 Google AI Pro 服务,直至 2026 年期末考试结束。除了 AI 支持外,该套餐还包括 2TB 存储空间和 NotebookLM。

适合:

技术规格和性能

Gemini 2.5 Pro 在 LMArena 排名中遥遥领先,在各项基准测试中均展现出卓越的政府模型性能。该模型在“人类的最后考试”数据集中取得了 18.8% 的成绩。该数据集由数百位领域专家共同开发,旨在捕捉人类知识和逻辑推理的极限。

最新版 Gemini 2.5 Pro 在 LMArena 和 WebDevArena 上的 Elo 分数分别提升了 24 分和 35 分。它在 Aider Polyglot 等高难度编程基准测试中继续保持领先地位,并在 GPQA 和其他高要求的数学和科学评估中展现出卓越的性能。

Google Gemini 2.5 Flash 和 Pro 的稳定版本改变了 AI 格局。

Gemini 2.5 Flash 和 Pro 稳定版的发布,以及 Flash Lite 预览版的推出,标志着谷歌在人工智能发展方面迈出了重要一步。凭借性能提升、功能扩展和用户群体扩大,谷歌巩固了其在人工智能领域的领先地位。

持续的改进和更广泛的可用性体现了谷歌致力于让开发者、企业和终端用户更容易获取并更有效地使用人工智能技术的承诺。凭借其全新的思维能力和增强的多模态处理能力,Gemini 2.5 为下一代人工智能应用树立了新的标杆。

适合:

 

您的全球营销和业务发展合作伙伴

☑️我们的业务语言是英语或德语

☑️ 新:用您的国家语言进行通信!

 

Konrad Wolfenstein

我很乐意作为个人顾问为您和我的团队提供服务。

您可以通过填写此处的联系表,或者直接致电+49 89 89 674 804 (慕尼黑)。我的电子邮件地址是: wolfenstein xpert.digital

我很期待我们的联合项目。

 

 

☑️ 为中小企业提供战略、咨询、规划和实施方面的支持

☑️ 创建或调整数字战略和数字化

☑️国际销售流程的扩展和优化

☑️ 全球数字 B2B 交易平台

☑️ 先锋业务发展/营销/公关/贸易展览会

退出手机版