语言选择 📢

Google的新AI现在可以“深入思考”：不仅仅是答案 - 更快，更聪明，听起来比以往任何时候都更加人性化

发表于：2025年6月18日 /更新：2025年6月18日 - 作者： Konrad Wolfenstein

Google的新AI现在可以“深入思考”：不仅仅是答案 - 更快，更聪明，更聪明，听起来比以往任何时候都更加人性化 - 图像：XPERT.Digital

Gemini 2.5使Google成为AI市场的负责人：这对用户意味着什么

Google推出了新的Gemini-2.5模型并扩展了访问权限

Google宣布了其Gemini-2.5模型的重大进展，并大大扩展了对其最先进的AI技术的访问。最新发展标志着Google AI战略中的重要里程碑，并将公司定位为人工智能领域的领先提供商。

适合：

Google标准化的双子座品牌：废除Pro和Ultra名称

Gemini 2.5 Flash和Pro的一般可用性

2025年6月17日，Google发布了Gemini 2.5 Flash和Pro的稳定版本，供一般使用。这些模型不再处于测试阶段，可以自信地用于生产应用。开发人员和公司可以通过Google AI Studio和Vertex AI使用模型，尽管它们也可以在Gemini应用中使用。

总体可用性意味着Google将长期支持这些模型，并且它们适用于扩展生产应用程序。在过去的几周中，诸如样条，房间，快照和Smartbear之类的公司已成功使用了最新版本。

介绍双子座2.5闪存闪光灯

作为Gemini-2.5家族的最新成员，Google Gemini 2.5 Flash-Lite介绍了2.5系列的成本效益和最快的模型。 Flash-lite最初是作为预览的，旨在进行开发人员，这些开发人员必须执行诸如翻译和分类之类的大量任务。

在编程，数学，自然科学，逻辑思维和多模式基准的领域，新模型的质量比Gemini 2.0闪存闪光灯高得多。它仅导致全价模型成本的一小部分，并且比其前辈提供的延迟时间较低。

扩展思维技巧和深思熟虑

Gemini-2.5型号的关键特征是他们的先进“思维”技能。这些思维模型能够在答案之前思考自己的思想，从而提高了性能和更高的准确性。借助“思考预算”，开发人员可以在模型产生答案之前进行深入的思考。

Google还宣布了Gemini 2.5 Pro的实验性“深思想”模式。此模式使模型能够在有答案之前并行采用几种并行思维方式，这对于复杂的数学和编程任务尤其有利。在测试中，Deep Think在美国数学奥运会2025年获得了最高表现，并在苛刻的MMMU基准中获得了84％的成绩。

新功能和改进

本地音频输出和实时API

Gemini 2.5接收天然音频输出功能，以实现更多自然的对话。扩展的实时API支持视听条目，并可以与AI进行直接对话。用户可以控制音调，口音和表达式，例如，说应该以戏剧性的语气读取故事的模型。

新的实验功能包括：

情感对话：模型认识到声音中的情绪并相应地回答
主动音频：自动过滤背景谈话
文字到语音：支持多个24多种语言的几位演讲者

提高了编程技能

Gemini 2.5 Pro领导WebDev Arena排名，并显示出Web开发的显着改善。该模型在经过验证的SWE Bench中达到63.8％，这是基于代理代码评估的工业标准。在创建视觉吸引力的Web应用程序和基于代理的代码应用程序以及代码转换和处理时，它非常出色。

视频MM基准显示了令人印象深刻的多模式技能：Gemini 2.5 Pro达到84.8％，而GEMINI 1.5每 / GPT-4O的GEMINI 1.5％为75％。这种功能使得可以从视频内容创建整个应用程序。

扩展的多模式和上下文处理

双子座2.5建立在双子座模型的优势上：天然多模式和大的上下文窗口。该模型以100万个令牌上下文窗口开始，其中200万个令牌将很快提供。它可以了解广泛的数据记录并从不同的信息源中编辑复杂问题，包括文本，音频，图像，视频和整个代码存储库。

可用性和访问权限

对于开发人员

Google AI Studio：实验的立即可用性
顶点AI：可用于具有扩展功能的公司
双子API：与SDK支持完全集成

最终用户

Gemini App：可用于台式机和移动设备的Gemini高级用户
Google搜索：闪光灯和Flash的特别适应版本

教育领域

Google可以免费访问Google AI Pro-Pro-Pro-Pro-Pro-for Brazil，Indonesia，Japan和英国的学生，到2026年的期末考试。除了AI支持外，该套餐还包括2个TB存储空间和NotebookKlm。

适合：

Google Gemini在搜索结果和媒体的未来中具有AI概述：对出版商的威胁分析

技术规格和性能

Gemini 2.5 Pro领导LMARENA排名清晰，并显示了各种基准的国家服务。该模型在“人类的最后考试”中达到18.8％，这是由数百名专家开发的数据集，以掌握人类的知识和逻辑思维的极限。

Gemini 2.5 Pro的最新版本显示了LMARENA上的24分Elo跳跃和WebDevara上的35分Elo跳跃。它继续导致艰难的编程基准，例如AIDER Polyglot，并在GPQA和其他苛刻的数学和科学评论中表现出最高的性能。

Google Gemini 2.5 Flash，每次使用稳定版本的AI景观

Gemini 2.5 Flash和Pro的稳定版本以及Flash-Lite的预览引入了Google AI开发中的重要一步。通过改善性能，扩展功能和更广泛的访问的结合，Google将自己定位为人工智能领域的领先提供商。

持续的改进和可用性的扩展表明，Google致力于使AI技术对开发人员，公司和最终用户更加易于访问和有效。 Gemini 2.5凭借新的思维技能和提高的多模式，为下一代AI应用程序设定了新的标准。

适合：

您的全球营销和业务发展合作伙伴

☑️我们的业务语言是英语或德语

☑️ 新：用您的国家语言进行通信！

康拉德·德军总部

我很乐意作为个人顾问为您和我的团队提供服务。

您可以通过填写此处的联系表，或者直接致电+49 89 89 674 804 （慕尼黑）。我的电子邮件地址是： wolfenstein ∂ xpert.digital