网站图标 专家数码

Google的新AI现在可以“深入思考”:不仅仅是答案 - 更快,更聪明,听起来比以往任何时候都更加人性化

Google的新AI现在可以“深入思考”:不仅仅是答案 - 更快,更聪明,听起来比以往任何时候都更加人性化

Google的新AI现在可以“深入思考”:不仅仅是答案 - 更快,更聪明,更聪明,听起来比以往任何时候都更加人性化 - 图像:XPERT.Digital

Gemini 2.5使Google成为AI市场的负责人:这对用户意味着什么

Google推出了新的Gemini-2.5模型并扩展了访问权限

Google宣布了其Gemini-2.5模型的重大进展,并大大扩展了对其最先进的AI技术的访问。最新发展标志着Google AI战略中的重要里程碑,并将公司定位为人工智能领域的领先提供商。

适合:

Gemini 2.5 Flash和Pro的一般可用性

2025年6月17日,Google发布了Gemini 2.5 Flash和Pro的稳定版本,供一般使用。这些模型不再处于测试阶段,可以自信地用于生产应用。开发人员和公司可以通过Google AI Studio和Vertex AI使用模型,尽管它们也可以在Gemini应用中使用。

总体可用性意味着Google将长期支持这些模型,并且它们适用于扩展生产应用程序。在过去的几周中,诸如样条,房间,快照和Smartbear之类的公司已成功使用了最新版本。

介绍双子座2.5闪存闪光灯

作为Gemini-2.5家族的最新成员,Google Gemini 2.5 Flash-Lite介绍了2.5系列的成本效益和最快的模型。 Flash-lite最初是作为预览的,旨在进行开发人员,这些开发人员必须执行诸如翻译和分类之类的大量任务。

在编程,数学,自然科学,逻辑思维和多模式基准的领域,新模型的质量比Gemini 2.0闪存闪光灯高得多。它仅导致全价模型成本的一小部分,并且比其前辈提供的延迟时间较低。

扩展思维技巧和深思熟虑

Gemini-2.5型号的关键特征是他们的先进“思维”技能。这些思维模型能够在答案之前思考自己的思想,从而提高了性能和更高的准确性。借助“思考预算”,开发人员可以在模型产生答案之前进行深入的思考。

Google还宣布了Gemini 2.5 Pro的实验性“深思想”模式。此模式使模型能够在有答案之前并行采用几种并行思维方式,这对于复杂的数学和编程任务尤其有利。在测试中,Deep Think在美国数学奥运会2025年获得了最高表现,并在苛刻的MMMU基准中获得了84%的成绩。

新功能和改进

本地音频输出和实时API

Gemini 2.5接收天然音频输出功能,以实现更多自然的对话。扩展的实时API支持视听条目,并可以与AI进行直接对话。用户可以控制音调,口音和表达式,例如,说应该以戏剧性的语气读取故事的模型。

新的实验功能包括:

  • 情感对话:模型认识到声音中的情绪并相应地回答
  • 主动音频:自动过滤背景谈话
  • 文字到语音:支持多个24多种语言的几位演讲者

提高了编程技能

Gemini 2.5 Pro领导WebDev Arena排名,并显示出Web开发的显着改善。该模型在经过验证的SWE Bench中达到63.8%,这是基于代理代码评估的工业标准。在创建视觉吸引力的Web应用程序和基于代理的代码应用程序以及代码转换和处理时,它非常出色。

视频MM基准显示了令人印象深刻的多模式技能:Gemini 2.5 Pro达到84.8%,而GEMINI 1.5每 / GPT-4O的GEMINI 1.5%为75%。这种功能使得可以从视频内容创建整个应用程序。

扩展的多模式和上下文处理

双子座2.5建立在双子座模型的优势上:天然多模式和大的上下文窗口。该模型以100万个令牌上下文窗口开始,其中200万个令牌将很快提供。它可以了解广泛的数据记录并从不同的信息源中编辑复杂问题,包括文本,音频,图像,视频和整个代码存储库。

可用性和访问权限

对于开发人员

  • Google AI Studio:实验的立即可用性
  • 顶点AI:可用于具有扩展功能的公司
  • 双子API:与SDK支持完全集成

最终用户

  • Gemini App:可用于台式机和移动设备的Gemini高级用户
  • Google搜索:闪光灯和Flash的特别适应版本

教育领域

Google可以免费访问Google AI Pro-Pro-Pro-Pro-Pro-for Brazil,Indonesia,Japan和英国的学生,到2026年的期末考试。除了AI支持外,该套餐还包括2个TB存储空间和NotebookKlm。

适合:

技术规格和性能

Gemini 2.5 Pro领导LMARENA排名清晰,并显示了各种基准的国家服务。该模型在“人类的最后考试”中达到18.8%,这是由数百名专家开发的数据集,以掌握人类的知识和逻辑思维的极限。

Gemini 2.5 Pro的最新版本显示了LMARENA上的24分Elo跳跃和WebDevara上的35分Elo跳跃。它继续导致艰难的编程基准,例如AIDER Polyglot,并在GPQA和其他苛刻的数学和科学评论中表现出最高的性能。

Google Gemini 2.5 Flash,每次使用稳定版本的AI景观

Gemini 2.5 Flash和Pro的稳定版本以及Flash-Lite的预览引入了Google AI开发中的重要一步。通过改善性能,扩展功能和更广泛的访问的结合,Google将自己定位为人工智能领域的领先提供商。

持续的改进和可用性的扩展表明,Google致力于使AI技术对开发人员,公司和最终用户更加易于访问和有效。 Gemini 2.5凭借新的思维技能和提高的多模式,为下一代AI应用程序设定了新的标准。

适合:

 

您的全球营销和业务发展合作伙伴

☑️我们的业务语言是英语或德语

☑️ 新:用您的国家语言进行通信!

 

康拉德·德军总部

我很乐意作为个人顾问为您和我的团队提供服务。

您可以通过填写此处的联系表,或者直接致电+49 89 89 674 804 (慕尼黑)。我的电子邮件地址是: wolfenstein xpert.digital

我很期待我们的联合项目。

 

 

☑️ 为中小企业提供战略、咨询、规划和实施方面的支持

☑️ 创建或调整数字战略和数字化

☑️国际销售流程的扩展和优化

☑️ 全球数字 B2B 交易平台

☑️ 先锋业务发展/营销/公关/贸易展览会

退出手机版