Gemini 2.5使Google成为AI市场的负责人:这对用户意味着什么
Google推出了新的Gemini-2.5模型并扩展了访问权限
Google宣布了其Gemini-2.5模型的重大进展,并大大扩展了对其最先进的AI技术的访问。最新发展标志着Google AI战略中的重要里程碑,并将公司定位为人工智能领域的领先提供商。
适合:
Gemini 2.5 Flash和Pro的一般可用性
2025年6月17日,Google发布了Gemini 2.5 Flash和Pro的稳定版本,供一般使用。这些模型不再处于测试阶段,可以自信地用于生产应用。开发人员和公司可以通过Google AI Studio和Vertex AI使用模型,尽管它们也可以在Gemini应用中使用。
总体可用性意味着Google将长期支持这些模型,并且它们适用于扩展生产应用程序。在过去的几周中,诸如样条,房间,快照和Smartbear之类的公司已成功使用了最新版本。
介绍双子座2.5闪存闪光灯
作为Gemini-2.5家族的最新成员,Google Gemini 2.5 Flash-Lite介绍了2.5系列的成本效益和最快的模型。 Flash-lite最初是作为预览的,旨在进行开发人员,这些开发人员必须执行诸如翻译和分类之类的大量任务。
在编程,数学,自然科学,逻辑思维和多模式基准的领域,新模型的质量比Gemini 2.0闪存闪光灯高得多。它仅导致全价模型成本的一小部分,并且比其前辈提供的延迟时间较低。
扩展思维技巧和深思熟虑
Gemini-2.5型号的关键特征是他们的先进“思维”技能。这些思维模型能够在答案之前思考自己的思想,从而提高了性能和更高的准确性。借助“思考预算”,开发人员可以在模型产生答案之前进行深入的思考。
Google还宣布了Gemini 2.5 Pro的实验性“深思想”模式。此模式使模型能够在有答案之前并行采用几种并行思维方式,这对于复杂的数学和编程任务尤其有利。在测试中,Deep Think在美国数学奥运会2025年获得了最高表现,并在苛刻的MMMU基准中获得了84%的成绩。
新功能和改进
本地音频输出和实时API
Gemini 2.5接收天然音频输出功能,以实现更多自然的对话。扩展的实时API支持视听条目,并可以与AI进行直接对话。用户可以控制音调,口音和表达式,例如,说应该以戏剧性的语气读取故事的模型。
新的实验功能包括:
- 情感对话:模型认识到声音中的情绪并相应地回答
- 主动音频:自动过滤背景谈话
- 文字到语音:支持多个24多种语言的几位演讲者
提高了编程技能
Gemini 2.5 Pro领导WebDev Arena排名,并显示出Web开发的显着改善。该模型在经过验证的SWE Bench中达到63.8%,这是基于代理代码评估的工业标准。在创建视觉吸引力的Web应用程序和基于代理的代码应用程序以及代码转换和处理时,它非常出色。
视频MM基准显示了令人印象深刻的多模式技能:Gemini 2.5 Pro达到84.8%,而GEMINI 1.5每 / GPT-4O的GEMINI 1.5%为75%。这种功能使得可以从视频内容创建整个应用程序。
扩展的多模式和上下文处理
双子座2.5建立在双子座模型的优势上:天然多模式和大的上下文窗口。该模型以100万个令牌上下文窗口开始,其中200万个令牌将很快提供。它可以了解广泛的数据记录并从不同的信息源中编辑复杂问题,包括文本,音频,图像,视频和整个代码存储库。
可用性和访问权限
对于开发人员
- Google AI Studio:实验的立即可用性
- 顶点AI:可用于具有扩展功能的公司
- 双子API:与SDK支持完全集成
最终用户
- Gemini App:可用于台式机和移动设备的Gemini高级用户
- Google搜索:闪光灯和Flash的特别适应版本
教育领域
Google可以免费访问Google AI Pro-Pro-Pro-Pro-Pro-for Brazil,Indonesia,Japan和英国的学生,到2026年的期末考试。除了AI支持外,该套餐还包括2个TB存储空间和NotebookKlm。
适合:
技术规格和性能
Gemini 2.5 Pro领导LMARENA排名清晰,并显示了各种基准的国家服务。该模型在“人类的最后考试”中达到18.8%,这是由数百名专家开发的数据集,以掌握人类的知识和逻辑思维的极限。
Gemini 2.5 Pro的最新版本显示了LMARENA上的24分Elo跳跃和WebDevara上的35分Elo跳跃。它继续导致艰难的编程基准,例如AIDER Polyglot,并在GPQA和其他苛刻的数学和科学评论中表现出最高的性能。
Google Gemini 2.5 Flash,每次使用稳定版本的AI景观
Gemini 2.5 Flash和Pro的稳定版本以及Flash-Lite的预览引入了Google AI开发中的重要一步。通过改善性能,扩展功能和更广泛的访问的结合,Google将自己定位为人工智能领域的领先提供商。
持续的改进和可用性的扩展表明,Google致力于使AI技术对开发人员,公司和最终用户更加易于访问和有效。 Gemini 2.5凭借新的思维技能和提高的多模式,为下一代AI应用程序设定了新的标准。
适合:
您的全球营销和业务发展合作伙伴
☑️我们的业务语言是英语或德语
☑️ 新:用您的国家语言进行通信!
我很乐意作为个人顾问为您和我的团队提供服务。
您可以通过填写此处的联系表,或者直接致电+49 89 89 674 804 (慕尼黑)。我的电子邮件地址是: wolfenstein ∂ xpert.digital
我很期待我们的联合项目。