发表于:2025年3月18日 /更新,发表于:2025年3月18日 - 作者: Konrad Wolfenstein
Google AI模型升级:New Gemini 2.0深研究2.0,Flash 2.0,Flash Thinky 2.0和Pro 2.0(实验) - 图像:XPERT.Digital.Digital.Digital
推理新思考:Gemini 2.0将AI提升到下一阶段
双子座深研究2.0
自2025年3月13日以来,全球所有用户都可以访问Gemini Deep Research 2.0。在这一天,Google宣布了深入研究的广泛可用性,该研究现在可以与Reved Gemini 2.0 Flash Thinking实验模型一起使用。
Gemini Deep Research 2.0的可用性重要点:
- 现在,它可以免费使用45多种语言,而无需付费订阅。
- 所有Gemini用户都可以每月免费使用几次深入研究。
- Gemini高级用户继续无限制地访问该功能。
- 2025年2月18日,针对Android和iOS设备引入了移动版本的深入研究。
随着这一扩展,Google深入的研究可用于更广泛的用户群,因此朝着民主化AI支持的研究工具迈出了重要一步。
适合:
Gemini 2.0 Flash思维:AI研究和个性化的发展
Google AI助理Gemini的最新发展飞跃在三个核心领域中带来了重大改进:所有用户的深入研究,扩展的个性化功能以及通过2.0 Flash Thinking进行的更强大的复发。这些创新改变了我们与AI助手的互动方式,并管理复杂的研究任务。
深入研究:每个人的基于人工智能的研究
深度研究最初是Gemini Advanced订户的独家功能,现在可以免费提供45种语言的所有用户。这个强大的功能将双子座转变为个人研究助理,他独立研究复杂的主题,并在清晰,详细的报告中总结了结果。
从Gemini 1.5 Pro到2.0 Flash思维
决定性的改进是将Gemini 1.5 Pro的转换为新的2.0 Flash思维实验模型。该系统使用复杂的纪念步骤链来将复杂的问题拆分为可管理的中间步骤,从而显着提高了从计划到搜索到分析和报告的所有阶段的研究技能。
研究过程详细
最初的深入研究将搜索查询转变为个性化的多阶段研究计划。在被用户批准此计划后,系统开始自主搜索网络并收集相关信息。在整个过程中,双子座通过以类似的方式进行研究来不断地完善他的分析:它找到有趣的信息,然后根据这些发现开始新的搜索。
深入研究的特殊之处在于思维过程的透明度 - 用户可以理解系统的考虑并在必要时进行干预。最终结果是一份具有关键知识的综合报告,并链接到原始资源,该报告在几分钟内创建,并取代了手动研究数小时。
个性化增加:双子座了解个人需求
第二个重要的创新是实验个性化功能,该功能使双子座可以根据Google Apps和Services的个人数据适应答案。
与Google生态系统集成
在用户的同意下,Gemini可以访问搜索历史记录和其他Google服务,以提供量身定制的答案。系统使用此数据来更好地了解用户活动和偏好,从而提供更相关的内容。
个性化始于Google Search-Gemini的集成,可以根据以前的搜索查询提供建议。在不久的将来,该系统还将能够从其他服务(例如Google Photos和YouTube)中汲取上下文,从而实现更全面的个性化。
数据保护和控制
Google强调了对用户数据的负责任处理:Gemini仅在此信息被认为有用时才访问搜索课程。该函数是可选的,可以随时通过具有相应链接的横幅停用。该个性化功能最初可用于Web上的双子座和Gemini高级用户,并很快扩展到移动设备。
2.0 Flash思维:透明思维过程
这些创新的核心是2.0 Flash Thinking实验模型,它以提高效率和速度确信,现在也适用于所有用户。
通过可见思想的透明度
2.0 Flash思维的出色属性之一是能够披露思维过程。该模型在答案窗口中表示其考虑为“思想/思想”,这使人们可以更深入地了解AI功能。这种“推理”方法意味着在输出之前几次检查答案,这会导致更精确和可靠的结果。
性能和范围
更新的模型提供了令人印象深刻的技术改进:
- 双子座高级用户的上下文窗口,带有百万个令牌,可实现广泛的文本分析
- 支持文件上传
- 数学和科学基准的表现提高了
- 思想和答案之间的更好一致性
与应用程序和服务集成
一个重要的扩展是与Gemini Apps(以前称为Extensions)的链接,该链接可以访问Gmail,Google日历,驱动器,消息,消息和YouTube等服务。这种集成允许复杂的多步骤查询,其中模型记录了整体上下文,将任务拆除为单个步骤并不断评估进度。
在接下来的几周中,还将提供一个Google Photos应用程序,例如,可以提供“询问照片”功能用户,例如,可以分析旅行的照片以创建旅行时间表或索取图像上的特定信息。
AI助手的新章节
为所有用户引入深入的研究,再加上扩展的个性化功能和强大的2.0 Flash思维模型,标志着AI助手的发展取得了重大进展。 Google将自己定位在竞争的领先地位,并使更广泛的受众可以访问高级的AI功能。
这些创新将双子座从一个简单的聊天机器人转变为一个强大的个人助理,他们可以管理复杂的研究任务,了解个人需求并使他的思维透明。通过整合Google生态系统并增加了个性化,双子座越来越多地成为用户的自然扩展,这预计其需求并提供了真正量身定制的支持。
适合:
Gemini 2.0:与以前的版本相比,Google Ki的进一步开发
随着Gemini 2.0的引入,Google大大发展了其AI模型家族。新一代为以前的版本带来了速度,准确性和功能的重大提高。与以前的版本相比,对双子座2.0的最重要差异和创新进行了详细分析。
绩效改善和主要差异
双子座2.0通过他的前辈的几个基本改进来解决。最显着的变化是速度提高:Gemini 2.0 Flash的速度大约是Gemini 1.5 Pro的两倍,并且在许多基准测试中超过了它。速度的这种提高与各种任务的精度有了显着提高。
复杂任务中的精度也显着提高。例如,Gemini 2.0显示播客和详细转录时的精度提高。此外,该模型生成了更细微和上下文的相关版本,这使其成为创造性内容创建和复杂问题解决方案的更有价值的工具。
另一个重要的创新是引入扩展的多模式技能。尽管Gemini已经提供了1.5个多模式功能,但Gemini 2.0不仅可以处理文本,图像,音频和视频数据,而且可以分析和理解更深刻。
Gemini 2.0的模型变体
Google已在不同变体中引入了Gemini 2.0,每个变体都针对特定应用程序进行了优化:
双子座2.0闪光灯
基本模型现在通常可用,并提供更高的速率限制和提高的性能。它是开发人员的理想选择,可以有效地与音频,图像,视频和文本数据一起工作。该模型支持100万个令牌的上下文窗口。
双子座2.0每个实验
这是用于复杂任务和编码的最强大模型。它的扩展上下文窗口与Flash变体一样多。在内部基准测试中,Gemini 2.0 Pro在几乎所有领域都取得了最佳成绩。
双子座2.0闪光灯
与Gemini 1.5 Flash相比,一种新的,便宜的变体仍然具有提高的性能。对于那些不必接受基本绩效损失的开发人员而言,这特别有趣。
Gemini 2.0 Flash思维实验
该实验模型在答案生成之前使用了额外的思考过程,类似于OpenAAI O3和DeepSeek-R1。它还可以访问外部工具,例如YouTube,地图和Google搜索。
扩展的技术技能
多模式处理
Gemini 2.0的多模式技能比以前的版本更成熟。该模型还可以处理和生成文本,图像和音频数据。此功能可以使更复杂的应用程序(例如医学诊断)在其中分析和链接书面患者报告和成像程序。
自主代理和工具使用
Gemini 2.0介绍了可以通过做出决策和计划行动独立执行任务的自主代理的概念。在Gemini 2.0 Flash,多模式的实时API和本机工具使用尤其值得注意,这使该模型能够访问并将其用于外部工具。
上下文窗口和令牌处理
一个重要的技术差异是上下文窗口的大小:
- Gemini 2.0 Flash and Flash-Lite:100万个令牌输入
- 双子座2.0 / 200万代币输入
- 所有型号:8,192个令牌用于输出
相比之下,Gemini每数据量1.5都能够处理,包括2个小时的视频,19小时的音频,具有60,000个代码线的代码库或2,000个文本站点。
基准结果比较
与以前的版本相比,在基准测试中,gemini 2.0显示出显着改善:
在数学任务中,数学基准中的Gemini 2.0每91.8%,而HiddenMath中的65.2%的成就明显超过闪光变体。在OpenAIS SimpleQA测试中,Pro模型达到44.3%,而Gemini 2.0 Flash率为29.9%。
在复杂含量的分析中,改进也很明显。在分析图像时,Gemini 2.0提供了与较旧版本相比的更深入的分析和实用解决方案。
集成和可用性
所有Gemini 2.0型号均可通过Google AI Studio和Vertex AI以及Google的Premium Chatbot Gemini Advanced在台式机和移动设备上使用。改进了与Google Services(例如Google搜索,地图和工作区)的集成,提供了统一的用户体验。
开发人员也可以访问新功能,因此,Google的API定价变得更加灵活。例如,即使在Gemini 1.5 Flash的性能改进下,短上下文查询之间的先前区别被取消了,这可以保留混合工作负载(文本和图像)的成本(文本和图像)。
未来发展
尽管Gemini 2.0已经显示出很大的进展,但应注意的是,尚未公布的功能。这样,在接下来的几个月中,图像和音频版以及现场视频应遵循Flash和Pro。此外,尚未宣布旗舰模型“ Gemini 2.0 Ultra”。
多模式,快速,聪明:是什么使Gemini 2.0独特
Gemini 2.0与其前身版本相比,代表了进化的重要飞跃。自主代理和本机工具的整合表明,AI系统可以越来越独立地采取行动。
适合:
您的全球营销和业务发展合作伙伴
☑️我们的业务语言是英语或德语
☑️ 新:用您的国家语言进行通信!
我很乐意作为个人顾问为您和我的团队提供服务。
您可以通过填写此处的联系表,或者直接致电+49 89 89 674 804 (慕尼黑)。我的电子邮件地址是: wolfenstein ∂ xpert.digital
我很期待我们的联合项目。