Chatgpt成为Super-KI代理：Openai的新AI Model Models O3和O4-Mini现在想！

发表于：2025年4月17日 /更新，发表于：2025年4月17日 - 作者： Konrad Wolfenstein

Chatgpt成为Super-KI代理：Openai的新AI Model Models O3和O4-Mini现在想！ - 图像：XPERT.DIGITAL

比以往任何时候都更聪明：OpenAai的O系列对新技能印象深刻

数学，编程及更多：Openai的O4-Mini是新的AI Wonder Child！ - Openai的O3了解图片并解决了从未有过的问题！

2025年4月16日，Openai在其O系列O3和O4-Mini中展示了两种新的AI模型。这些被称为公司最聪明，最强大的模型。新系统的特征是提高思维技能，可以首次使用和结合所有可用的工具。他们经过特殊培训，可以在答案生成之前更长的时间，这使得它们在编程，数学和视觉分析等复杂任务中特别有效。

适合：

Chatgpt获得内存，现在记住所有内容（几乎）：新的内存功能详细介绍

新的O系列模型一目了然

基本属性和技能

Openai的O系列代表了AI开发的范式转变。使用强化学习对模型进行了培训，以便在答案生成之前进行更长的思维过程。这种方法使模型能够尝试不同的解决方案策略，识别错误并将复杂的问题拆分为更简单的子步骤。

O3和O4-Mini的重大创新是能够独立使用所有可用的CHATTT工具和基于代理的工具。这包括Web搜索，基于Python的数据分析，图像处理，图像生成，画布，自动化，文件搜索和内存功能。这些工具直接集成到模型的思维过程中，以扩大其技能并管理更复杂的任务。

这些模型可以自己决定何时以及如何最好地使用这些工具，并且通常在不到一分钟的时间内提供答案，即使存在更复杂的问题。这标志着可以独立执行任务的基于代理商的聊天的重要一步。

视觉理解和多模式技能

新模型的一个特别出色的属性是他们使用图片“思考”的能力。根据OpenAai的说法，这意味着您不仅可以感知视觉数据，还可以直接集成到您的思维过程中。这些模型可以理解和分析上传的图像，例如白板，草图和图表，即使它们的质量较低。

这些多模式的技能超出了纯图像处理。这些模型可以减少或转换图像，将它们与其他工具结合在一起，并将它们包括在其思想列车中，以得出结论良好的结论。与以前的AI模型相比，将视觉数据集成到思维过程中代表了重大进展。

性能和基准

O3作为旗舰模型

Openai O3被描述为该公司最强大的推理模型，该模型在编程，数学，自然科学和视觉感知等领域设定了新标准。在外部专家的评估中，O3在复杂，实际任务中的前身O1的严重错误少约20％。

在各种基准测试中，O3显示出令人印象深刻的结果：

它为CodeForces和SWE Bench实现了新的最佳价值
它在MMMU基准中设定了新标准，以多模式理解理解
在衡量PhD水平的GPQA钻石等科学基准测试中，O3的准确性为87.7％，而O1为78％

该模型在编程，咨询领域和创意任务方面具有特殊的优势。早期的测试人员强调了他作为思维伙伴的分析严格，并强调了他产生和批判性评估新假设的能力，尤其是在生物学，数学和技术环境中。

O4-Mini作为一种经济高效的替代方案

O4-MINI是一个较小的模型，已通过快速且具有成本效益的处理进行了优化。尽管规模较低，但它取得了显着的成就，尤其是在数学，编程和视觉任务领域。

它是AIME 2024和2025基准中最强大的模型。在2025年Aime中，它甚至达到了令人印象深刻的99.5％的精度，并获得了Python口译员。在专家评估中，它还超过了其在非肤色领域和数据科学中的O3-Mini。

由于其效率，O4-Mini支持使用限制的限制明显高于O3，这使其成为有益于逻辑思维的大容量和吞吐量的应用程序的强大选择。

申请和可用性领域

可能的用途

随着他们提高的技能，新模型开辟了各种应用程序：

科学和技术中的复杂问题解决方案，将问题分解为部分步骤的能力特别有价值
编程任务和软件开发，您可以在其中支持代码和故障排除
高水平的数学和科学分析
图表，图形和图片的视觉分析
AI独立使用不同工具来解决任务的基于代理的应用程序

用户的可用性

新型号逐渐可用于不同的用户组：

自2025年4月16日以来
出版后一周内，Chatgpt Enterprise和EDU用户在一周内接收访问权限
免费用户可以在发送请求之前在作曲家中选择“思考”来尝试O4-Mini
与以前的型号相比，所有计划的利率限制保持不变

适合：

Chatgpt von Openaai的当前发展（2025年3月）

安全方面和进一步发展

安全性和鲁棒性：Openai的新型号背后的外观

Openai强调，这两种模型都经过了广泛的安全测试 - 据该公司称，这是迄今为止最全面的安全计划。模型的渐进推理技能为提高安全性和鲁棒性提供了新的方法。特别是，如果模型对可能不安全的询问做出反应，则可以考虑他们的安全准则 - 这个概念称为“协商一致”。

该出版物是根据Openaai的“准备框架”版本2进行的。该公司的安全咨询小组（SAG）检查了准备性评估的结果，得出的结论是，O3和O4-Mini在三个监测类别（生物学和化学技能，网络范围和AI自我改善）中的否中没有达到“高”。

AI景观的意义

O3和O4-Mini的引入是AI系统发展的重要一步。凭借其提高的逻辑思考和集成不同工具的能力，这些模型接触了一个基于代理的系统，该系统可以独立地解决复杂的任务。

借助这些模型，OpenAAI继续将自己定位在AI开发的负责人，这也是由于最近的一轮融资所强调的，该公司的融资为3000亿美元。改进的校正，工具集成和多模式技能的结合可以显着扩大AI的应用领域，并开放新的应用领域。

O3和O4-Mini：强大的AI模型，用于复杂挑战

借助O3和O4-Mini，OpenAI提出了新的AI模型，由于它们的改善了反应能力和各种工具的整合，因此在AI开发中取得了重大进展。模型的特征是它们可以通过复杂问题思考并使用各种工具找到解决方案的能力。虽然O3被定位为限制任务的旗舰模型，但O4-Mini提供了一种经济高效的替代方案，尽管其尺寸较低，但仍能达到令人印象深刻的性能。

新型号已经适用于各种Chatters用户组，并且由于其提高的技能，可以扩大AI应用程序的范围。同时，Openai强调了安全方面的重要性，并将模型进行了广泛的测试以最大程度地降低潜在风险。 O3和O4-Mini的开发标志着迈向基于代理的AI系统的重要一步，该系统可以越来越多地独立掌握复杂的任务。

适合：