Опубликовано: 17 апреля 2025 г. / Обновлено: 17 апреля 2025 г. – Автор: Konrad Wolfenstein

ChatGPT превращается в супер-ИИ-агента: новые модели ИИ o3 и o4-mini от OpenAI теперь думают сами за себя! – Изображение: Xpert.Digital
Умнее, чем когда-либо: серия o от OpenAI впечатляет новыми возможностями
Математика, программирование и многое другое: o4-mini от OpenAI — новый гений в области искусственного интеллекта! — o3 от OpenAI понимает изображения и решает задачи как никогда раньше!
16 апреля 2025 года компания OpenAI представила две новые модели ИИ в своей серии o — o3 и o4-mini. Они описываются как самые интеллектуальные и мощные модели компании на сегодняшний день. Новые системы обладают расширенными возможностями логического мышления и впервые могут независимо использовать и комбинировать все инструменты, доступные в ChatGPT. Они были специально обучены дольше обдумывать ответы, что делает их особенно эффективными в сложных задачах в таких областях, как программирование, математика и визуальный анализ.
Подходит для:
- ChatGPT получает доступ к памяти и теперь запоминает (почти) всё: подробное описание новой функции памяти
Обзор новых моделей серии o
Основные характеристики и способности
Серия o от OpenAI представляет собой сдвиг парадигмы в разработке ИИ. Модели были обучены с использованием обучения с подкреплением, позволяющего выполнять более длительные мыслительные процессы перед генерацией ответов. Такой подход позволяет моделям опробовать различные стратегии решения, распознавать ошибки и разбивать сложные проблемы на более простые подзадачи.
Ключевым нововведением в o3 и o4-mini является возможность использовать все доступные инструменты ChatGPT независимо и на уровне агентов. К ним относятся веб-поиск, анализ данных на основе Python, обработка изображений, генерация изображений, Canvas, автоматизация, поиск файлов и функции хранения. Эти инструменты напрямую интегрированы в процесс рассуждений моделей, расширяя их возможности и позволяя им справляться с более сложными задачами.
Модели могут самостоятельно решать, когда и как лучше использовать эти инструменты, и, как правило, выдают ответы менее чем за минуту, даже для более сложных задач. Это важный шаг на пути к созданию ChatGPT на основе агентов, способного выполнять задачи автономно.
Визуальное восприятие и навыки мультимодального восприятия
Особенно примечательной особенностью новых моделей является их способность «думать» с помощью изображений. По данным OpenAI, это означает, что они могут не только воспринимать визуальные данные, но и напрямую интегрировать их в свой процесс рассуждения. Модели могут понимать и анализировать загруженные изображения, такие как доски, эскизы и диаграммы, даже если они низкого качества.
Эти мультимодальные возможности выходят за рамки простой обработки изображений. Модели могут обрезать или преобразовывать изображения, комбинировать их с другими инструментами и использовать их в своих рассуждениях для получения обоснованных выводов. Такая интеграция визуальных данных в мыслительный процесс представляет собой значительный шаг вперед по сравнению с предыдущими моделями ИИ.
Производительность и контрольные показатели
o3 как флагманская модель
Модель OpenAI o3 описывается как самая мощная модель логического мышления компании, устанавливающая новые стандарты в таких областях, как программирование, математика, наука и визуальное восприятие. Оценки внешних экспертов показывают, что o3 допускает примерно на 20 процентов меньше серьезных ошибок, чем ее предшественница, o1, при решении сложных задач из реального мира.
В различных тестах o3 демонстрирует впечатляющие результаты:
- Он достиг новых рекордных результатов на Codeforces и SWE-bench
- Это устанавливает новые стандарты в рамках бенчмарка MMMU для оценки навыков мультимодального понимания
- В научных бенчмарках, таких как GPQA Diamond, оценивающих вопросы на уровне докторской диссертации, o3 достигает точности 87,7% по сравнению с 78% для o1
Модель демонстрирует особые преимущества в программировании, консалтинге и творческих задачах. Первые тестировщики отметили ее аналитическую строгость как партнера по размышлениям и подчеркнули ее способность генерировать и критически оценивать новые гипотезы – особенно в биологическом, математическом и техническом контекстах.
o4-mini как экономически выгодная альтернатива
o4-mini — это уменьшенная модель, оптимизированная для быстрой и экономичной обработки данных. Несмотря на свои небольшие размеры, она демонстрирует замечательную производительность, особенно в математических вычислениях, программировании и задачах визуализации.
Это самая высокопроизводительная модель в тестах AIME 2024 и 2025. В AIME 2025 она даже достигла впечатляющей точности в 99,5 процента при использовании интерпретатора Python. В экспертных оценках она также превосходит своего предшественника, o3-mini, в областях, не связанных с наукой, технологией, инженерией и математикой, и в области анализа данных.
Благодаря своей эффективности, o4-mini поддерживает значительно более высокие пределы использования, чем o3, что делает его отличным вариантом для приложений с большим объемом данных и высокой пропускной способностью, где важен логический подход.
Области применения и доступность
Приложения
Новые модели, благодаря улучшенным возможностям, открывают широкий спектр перспективных применений:
- Решение сложных задач в науке и технике, где особенно ценна их способность разбивать проблемы на подзадачи
- Задачи программирования и разработки программного обеспечения, где они могут оказывать помощь в генерации кода и отладке
- Высокоуровневый математический и научный анализ
- Визуальный анализ диаграмм, графиков и изображений
- Агентные приложения, в которых ИИ самостоятельно использует различные инструменты для решения задач
Доступность для пользователей
Новые модели будут постепенно предоставляться различным группам пользователей:
- Пользователи ChatGPT Plus, Pro и Team получили доступ к моделям o3, o4-mini и o4-mini-high в селекторе моделей с 16 апреля 2025 года, которые заменили предыдущие модели o1, o3-mini и o3-mini-high
- Пользователи ChatGPT Enterprise и Edu получат доступ в течение одной недели после релиза
- Бесплатные пользователи могут попробовать o4-mini, выбрав пункт «Think» в Composer перед отправкой запроса
- Ограничения по тарифам для всех планов остаются неизменными по сравнению с предыдущими моделями
Подходит для:
Аспекты безопасности и дальнейшее развитие
Безопасность и надежность: взгляд изнутри на новые модели OpenAI
OpenAI подчеркивает, что обе модели прошли всестороннее тестирование на безопасность — компания утверждает, что это ее самая комплексная программа безопасности на сегодняшний день. Расширенные возможности моделей в области логического мышления открывают новые пути повышения безопасности и надежности. В частности, модели могут учитывать политики безопасности OpenAI при реагировании на потенциально небезопасные запросы — концепция, известная как «целенаправленное согласование».
Данный релиз основан на версии 2 «Рамочной программы готовности» OpenAI. Консультативная группа по безопасности (SAG) компании проанализировала результаты оценок готовности и пришла к выводу, что o3 и o4-mini не достигли порога «Высокий» ни в одной из трех отслеживаемых категорий (биологические и химические возможности, кибербезопасность и самосовершенствование ИИ).
Значение для сферы искусственного интеллекта
Внедрение o3 и o4-mini представляет собой значительный шаг в эволюции систем искусственного интеллекта. Благодаря улучшенным возможностям логического мышления и интеграции различных инструментов, эти модели приближаются к агентной системе, способной самостоятельно решать сложные задачи.
Благодаря этим моделям OpenAI продолжает занимать лидирующие позиции в разработке ИИ, что подтверждается недавним раундом финансирования, в результате которого компания была оценена в 300 миллиардов долларов. Сочетание улучшенного логического мышления, интеграции инструментов и мультимодальных возможностей может значительно расширить сферу применения ИИ и открыть новые области его использования.
o3 и o4-mini: Мощные модели ИИ для решения сложных задач
В моделях o3 и o4-mini компания OpenAI представила новые модели искусственного интеллекта, представляющие собой значительный шаг вперед в разработке ИИ благодаря улучшенным возможностям логического мышления и интеграции различных инструментов. Эти модели отличаются способностью анализировать сложные проблемы и использовать различные инструменты для поиска решений. В то время как o3 позиционируется как флагманская модель для решения сложных задач, o4-mini предлагает экономически эффективную альтернативу, обеспечивающую впечатляющую производительность, несмотря на меньший размер.
Новые модели уже доступны различным группам пользователей ChatGPT и, благодаря улучшенным возможностям, могут расширить спектр применения ИИ. В то же время OpenAI подчеркивает важность безопасности и подвергла модели всестороннему тестированию для минимизации потенциальных рисков. Разработка o3 и o4-mini знаменует собой важный шаг на пути к агентным системам ИИ, способным все более самостоятельно справляться со сложными задачами.
Подходит для:
Ваш глобальный партнер по маркетингу и развитию бизнеса
☑️ Наш деловой язык — английский или немецкий.
☑️ НОВИНКА: Переписка на вашем национальном языке!
Я был бы рад служить вам и моей команде в качестве личного консультанта.
Вы можете связаться со мной, заполнив контактную форму или просто позвоните мне по телефону +49 89 89 674 804 (Мюнхен) . Мой адрес электронной почты: wolfenstein ∂ xpert.digital
Я с нетерпением жду нашего совместного проекта.













