⭐️ Искусственный интеллект (ИИ) - Блог, тематический раздел и центр контента по ИИ ⭐️ Цифровой интеллект ⭐️ Пресса - Xpert Press Relations | Консалтинг и услуги ⭐️ XPaper

Available in 27 languages 📢

ChatGPT превращается в супер-ИИ-агента: новые модели ИИ o3 и o4-mini от OpenAI теперь думают сами за себя!

Опубликовано: 17 апреля 2025 г. / Обновлено: 17 апреля 2025 г. – Автор: Konrad Wolfenstein

ChatGPT превращается в супер-ИИ-агента: новые модели ИИ o3 и o4-mini от OpenAI теперь думают сами за себя! – Изображение: Xpert.Digital

Умнее, чем когда-либо: серия o от OpenAI впечатляет новыми возможностями

Математика, программирование и многое другое: o4-mini от OpenAI — новый гений в области искусственного интеллекта! — o3 от OpenAI понимает изображения и решает задачи как никогда раньше!

16 апреля 2025 года компания OpenAI представила две новые модели ИИ в своей серии o — o3 и o4-mini. Они описываются как самые интеллектуальные и мощные модели компании на сегодняшний день. Новые системы обладают расширенными возможностями логического мышления и впервые могут независимо использовать и комбинировать все инструменты, доступные в ChatGPT. Они были специально обучены дольше обдумывать ответы, что делает их особенно эффективными в сложных задачах в таких областях, как программирование, математика и визуальный анализ.

Подходит для:

ChatGPT получает доступ к памяти и теперь запоминает (почти) всё: подробное описание новой функции памяти

Обзор новых моделей серии o

Основные характеристики и способности

Серия o от OpenAI представляет собой сдвиг парадигмы в разработке ИИ. Модели были обучены с использованием обучения с подкреплением, позволяющего выполнять более длительные мыслительные процессы перед генерацией ответов. Такой подход позволяет моделям опробовать различные стратегии решения, распознавать ошибки и разбивать сложные проблемы на более простые подзадачи.

Ключевым нововведением в o3 и o4-mini является возможность использовать все доступные инструменты ChatGPT независимо и на уровне агентов. К ним относятся веб-поиск, анализ данных на основе Python, обработка изображений, генерация изображений, Canvas, автоматизация, поиск файлов и функции хранения. Эти инструменты напрямую интегрированы в процесс рассуждений моделей, расширяя их возможности и позволяя им справляться с более сложными задачами.

Модели могут самостоятельно решать, когда и как лучше использовать эти инструменты, и, как правило, выдают ответы менее чем за минуту, даже для более сложных задач. Это важный шаг на пути к созданию ChatGPT на основе агентов, способного выполнять задачи автономно.

Визуальное восприятие и навыки мультимодального восприятия

Особенно примечательной особенностью новых моделей является их способность «думать» с помощью изображений. По данным OpenAI, это означает, что они могут не только воспринимать визуальные данные, но и напрямую интегрировать их в свой процесс рассуждения. Модели могут понимать и анализировать загруженные изображения, такие как доски, эскизы и диаграммы, даже если они низкого качества.

Эти мультимодальные возможности выходят за рамки простой обработки изображений. Модели могут обрезать или преобразовывать изображения, комбинировать их с другими инструментами и использовать их в своих рассуждениях для получения обоснованных выводов. Такая интеграция визуальных данных в мыслительный процесс представляет собой значительный шаг вперед по сравнению с предыдущими моделями ИИ.

Производительность и контрольные показатели

o3 как флагманская модель

Модель OpenAI o3 описывается как самая мощная модель логического мышления компании, устанавливающая новые стандарты в таких областях, как программирование, математика, наука и визуальное восприятие. Оценки внешних экспертов показывают, что o3 допускает примерно на 20 процентов меньше серьезных ошибок, чем ее предшественница, o1, при решении сложных задач из реального мира.

В различных тестах o3 демонстрирует впечатляющие результаты:

Он достиг новых рекордных результатов на Codeforces и SWE-bench
Это устанавливает новые стандарты в рамках бенчмарка MMMU для оценки навыков мультимодального понимания
В научных бенчмарках, таких как GPQA Diamond, оценивающих вопросы на уровне докторской диссертации, o3 достигает точности 87,7% по сравнению с 78% для o1

Модель демонстрирует особые преимущества в программировании, консалтинге и творческих задачах. Первые тестировщики отметили ее аналитическую строгость как партнера по размышлениям и подчеркнули ее способность генерировать и критически оценивать новые гипотезы – особенно в биологическом, математическом и техническом контекстах.

o4-mini как экономически выгодная альтернатива

o4-mini — это уменьшенная модель, оптимизированная для быстрой и экономичной обработки данных. Несмотря на свои небольшие размеры, она демонстрирует замечательную производительность, особенно в математических вычислениях, программировании и задачах визуализации.

Это самая высокопроизводительная модель в тестах AIME 2024 и 2025. В AIME 2025 она даже достигла впечатляющей точности в 99,5 процента при использовании интерпретатора Python. В экспертных оценках она также превосходит своего предшественника, o3-mini, в областях, не связанных с наукой, технологией, инженерией и математикой, и в области анализа данных.

Благодаря своей эффективности, o4-mini поддерживает значительно более высокие пределы использования, чем o3, что делает его отличным вариантом для приложений с большим объемом данных и высокой пропускной способностью, где важен логический подход.

Области применения и доступность

Приложения

Новые модели, благодаря улучшенным возможностям, открывают широкий спектр перспективных применений:

Решение сложных задач в науке и технике, где особенно ценна их способность разбивать проблемы на подзадачи
Задачи программирования и разработки программного обеспечения, где они могут оказывать помощь в генерации кода и отладке
Высокоуровневый математический и научный анализ
Визуальный анализ диаграмм, графиков и изображений
Агентные приложения, в которых ИИ самостоятельно использует различные инструменты для решения задач

Доступность для пользователей

Новые модели будут постепенно предоставляться различным группам пользователей:

Пользователи ChatGPT Plus, Pro и Team получили доступ к моделям o3, o4-mini и o4-mini-high в селекторе моделей с 16 апреля 2025 года, которые заменили предыдущие модели o1, o3-mini и o3-mini-high
Пользователи ChatGPT Enterprise и Edu получат доступ в течение одной недели после релиза
Бесплатные пользователи могут попробовать o4-mini, выбрав пункт «Think» в Composer перед отправкой запроса
Ограничения по тарифам для всех планов остаются неизменными по сравнению с предыдущими моделями

Подходит для:

Текущие разработки ChatGPT от OpenAI (март 2025 г.)

Аспекты безопасности и дальнейшее развитие

Безопасность и надежность: взгляд изнутри на новые модели OpenAI

OpenAI подчеркивает, что обе модели прошли всестороннее тестирование на безопасность — компания утверждает, что это ее самая комплексная программа безопасности на сегодняшний день. Расширенные возможности моделей в области логического мышления открывают новые пути повышения безопасности и надежности. В частности, модели могут учитывать политики безопасности OpenAI при реагировании на потенциально небезопасные запросы — концепция, известная как «целенаправленное согласование».

Данный релиз основан на версии 2 «Рамочной программы готовности» OpenAI. Консультативная группа по безопасности (SAG) компании проанализировала результаты оценок готовности и пришла к выводу, что o3 и o4-mini не достигли порога «Высокий» ни в одной из трех отслеживаемых категорий (биологические и химические возможности, кибербезопасность и самосовершенствование ИИ).

Значение для сферы искусственного интеллекта

Внедрение o3 и o4-mini представляет собой значительный шаг в эволюции систем искусственного интеллекта. Благодаря улучшенным возможностям логического мышления и интеграции различных инструментов, эти модели приближаются к агентной системе, способной самостоятельно решать сложные задачи.

Благодаря этим моделям OpenAI продолжает занимать лидирующие позиции в разработке ИИ, что подтверждается недавним раундом финансирования, в результате которого компания была оценена в 300 миллиардов долларов. Сочетание улучшенного логического мышления, интеграции инструментов и мультимодальных возможностей может значительно расширить сферу применения ИИ и открыть новые области его использования.

o3 и o4-mini: Мощные модели ИИ для решения сложных задач

В моделях o3 и o4-mini компания OpenAI представила новые модели искусственного интеллекта, представляющие собой значительный шаг вперед в разработке ИИ благодаря улучшенным возможностям логического мышления и интеграции различных инструментов. Эти модели отличаются способностью анализировать сложные проблемы и использовать различные инструменты для поиска решений. В то время как o3 позиционируется как флагманская модель для решения сложных задач, o4-mini предлагает экономически эффективную альтернативу, обеспечивающую впечатляющую производительность, несмотря на меньший размер.

Новые модели уже доступны различным группам пользователей ChatGPT и, благодаря улучшенным возможностям, могут расширить спектр применения ИИ. В то же время OpenAI подчеркивает важность безопасности и подвергла модели всестороннему тестированию для минимизации потенциальных рисков. Разработка o3 и o4-mini знаменует собой важный шаг на пути к агентным системам ИИ, способным все более самостоятельно справляться со сложными задачами.

Подходит для:

Ваш глобальный партнер по маркетингу и развитию бизнеса

☑️ Наш деловой язык — английский или немецкий.

☑️ НОВИНКА: Переписка на вашем национальном языке!

Konrad Wolfenstein

Я был бы рад служить вам и моей команде в качестве личного консультанта.

Вы можете связаться со мной, заполнив контактную форму или просто позвоните мне по телефону +49 89 89 674 804 (Мюнхен) . Мой адрес электронной почты: wolfenstein ∂ xpert.digital

Я с нетерпением жду нашего совместного проекта.