⭐️ Штучний інтелект (ШІ) - Блог про ШІ, гаряча точка та центр контенту ⭐️ Цифровий інтелект ⭐️ Преса - Xpert Зв'язки з пресою | Консалтинг та послуги ⭐️ XPaper

Вибір голосу 📢

ChatGPT стає суперштучним агентом: нові моделі штучного інтелекту OpenAI o3 та o4-mini тепер думають самостійно!

Опубліковано: 17 квітня 2025 р. / Оновлено: 17 квітня 2025 р. – Автор: Konrad Wolfenstein

ChatGPT стає суперштучним агентом: нові моделі штучного інтелекту OpenAI o3 та o4-mini тепер думають самостійно! – Зображення: Xpert.Digital

Розумніший, ніж будь-коли: o-серія OpenAI вражає новими можливостями

Математика, програмування та багато іншого: o4-mini від OpenAI – новий вундеркінд у світі штучного інтелекту! – o3 від OpenAI розуміє зображення та вирішує проблеми, як ніколи раніше!

16 квітня 2025 року OpenAI представила дві нові моделі штучного інтелекту у своїй серії o – o3 та o4-mini. Їх описують як найрозумніші та найпотужніші моделі компанії на сьогоднішній день. Нові системи мають розширені можливості міркування та вперше можуть самостійно використовувати та поєднувати всі інструменти, доступні в ChatGPT. Вони спеціально навчені довше думати, перш ніж генерувати відповіді, що робить їх особливо ефективними у складних завданнях у таких галузях, як програмування, математика та візуальний аналіз.

Підходить для цього:

ChatGPT отримує пам'ять і тепер запам'ятовує (майже) все: Детальний огляд нової функції пам'яті

Огляд нових моделей серії O

Основні характеристики та здібності

Серія o від OpenAI представляє собою зміну парадигми в розробці штучного інтелекту. Моделі були навчені за допомогою навчання з підкріпленням для виконання триваліших розумових процесів перед генеруванням відповідей. Такий підхід дозволяє моделям пробувати різні стратегії вирішення, розпізнавати помилки та розбивати складні проблеми на простіші підкроки.

Ключовим нововведенням в o3 та o4-mini є можливість використовувати всі доступні інструменти ChatGPT незалежно та на основі агентів. До них належать веб-пошук, аналіз даних на основі Python, обробка зображень, генерація зображень, canvas, автоматизація, пошук файлів та функції зберігання. Ці інструменти безпосередньо інтегровані в процес міркування моделей, щоб розширити їхні можливості та дозволити їм обробляти складніші завдання.

Моделі можуть самостійно вирішувати, коли і як найкраще використовувати ці інструменти, і зазвичай надають відповіді менш ніж за хвилину, навіть для складніших проблем. Це важливий крок до створення ChatGPT на основі агентів, який може виконувати завдання автономно.

Візуальне розуміння та мультимодальні навички

Особливо примітною особливістю нових моделей є їхня здатність «мислити» за допомогою зображень. За даними OpenAI, це означає, що вони можуть не лише сприймати візуальні дані, але й інтегрувати їх безпосередньо у свій процес міркування. Моделі можуть розуміти та аналізувати завантажені зображення, такі як дошки, ескізи та діаграми, навіть якщо вони низької якості.

Ці мультимодальні можливості виходять за рамки простої обробки зображень. Моделі можуть обрізати або трансформувати зображення, поєднувати їх з іншими інструментами та включати їх у свої міркування для отримання обґрунтованих висновків. Така інтеграція візуальних даних у процес мислення є значним прогресом у порівнянні з попередніми моделями штучного інтелекту.

Продуктивність та тести

o3 як флагманська модель

OpenAI o3 описується як найпотужніша модель міркування компанії, яка встановлює нові стандарти в таких галузях, як програмування, математика, наука та візуальне сприйняття. Оцінки зовнішніх експертів показують, що o3 робить приблизно на 20 відсотків менше серйозних помилок, ніж її попередниця, o1, під час вирішення складних реальних задач.

У різних бенчмарках o3 показує вражаючі результати:

Він досяг нових найкращих результатів у Codeforces та SWE-bench
Це встановлює нові стандарти в бенчмарку MMMU для навичок мультимодального розуміння
У наукових тестах, таких як GPQA Diamond, які вимірюють питання на рівні доктора філософії, o3 досягає точності 87,7% порівняно з 78% для o1

Модель демонструє особливі сильні сторони в програмуванні, консалтингу та творчих завданнях. Ранні тестувальники відзначили її аналітичну точність як партнера для мислення та наголосили на її здатності генерувати та критично оцінювати нові гіпотези, особливо в біологічному, математичному та технічному контекстах.

o4-mini як економічно ефективна альтернатива

o4-mini — це менша модель, оптимізована для швидкої та економічно ефективної обробки. Незважаючи на менший розмір, вона досягає вражаючої продуктивності, особливо в математиці, програмуванні та візуальних завданнях.

Це найпродуктивніша модель у бенчмарках AIME 2024 та 2025 років. В AIME 2025 вона навіть досягла вражаючої точності 99,5 відсотка з доступом до інтерпретатора Python. В експертних оцінках вона також перевершує свого попередника, o3-mini, у сферах, відмінних від STEM, та в науці про дані.

Завдяки своїй ефективності, o4-mini підтримує значно вищі ліміти використання, ніж o3, що робить його потужним варіантом для високопродуктивних програм з великим обсягом обробки, які потребують логічного мислення.

Галузі застосування та доступність

Можливе використання

Нові моделі, з їхніми покращеними можливостями, відкривають широкий спектр можливостей застосування:

Розв'язання складних проблем у науці та техніці, де їхня здатність розбивати проблеми на підетапи є особливо цінною
Завдання програмування та розробки програмного забезпечення, де вони можуть допомогти з генерацією та налагодженням коду
Високорівневий математичний та науковий аналіз
Візуальний аналіз діаграм, графіків та зображень
Агентні додатки, де ШІ самостійно використовує різні інструменти для вирішення завдань

Доступність для користувачів

Нові моделі будуть поступово доступні різним групам користувачів:

Користувачі ChatGPT Plus, Pro та Team мають доступ до o3, o4-mini та o4-mini-high у селекторі моделей з 16 квітня 2025 року, замінивши попередні моделі o1, o3-mini та o3-mini-high
Користувачі ChatGPT Enterprise та Edu отримають доступ протягом одного тижня після випуску
Безкоштовні користувачі можуть спробувати o4-mini, вибравши «Подумати» в редакторі перед надсиланням запиту
Обмеження тарифів для всіх планів залишаються незмінними порівняно з попередніми моделями

Підходить для цього:

Поточні розробки в Чатгпті фон Ондааї (березень 2025 р.)

Аспекти безпеки та подальший розвиток

Безпека та надійність: погляд на нові моделі OpenAI

OpenAI наголошує, що обидві моделі пройшли ретельне тестування безпеки – компанія стверджує, що це її найповніша програма безпеки на сьогоднішній день. Розширені можливості моделювання пропонують нові способи підвищення безпеки та надійності. Зокрема, моделі можуть враховувати політики безпеки OpenAI під час реагування на потенційно небезпечні запити – концепція, відома як «обдумане узгодження».

Цей реліз базується на версії 2 «Структури готовності» OpenAI. Консультативна група з питань безпеки (SAG) компанії розглянула результати оцінок готовності та дійшла висновку, що o3 та o4-mini не досягли порогу «Високий» у жодній із трьох контрольованих категорій (біологічні та хімічні можливості, кібербезпека та самовдосконалення ШІ).

Значення для ландшафту штучного інтелекту

Впровадження o3 та o4-mini є значним кроком в еволюції систем штучного інтелекту. Завдяки покращеним можливостям логічного мислення та інтеграції різних інструментів, ці моделі наближаються до агентної системи, здатної самостійно вирішувати складні завдання.

Завдяки цим моделям OpenAI продовжує позиціонувати себе на передовій розвитку штучного інтелекту, що підкреслюється нещодавнім раундом фінансування, який оцінив компанію в 300 мільярдів доларів. Поєднання покращеного мислення, інтеграції інструментів та мультимодальних можливостей може значно розширити сферу застосування ШІ та відкрити нові сфери застосування.

o3 та o4-mini: Потужні моделі штучного інтелекту для вирішення складних завдань

З o3 та o4-mini, OpenAI представила нові моделі штучного інтелекту, які є значним прогресом у розробці штучного інтелекту завдяки покращеним можливостям міркування та інтеграції різних інструментів. Ці моделі характеризуються здатністю обмірковувати складні проблеми та використовувати різні інструменти для пошуку рішень. Хоча o3 позиціонується як флагманська модель для вимогливих завдань, o4-mini пропонує економічно ефективну альтернативу, яка забезпечує вражаючу продуктивність, незважаючи на менший розмір.

Нові моделі вже доступні різним групам користувачів ChatGPT і, завдяки своїм покращеним можливостям, можуть розширити спектр застосувань штучного інтелекту. Водночас OpenAI наголошує на важливості безпеки та провів ретельне тестування моделей, щоб мінімізувати потенційні ризики. Розробка o3 та o4-mini знаменує собою важливий крок до агентних систем штучного інтелекту, які можуть дедалі більше самостійно виконувати складні завдання.

Підходить для цього:

Ваш глобальний партнер з маркетингу та розвитку бізнесу

☑ Наша ділова мова - англійська чи німецька

☑ Нове: листування на вашій національній мові!

Konrad Wolfenstein

Я радий бути доступним вам та моїй команді як особистого консультанта.

Ви можете зв’язатися зі мною, заповнивши тут контактну форму або просто зателефонуйте мені за номером +49 89 674 804 (Мюнхен) . Моя електронна адреса: Вольфенштейн ∂ xpert.digital

Я з нетерпінням чекаю нашого спільного проекту.