Опубліковано: 1 лютого 2025 р. / Оновлення з: 1 лютого 2025 р. - Автор: Конрад Вольфенштейн
Моделі AI O3 Mini та O3 Mini High тепер доступні як у ChatPGT, так і через API! - Зображення: xpert.digital
Просто розумніше: O3-Mini та O3-Mini-High зараз для додатків Chatpgt та API
OpenAI O3-Mini: квантовий стрибок у економічно ефективному розвитку AI для вимогливого мислення
Світ штучного інтелекту переживає ще одну віху з публікацією OpenAai O3-Mini. Ця сучасна модель, яка тепер доступна в Чатті та доступна через API, є останнім та найбільш економічним прогресом у серії міркувань від OpenAai. Представлений у грудні 2024 року, O3-Mini переосмислив можливості менших моделей та демонструє виняткові навички в галузі науки, техніки, інженерії та математики (STEM). Він характеризується не лише його вражаючою ефективністю, але й низькими витратами та зменшенням затримки порівняно з попередником Openaai O1-Mini.
OpenAI O3-Mini позначає зміну парадигми першою невеликою моделлю міркувань, яка, як очікується, підтримає довгоочікувані довгоочікувані функції розробників, такі як дзвінки на функції, структуровані видання та новини розробників. Це означає, що він був розроблений з нуля для негайного використання виробництва. Як і його попередники попереднього попереднього перегляду O1-Mini та O1, потокове потік O3-Mini також підтримує, що дозволяє гнучка та динамічна взаємодія. Розробники також мають можливість вибору між трьома рівнями інтенсивності для стінки придбання - низьким, середнім та високим. Ця гнучкість дозволяє пристосуватися до моделі до різних додатків: у разі складних проблем процес мислення може бути посилений, тоді як у часі критичні завдання фокус приділяється швидкості та низькій затримці.
Важлива примітка: O3-Mini не підходить для завдань із зоровим аналізом. Для таких додатків розробники повинні продовжувати відступати на OpenAI O1. O3-Mini вводиться в API Chat-Completion, Assistants-API та Batch-API, завдяки чому доступ спочатку обмежений вибраними користувачами API рівнів 3-5.
Підходить для цього:
Користувачі Chatgpt виграють від розширених функцій
Також є втішні новини для кінцевих користувачів: Chatgpt Plus користувачів, Team та Pro тепер можуть використовувати O3-Mini, тоді як клієнти підприємств отримують доступ у лютому. O3-Mini замінює O1-Mini у виборі моделі та пропонує більш високі межі розстрочки та менші часи затримки. Це робить його ідеальним вибором для завдань у сферах програмування, STEM та логічного вирішення проблем. Під час цього оновлення обмеження новин для плюс та користувачів команди з 50 повідомлень на день (з O1-Mini) до 150 повідомлень на день (з O3-Mini).
Крім того, O3-Mini зараз поєднується з функцією пошуку, щоб надати поточні відповіді відповідні джерела. Це являє собою ранній прототип, в той час як OpenAI працює для інтеграції функції пошуку у всі моделі міркувань. Ця інтеграція дозволяє моделі отримати доступ до більш широкого спектру інформації і, таким чином, генерувати більше звукових та відповідних відповідей.
Безкоштовне використання для всіх
Особливо неабияким нововведенням є наявність O3-Mini для користувачів БЕЗКОШТОВНОГО ПЛАНУ CHATGPT. Ви можете спробувати модель, вибравши "розум" у композитору новин або повернувши відповідь. Це перший раз, коли модель міркування пропонується для безкоштовних користувачів у Chatgpt і демонструє зобов'язання OpenAai зробити високоякісний ШІ доступним для всіх.
На сьогоднішній день ( 31 січня 2025 р. ) Користувачі безкоштовного плану OpenAI O3-Mini також можуть спробувати, вибравши "причину" у композитору новин або повторно генерувати відповідь. Це перший раз, коли модель міркування була доступна для безкоштовних користувачів у Chatgpt.
Хоча OpenAai O1 залишається всебічною моделлю для загальних знань, O3-Mini позиціонує себе як спеціалізовану альтернативу для технічних областей, які потребують точності та швидкості. За замовчуванням O3-Mini використовує стіну покупки середнього розміру для досягнення збалансованої комбінації швидкості та точності. Платні користувачі також мають можливість вибрати O3-Mini-High у виборі моделі, щоб використовувати більш розумну версію, яка потребує трохи більше часу для їх відповідей. Користувачі Pro користуються необмеженим доступом як до O3-Mini, так і до O3-Mini-High.
Продуктивність та оптимізація для завдань STEM
Як і його попередник O1, O3-Mini був спеціально оптимізований для завдань STEM. Завдяки стіні покупки середнього розміру O3-Mini досягає тієї ж продуктивності, що і O1, в математиці, програмуванні та науці, але дає значно швидші відповіді. Експертні відгуки показали, що O3-Mini не тільки надає більш точні та чіткі відповіді, але й має більш сильну здатність до мислення, ніж O1-Mini. У 56% випадків тестери віддавали перевагу відповіді від O3-Mini на відповіді O1-Mini і, у разі вимогливих, реалістичних питань, визначили зниження серйозних помилок на вражаючих 39%. Завдяки середній стінці купівлі, O3-Mini досягає однакових результатів у деяких найвибагливіших оцінках мислення та інтелекту, включаючи AIME та GPQA. Це підкреслює здатність моделі також вирішувати складні проблеми.
Детальні дані про продуктивність у різних областях
Математика конкуренції (AIME 2024): з математики O3-Mini з низькою стіною покупки досягає порівнянної послуги, такої як O1-Mini. Зі середніми зусиллями продуктивність вже відповідає виконанню O1, тоді як вона з великими зусиллями перевищує як O1-Mini, так і O1. Ці результати підкреслюють здатність O3-Mini краще вирішувати математичні задачі зі збільшенням інтенсивності стіни купівлі.
Питання доктора наук (GPQA Diamond): в області наук, особливо для біологічних, хімічних та фізичних питань на рівні доктора наук, O3-Mini з низькою стінкою покупки перевищує продуктивність O1-Mini. Він навіть досягає рівня O1 з великими зусиллями. Це свідчить про те, що O3-Mini здатний відповісти та розуміти вимогливі наукові питання.
Дослідження математики (Frontiermath): У математичних дослідженнях O3-Mini перевищує свого попередника в Frontiermath з високою стіною покупки. У випадку завдань з інструментами Python, O3-Mini вирішує понад 32 % проблем з першою спробою, включаючи понад 28 % вимогливих проблем Т3. Це чіткий доказ здатності моделі вирішувати складні математичні проблеми та розвивати інноваційні рішення.
Програмування конкуренції (Codeforces): У програмах конкуренції на рівні Codeforces O3-Mini постійно досягає більш високих значень ELO зі збільшенням стіни покупки. Навіть із середніми зусиллями, продуктивність O1 відповідає, тоді як з великими зусиллями він перевищує як O1, так і O1-Mini. Ці результати ілюструють вражаючу здатність моделі розуміти та генерувати код.
Інженерія програмного забезпечення (перевірена SWE-Bench): У сфері розробки програмного забезпечення O3-Mini є найпотужнішою моделлю, що OpenAi опублікував для перевірки SWEEL. Це підкреслює ефективність моделі в практичних сценаріях розробки програмного забезпечення.
Загальні знання: Оцінки даних показують чіткі переваги O3-Mini порівняно з O1-Mini в різних сферах загальних знань. Це вказує на те, що O3-Mini розробив більш всебічне розуміння світу.
Швидкість та ефективність
На додаток до високої продуктивності, O3-Mini також характеризується його вражаючою швидкістю та ефективністю. У тестовій серії A/B O3-Mini був на 24% швидше, ніж O1-Mini. Середній час відгуку становив 7,7 секунди порівняно з 10,16 секунд при O1-Mini. Це значне поліпшення часу відповіді робить O3-Mini привабливим варіантом для застосувань, в яких швидкість має вирішальне значення.
Підходить для цього:
Безпека та орієнтація
OpenAI надає велике значення безпеці своїх моделей. Щоб забезпечити, щоб O3-Mini генерує захищені відповіді, використовувались доляційні методи вирівнювання. Оцінки безпеки показують, що O3-Mini краще в тестах на складні сценарії безпеки та джейлбрейка, ніж GPT-4O. Це підкреслює зобов'язання OpenAI для розробки безпечних та відповідальних систем AI.
O3-Mini: Прогресивний ШІ для розумнішого майбутнього
O3-Mini підкреслює місію OpenAai розвивати недорогий ШІ та ще більше демократизувати високоякісний інтелект. Завдяки своїй спеціалізації в завданнях STEM, низькі витрати та неабияка ефективність, O3-Mini встановлює нові стандарти та прокладає шлях для майбутніх інновацій у галузі штучного інтелекту. Модель є жвавим прикладом того, як AI стає все більш ефективним та доступним і має потенціал для багато в чому покращити наше життя. "Публікація O3-Mini" позначається, як часто кажуть, "значний крок до майбутнього, в якому AI є невід'ємною частиною нашого повсякденного життя".
Розробка таких моделей, як O3-Mini, є постійним процесом. Постійне вдосконалення алгоритмів, оптимізація нейронних мереж та збір все більших наборів даних призведе до ще більш потужних та ефективних систем AI в майбутньому. Це просувається не лише обіцяти подальше просування технологічного прогресу, але й позитивний вплив на багато сфери нашого життя. Від медицини до освіти до навколишнього середовища - можливості майже нескінченні.
"Введення O3-Mini", за словами старшого розробника OpenAai, є "ще одним кроком на шляху вирішення найскладніших проблем людства за допомогою штучного інтелекту". Саме це бачення керує роботою OpenAi і призводить нас до майбутнього, в якому AI є потужним інструментом для вдосконалення нашого світу. "Ми бачимо розвиток O3-Mini як важливий будівельний блок, який дозволяє нам зробити інтелект доступним для широкої аудиторії, не нехтуючи виконанням",-додає він.
Підсумовуючи це, можна сказати, що OpenAai O3-Mini-це не лише технічний прорив, але й доказ того, як передові технології можуть бути використані для зміни світу та для формування майбутнього, в якому штучний інтелект є важливою частиною нашого життя. "Постійний розвиток таких моделей", як виражає експерт AI, є "доказом людського інноваційного духу та невпинного прагнення до знань та прогресу".
Підходить для цього:
Ми там для вас - поради - планування - впровадження - управління проектами
☑ Наша ділова мова - англійська чи німецька
☑ Нове: листування на вашій національній мові!
Я радий бути доступним вам та моїй команді як особистого консультанта.
Ви можете зв’язатися зі мною, заповнивши тут контактну форму або просто зателефонуйте мені за номером +49 89 674 804 (Мюнхен) . Моя електронна адреса: Вольфенштейн ∂ xpert.digital
Я з нетерпінням чекаю нашого спільного проекту.