Щойно GPT-5.3 запустили, як усі вже говорять про GPT-5.4: Екстремальні міркування та 2 мільйони токенів

Попередній реліз Xpert

Available in 27 languages 📢

Віддавайте перевагу Xpert.Digital у Googleⓘ

Опубліковано: 5 березня 2026 р. / Оновлено: 5 березня 2026 р. – Автор: Konrad Wolfenstein

Щойно GPT-5.3 запустили, як усі вже говорять про GPT-5.4: Extreme Reasoning & 2 Million Tokens – Зображення: Xpert.Digital

Квантовий стрибок для OpenAI? Прихований гігант ШІ: Як OpenAI прагне перевершити Google та Anthropic за допомогою GPT-5.4

Випадково витік інформації: нова мега-модель OpenAI GPT-5.4 ось-ось вийде

Загадковий твіт із п'яти слів та поспішно видалені фрагменти коду на GitHub сколихнули світовий світ технологій: OpenAI, очевидно, готується до запуску своєї наступної великої мовної моделі – GPT-5.4. Те, що спочатку може здатися непомітним, поступовим оновленням, при детальнішому розгляді виявляється потенційною віхою у запеклій боротьбі за верховенство ШІ. Завдяки таким новаторським функціям, як ресурсоємний режим «Екстремального мислення», величезне контекстне вікно до двох мільйонів токенів та ідеальний аналіз зображень до пікселів, компанія озброюється, щоб перевершити конкурентів, таких як Google та Anthropic. Але прискорений цикл випуску має свою ціну: хоча моделі стають дедалі автономнішими та еволюціонують у справжніх агентів, витрати на інфраструктуру стрімко зростають, а на тлі суперечливих угод із Пентагоном етична та економічна доцільність цього швидкого прогресу все більше виходить на перший план.

GPT-5.4: Наступний квантовий стрибок OpenAI між екстремальним мисленням та боротьбою за верховенство ШІ

Якщо п'яти слів про X достатньо, щоб спричинити хаос у всій індустрії штучного інтелекту, то на кону стоїть не просто нова модель

Це було повідомлення безпрецедентно стисло, проте воно сколихнуло всю індустрію штучного інтелекту. 3 березня 2026 року, рівно через годину після того, як OpenAI випустила свою нову мовну модель GPT-5.3 Instant для широкої бази користувачів, на офіційному X-каналі компанії з'явився пост із п'яти слів , який протягом кількох годин зібрав три мільйони переглядів і 25 000 лайків: «5.4 швидше, ніж ви думаєте». Жодного зображення, жодної пояснювальної теми, жодного посилання на допис у блозі. Лише п'ять слів і помітна велика літера T, які миттєво запустили спекулятивну машину світової спільноти розробників та інвесторів. Те, що на перший погляд може здатися маркетинговим тизером, при детальнішому розгляді виявляється найчіткішим публічним підтвердженням на сьогоднішній день того, що OpenAI готує модель з GPT-5.4, яка може докорінно змінити правила конкуренції ШІ.

Цей твіт не з'явився на порожньому місці. Він з'явився після тижня, протягом якого три незалежні витоки з власного репозиторію Codex OpenAI розкрили внутрішню роботу майбутньої моделі, перш ніж інженери, які поспішно видаляли інформацію, змогли замести сліди. А як повідомляє технологічний журнал The Information, посилаючись на людину, знайому з планами, GPT-5.4 включатиме режим міркування «Екстремальний», що дозволить моделі використовувати значно більше обчислювальної потужності, ніж її попередники, для вирішення складних проблем. Те, що спочатку звучить як поступове оновлення, може змінити динаміку сил між OpenAI, Google та Anthropic, ще більше стиснути структуру витрат на інфраструктуру штучного інтелекту та поставити питання про те, чи є бізнес-модель, що лежить в основі цих дедалі потужніших моделей, стійкою в довгостроковій перспективі.

Анатомія мимовільного одкровення

Історія GPT-5.4 почалася не з запланованого прес-релізу, а з помилки, яка повторюється з тривожною регулярністю у світі розробки програмного забезпечення: інженер написав код, який розкрив більше, ніж мав би. 28 лютого 2026 року у загальнодоступному репозиторії Codex на GitHub з'явився пул-реквест із внутрішнім позначенням 13050. Він містив перевірку версії, в якій чітко вказувалося на «GPT-5.4 або новішу версію» як мінімальну вимогу для нової функції обробки зображень. Спільнота виявила запис протягом кількох годин. Рядок, про який ішла мова, був поспішно змінений на «gpt-5.3-codex або новішу версію», а історію комітів було перезаписано за допомогою примусового надсилання, але на той час скріншоти вже широко поширювалися на X та Reddit.

Найважливішим моментом цього витоку було те, що він не був тимчасовим. Код реалізував певну функціональність, а саме обробку зображень повної роздільної здатності, яка технічно працює лише з можливостями GPT-5.4. Інженер написав перевірку версії, оскільки ця функція просто не працювала на старіших моделях. Це було функціональне посилання, а не спекулятивне.

Кілька днів по тому, 2 березня, було надіслано другий пул-реквест, номер 13212, який додатково прояснив проблему. Розробник OpenAI з іменем користувача pash-openai додав функцію перемикання швидкого режиму до терміналу Codex. У його описі чітко згадувалося "перемикання швидкого режиму для GPT-5.4" та введено так зване перерахування ServiceTier з варіантами Standard та Fast. Це посилання також було видалено протягом кількох годин, але технічні деталі вже були задокументовані.

Паралельно, співробітник OpenAI на ім'я Тібо спричинив ще один ненавмисний витік інформації, опублікувавши скріншот вибору моделі в застосунку Codex, на якому GPT-5.4 показано як опцію вибору поряд з GPT-5.3 Codex. Публікацію швидко видалили, але зображення вже стало вірусним. Зрештою, розробник nicdunz повідомив на X, що кінцева точка з позначкою "alpha-gpt-5.4" тимчасово з'явилася в публічному списку моделей API, що відповідає звичайній практиці OpenAI тестування моделей в альфа-ендпойнтах перед їх офіційним випуском.

Разом ці чотири незалежні точки даних — два коміти коду, скріншот співробітника та кінцева точка API — малюють картину, яка виходить далеко за рамки простих припущень. GPT-5.4 існує внутрішньо в OpenAI, знаходиться на просунутій стадії розробки та активно готується до розгортання у виробничому середовищі.

Обіцянка двох мільйонів токенів та її обмеження

Найбільш технічно значуще твердження, отримане з витіків посилань на код, стосується контекстного вікна. Аналіз витіків комітів, проведений NxCode, показує контекстне вікно в два мільйони токенів, що вп'ятеро перевищує ліміт у 400 000 токенів поточної флагманської моделі GPT-5 та у вісім разів перевищує 256 000 токенів Кодексу GPT-5.3. Для порівняння, два мільйони токенів приблизно еквівалентні 5000 друкованих сторінок — достатньо для обробки всієї кодової бази, тривалого судового провадження з усіма супровідними документами або багатотомної наукової статті за один сеанс.

Однак, тут необхідно зробити важливе розмежування. Хоча витоки коду вказують на два мільйони токенів, The Information, посилаючись на джерело, знайоме з планами, повідомляє про контекстне вікно в один мільйон токенів. Це все одно означало б подвоєння або навіть чотирикратне збільшення обсягу попередника та поставило б OpenAI на один рівень з Google Gemini 2.5 Pro, який наразі пропонує найбільше комерційно доступне контекстне вікно з одним мільйоном токенів. Ретельний огляд джерел показує, що цифра в два мільйони походить з одного допису інфлюенсера та не підтверджується безпосередньо жодною з чотирьох задокументованих витоків коду, тоді як цифра в один мільйон походить з відомого технічного видання.

Незалежно від того, яке число зрештою виявиться правильним, наслідок буде однаковим: OpenAI скорочує один із своїх найявніших розривів із конкурентами. Моделі Gemini від Google довгий час пропонували значно більше контекстне вікно, ніж будь-що, що пропонував OpenAI, а Claude Opus 4.6 від Anthropic, запущений на початку лютого 2026 року з власним вікном в один мільйон токенів та підтримкою паралельних команд агентів, ще більше закріпив цю перевагу. GPT 5.4 з одним або навіть двома мільйонами токенів докорінно змінить цей баланс сил.

Практичне застосування такого стрибка є різноманітним і виходить далеко за рамки академічних орієнтирів. Юридичні фірми могли б обробляти цілі файли справ в одному вікні розмови. Команди розробників програмного забезпечення змогли б завантажувати цілі кодові бази для аналізу та рефакторингу кількох файлів без необхідності фрагментувати код. Дослідницькі групи могли б надавати повні корпуси літератури для синтезу. Перехід від сотень тисяч до мільйонів токенів не є поступовим; він фундаментально змінює, які завдання взагалі здійсненні в рамках взаємодії з однією моделлю.

Екстремальні міркування: коли ШІ потрібно більше часу на роздуми

Окрім переходу до контекстного вікна, анонсований режим міркування «Екстремальний» є другою визначальною особливістю GPT-5.4. Як повідомляє The Information, ця функція дозволяє моделі виділяти значно більше обчислювальної потужності на складні питання, що дозволяє проводити глибший когнітивний аналіз. Згідно з наявною інформацією, цей режим в першу чергу орієнтований на дослідників, а не на звичайних користувачів, які очікують швидких відповідей.

Ідея режиму Extreme Reasoning базується на тенденції, що з'явилася з моменту запровадження OpenAI серії моделей міркувань o: цілеспрямоване перенесення обчислювальних зусиль з фази навчання на фазу логічного висновку. Замість того, щоб просто зробити модель потужнішою шляхом більш інтенсивного навчання, це дає змогу інвестувати більше часу та обчислювальних ресурсів у фактичну генерацію відповіді. У випадку GPT-5.4 це означає, що модель може обробляти значно вищі обчислювальні вимоги для особливо складних наукових, математичних або технічних задач, що призводить до більш точного та глибокого аналізу.

Велика літера «Т» у твіті OpenAI викликала широкі спекуляції у спільноті щодо того, що GPT-5.4 буде так званою моделлю класу «Мислення». OpenAI вже внутрішньо розмежував різні класи моделей: моделі «Мислення» для глибокого мислення, моделі Codex для розробки програмного забезпечення на основі агентів та моделі Instant для щоденного розмовного використання. Таким чином, велика літера «Т» була б навмисним посиланням на внутрішню назву бренду Thinking-Mode. Таке тлумачення є правдоподібним, але залишається непідтвердженим.

Конкретні наслідки цих розширених можливостей міркування для бізнес-користувачів можна проілюструвати на конкретних сценаріях. У фармацевтичних дослідженнях екстремальний режим міркування може значно поглибити аналіз взаємодії ліків. У фінансовому аналізі складні похідні структури або макроекономічні моделі можна було б дослідити з такою ретельністю, яка раніше вимагала кількох послідовних взаємодій моделей. У розробці програмного забезпечення можна було б виявити помилки у вкладених системах, помилки, які раніше створювали систематичні труднощі для моделі.

Аналіз зображень з точністю до пікселя: кінець компромісів

Третій технічний прорив, задокументований витоками запитів на зчитування, стосується обробки зображень. Код у PR 13050 додає прапорець функції, який безпосередньо та нестиснено передає оригінальні дані зображення у форматах PNG, JPEG та WebP до Responses API, керований новим параметром API "detail: original". Мінімальна вимога для цієї функції — 5.4, тобто це розширення, специфічне для GPT 5.4, і його не можна перенести на старіші версії.

Поточні моделі GPT стискають завантажені зображення перед обробкою, що знижує якість аналізу для завдань, що потребують точності на рівні пікселів. Це включає медичну візуалізацію, супутникові знімки, оптичне розпізнавання символів (OCR) у документах, перевірку архітектурних планів та технічних схем, а також контроль якості макетів дизайну та інтерфейсів користувача. Можливість обробки зображень з повною роздільною здатністю катапультуватиме GPT-5.4 у низку професійних застосувань, де попередні моделі досягли своїх меж через стиснення зображень.

Для компаній, що використовують систему контролю якості на базі штучного інтелекту у виробництві, автоматизованій обробці документів у юридичному чи фінансовому секторах, або діагностиці на основі зображень у медицині, це означатиме значний крок уперед у напрямку негайної практичної вигоди. Не випадково OpenAI чітко пов'язав цю функцію з GPT-5.4: обробка нестиснених зображень високої роздільної здатності вимагає значно більшої обчислювальної потужності та пропускної здатності пам'яті, що збільшує технічні вимоги до базової моделі та інфраструктури.

Задаючи темп перегонів: прискорена частота випусків OpenAI

Один аспект, який є щонайменше таким же важливим, як і технічні характеристики, в обговоренні GPT-5.4 стосується швидкості, з якою OpenAI випускає нові варіанти моделей. З моменту запуску GPT-5 7 серпня 2025 року компанія випустила більше варіантів у серії GPT-5, ніж за всю еру GPT-4 за порівнянний період часу.

Хронологія ілюструє прискорення: GPT-5 було випущено у серпні 2025 року, GPT-5.1 – у листопаді 2025 року після тримісячної перерви, GPT-5.2 з'явився у грудні 2025 року лише через місяць, GPT-5.3 Codex було випущено 5 лютого 2026 року, GPT-5.3 Codex Spark – через тиждень, 13 лютого, а GPT-5.3 Instant було запущено 3 березня 2026 року. Якщо GPT-5.4 фактично буде випущено у березні чи квітні, перерва скоротиться приблизно до одного місяця. Прогнозовані ринки на Manifold дають моделі 55-відсоткову ймовірність випуску до квітня 2026 року та 74-відсоткову ймовірність до червня.

Згідно з The Information, цей прискорений темп є навмисним стратегічним рішенням. Частіші випуски моделей мають на меті контролювати очікування користувачів. Ажіотаж навколо запуску GPT-5 встановив планку настільки високо, що її було практично неможливо перевершити, а зростання кількості користувачів OpenAI нещодавно виявилося не таким високим, як очікувалося, і внутрішні прогнози зростання не виправдали. Постійно впроваджуючи нові, поступові вдосконалення, а не зосереджуючись на одному великому випуску, компанія може підтримувати увагу галузі без ризику розчаровуючої окремої події.

Однак, ця стратегія має й зворотний бік. Розробники, що працюють на API OpenAI, все частіше повідомляють про певну втому від міграції. Швидка зміна варіантів нових моделей вимагає повторюваних циклів оцінки та коригування власних систем. Для компаній, які використовують програми штучного інтелекту у виробничому середовищі, виникає питання, чи виправдовують зусилля, пов'язані з постійними оновленнями, переваги кожного поступового покращення.

Новий вимір цифрової трансформації з «керованим ШІ» (штучним інтелектом) – платформа та рішення B2B | Xpert Consulting

Новий вимір цифрової трансформації з «керованим ШІ» (штучним інтелектом) – платформа та рішення B2B | Xpert Consulting - Зображення: Xpert.Digital

Тут ви дізнаєтеся, як ваша компанія може швидко, безпечно та без високих бар'єрів входу впроваджувати індивідуальні рішення на основі штучного інтелекту.

Керована платформа штучного інтелекту — це ваше комплексне та безтурботне рішення для штучного інтелекту. Замість того, щоб мати справу зі складними технологіями, дорогою інфраструктурою та тривалими процесами розробки, ви отримуєте готове рішення, адаптоване до ваших потреб, від спеціалізованого партнера — часто всього за кілька днів.

Основні переваги з першого погляду:

⚡ Швидке впровадження: від ідеї до готового до використання застосунку за лічені дні, а не місяці. Ми пропонуємо практичні рішення, які створюють негайну додану цінність.

🔒 Максимальна безпека даних: Ваші конфіденційні дані залишаються з вами. Ми гарантуємо безпечну та відповідність вимогам обробку без передачі даних третім особам.

💸 Без фінансових ризиків: Ви платите лише за результат. Повністю виключаються значні початкові інвестиції в обладнання, програмне забезпечення чи персонал.

🎯 Зосередьтеся на своєму основному бізнесі: Зосередьтеся на тому, що ви робите найкраще. Ми подбаємо про повне технічне впровадження, експлуатацію та обслуговування вашого рішення на базі штучного інтелекту.

📈 Орієнтований на майбутнє та масштабований: Ваш ШІ зростає разом з вами. Ми забезпечуємо постійну оптимізацію та масштабованість, а також гнучко адаптуємо моделі до нових вимог.

Більше інформації тут:

Кероване рішення на основі штучного інтелекту – промислові послуги зі штучним інтелектом: ключ до конкурентоспроможності в секторах послуг, промисловості та машинобудування

Гонка за ШІ загострюється: як GPT-5.4 прагне затьмарити Google та Anthropic

Конкурентне середовище: три корпорації, одні перегони, немає явного переможця

Гонка за ШІ загострюється: як GPT-5.4 прагне затьмарити Google та Anthropic

Оголошення про GPT-5.4 відбувається в той час, коли конкуренція між трьома провідними лабораторіями штучного інтелекту досягла безпрецедентного рівня інтенсивності. 5 лютого 2026 року OpenAI та Anthropic випустили свої відповідні нові флагманські моделі з різницею в годину, що яскраво ілюструє динаміку цієї гонки озброєнь. Anthropic представила Claude Opus 4.6, який пропонує покращення для довгоконтекстного мислення, контекстне вікно на один мільйон токенів та підтримку паралельних команд агентів, що дозволяє кільком агентам ШІ одночасно працювати над завданнями програмування та документування. OpenAI відповів GPT-5.3 Codex, оптимізованим для агентного програмування та розробки програмного забезпечення.

Результати незалежних порівняльних тестів показали, що жодна з моделей не може претендувати на явне загальне лідерство, а переваги в продуктивності варіюються залежно від застосування. Claude Opus 4.6 показав особливо хороші результати в професійному мисленні, тоді як GPT-5.3-Codex продемонстрував переваги в автономній розробці програмного забезпечення. Тим часом, Gemini 2.5 Pro від Google встановив рекорд за найширшу контекстно-орієнтовану обробку з вікном контексту в один мільйон токенів та пропонував потужні мультимодальні можливості.

GPT-5.4 буде спробою OpenAI повернути собі технологічне лідерство одночасно на кількох фронтах: у контекстному вікні завдяки новому ліміту в один або два мільйони токенів, в міркуваннях завдяки екстремальному режиму та в обробці зображень завдяки аналізу з точністю до пікселів. Чи вдасться це зробити, значною мірою залежить від того, як швидко Google та Anthropic відреагують власними оновленнями. Галузь працює в темпі, коли технологічні переваги можуть бути зруйновані протягом кількох тижнів.

Для позиціонування на корпоративному ринку важливий ще один фактор: згідно з галузевими аналізами, Anthropic нещодавно займала 32-відсоткову частку ринку використання мовних моделей штучного інтелекту в корпоративному секторі, що є значною зміною ситуації дворічної давнини, коли OpenAI все ще домінував з 50 відсотками. Хоча зосередження OpenAI на споживчо-орієнтованій стратегії через ChatGPT забезпечило компанії величезну базу користувачів, Anthropic досягла значного прогресу в прибутковому корпоративному сегменті завдяки своїй послідовній зосередженості на професійних робочих процесах та інструментах, таких як Claude Code.

Пентагон, протести та криза довіри

Технічний аспект GPT-5.4 не можна розглядати окремо від політичного та соціального контексту, в якому зараз працює OpenAI. Лише за кілька днів до оголошення OpenAI підписав контракт з Міністерством оборони США на розміщення своїх моделей у секретних мережах, що викликало негайну та сильну негативну реакцію.

Передісторія показова: Anthropic відмовилася надати Пентагону необмежений доступ до своєї технології, встановивши обмеження на її використання в системах масового спостереження та автономних озброєннях. Пентагон відповів, класифікувавши Anthropic як ризик для ланцюга поставок та заборонивши використання Claude в уряді, що спонукало президента Трампа наказати федеральним агентствам негайно припинити використання технології Anthropic. OpenAI скористалася цією можливістю та оголосила про власну угоду, яка, за словами компанії, містить сильніші гарантії безпеки, ніж будь-яка попередня угода щодо засекречених розгортань ШІ.

Реакцією стала шквал обурення. Рух сформувався під хештегом #CancelChatGPT та через платформу quitgpt.org, мобілізувавши, за власними даними, понад 1,5 мільйона людей через скасування підписок, заклики до бойкоту в соціальних мережах та реєстрації на вебсайті кампанії. Claude тимчасово обігнав ChatGPT, ставши найбільш завантажуваним безкоштовним додатком в Apple App Store. Крейдяні графіті з атаками на угоду з Пентагоном з'явилися біля офісів OpenAI в Сан-Франциско, а графіті з вихвалянням відмови з'явилися біля офісів Anthropic.

Сем Альтман визнав, що оптика виглядала «недбало», а OpenAI опублікувала уривки з контракту, які містили чіткі заборони на масове внутрішнє спостереження, повністю автономні системи зброї та схеми соціального кредитування. Відкритий лист, підписаний 796 співробітниками Google та OpenAI, попереджав, що уряд США намагається «розколоти компанії, вселяючи страх, що кожна з них відступить».

У цьому контексті прискорений випуск GPT-5.4 набуває додаткового стратегічного виміру. Технологічно вражаючий запуск моделі може слугувати контрнаративом кризі довіри та переключити увагу громадськості з суперечливого партнерства з Пентагоном на інноваційну силу компанії.

Економічне рівняння: між рекордними доходами та рекордними збитками

Фінансовий стан OpenAI, мабуть, є найважливішим фактором, що впливає на оцінку GPT-5.4. Компанія опинилася в парадоксальному становищі: ніколи раніше технологічна компанія не зростала так швидко, одночасно зазнаючи таких високих збитків.

Річний дохід у 2025 році досяг 20 мільярдів доларів, що на 233 відсотки більше, ніж 6 мільярдів доларів попереднього року та 2 мільярди доларів у 2023 році. Фактичний загальний дохід за 2025 рік склав 13 мільярдів доларів, що перевищило власний прогноз компанії в 10 мільярдів доларів, тоді як витрати на рівні 8 мільярдів доларів залишилися нижчими за цільовий показник у 9 мільярдів доларів. Однак, витрати зростають паралельно. Внутрішні документи, отримані The Information, прогнозують збитки в розмірі 14 мільярдів доларів за 2026 рік, що приблизно втричі перевищує попередні оцінки на 2025 рік. За період з 2023 року до кінця 2028 року OpenAI внутрішньо очікує сукупні збитки в розмірі 44 мільярдів доларів, перш ніж очікувати свого першого прибутку в розмірі 14 мільярдів доларів у 2029 році.

Валовий прибуток становить близько 33-40 відсотків, що значно нижче, ніж у традиційних програмних компаній, і обмежений змінними обчислювальними витратами. Витрати на логічний висновок, тобто витрати на запуск моделей у режимі реального часу, досягли 8,4 мільярда доларів у 2025 році та, за прогнозами, зростуть до 14,1 мільярда доларів у 2026 році. Хоча OpenAI вдалося знизити витрати на логічний висновок до рівня нижче одного долара на мільйон токенів, частково завдяки використанню різних типів обладнання, сам масштаб використання зводить нанівець цей приріст ефективності.

Для фінансування цих витрат OpenAI наприкінці лютого 2026 року завершила найбільший в історії раунд приватного фінансування: 110 мільярдів доларів, на чолі з Amazon з 50 мільярдами доларів, SoftBank та Nvidia з 30 мільярдами доларів кожна, при оцінці до фінансування у 730 мільярдів доларів та після фінансування у 840 мільярдів доларів. Потужність центрів обробки даних потроїлася з 200 мегават до 1,9 гігават, що еквівалентно споживанню електроенергії приблизно двома мільйонами домогосподарств. На період до 2030 року OpenAI планує скласти загальні витрати на обчислювальну потужність близько 600 мільярдів доларів, що менше від попередньої оцінки в 1,4 трильйона доларів, яка пізніше була переглянута як надмірно оптимістична.

Що означає GPT-5.4 для економіки інфраструктури

Модель з двома мільйонами токенів контексту та екстремальним режимом міркування ставить значно вищі вимоги до обчислювальної інфраструктури, ніж її попередники. Більше вікно контексту означає, що модель повинна обробляти значно більше даних з кожним запитом, що збільшує вимоги до сховища та час обробки на запит. Екстремальний режим міркування, який, згідно зі звітами, дозволяє обробляти окремі завдання протягом кількох годин, багаторазово збільшує обчислювальні зусилля на запит порівняно зі стандартною операцією логічного висновку.

Для OpenAI це означає подальше загострення і без того напруженого зв'язку між доходами та витратами на інфраструктуру. Кожна нова модель вимагає більшої обчислювальної потужності. Кожне збільшення обчислювальної потужності вимагає більшого капіталу. Кожне збільшення капіталу вимагає демонстрації шляху до прибутковості, який зміщується все далі в майбутнє з кожним поколінням моделі. Якщо доходи становлять близько 20 мільярдів доларів, а загальні витрати – від 25 до 28 мільярдів доларів, це призводить до неявних щорічних збитків у діапазоні від 5 до 8 мільярдів доларів.

Стратегічна відповідь на цю дилему полягає у двосторонньому підході: з одного боку, OpenAI значно інвестує у власне обладнання. Партнерство з Broadcom для розробки спеціально розроблених прискорювачів штучного інтелекту потужністю десять гігават, проект центру обробки даних Stargate з SB Energy від SoftBank та угода з Amazon про використання чіпів Trainium мають на меті скоротити витрати в довгостроковій перспективі. З іншого боку, OpenAI все більше диференціює свої модельні пропозиції за різними класами продуктивності — Instant для щоденного використання, Thinking для глибокого мислення та Codex для агентного програмування — щоб розподіляти обчислювальні ресурси за потреби та уникати необхідності використовувати повну потужність моделі для кожного запиту користувача.

Впровадження перемикача швидкого режиму для GPT-5.4, як було виявлено у витіклих пул-реквестах, свідчить про те, що OpenAI також впроваджує таку диференціацію в окремих моделях. Користувачі можуть вибирати між швидшими, економічно ефективнішими запитами та більш поглибленим, обчислювально ресурсоємним аналізом, залежно від своїх потреб, що дозволяє ефективніше використовувати інфраструктуру.

Штучний інтелект на основі агентів: реальний зсув парадигми, що стоїть за цифрами

За вражаючими цифрами щодо вікон контексту та лімітів токенів криється зміна парадигми, яка може бути більш важливою для економічного значення GPT-5.4, ніж будь-яка окрема технічна специфікація: еволюція до агентного штучного інтелекту. Звіти про GPT-5.4 описують покращення, які рухають модель до «справжніх агентів», здатних автономно виконувати багатоетапні завдання.

Лінійка розробок у серії GPT-5 ілюструє цей прогрес. GPT-5.2 чудово справлявся з окремими завданнями. GPT-5.3 Codex оптимізував автономне програмування та використання терміналів, і тепер має 1,5 мільйона активних користувачів щотижня. GPT-5.4 прагне запропонувати ширші автономні можливості в програмуванні, дослідженнях та візуальних завданнях. Покращені можливості пам'яті в багатоетапних процесах та зниження рівня помилок у складних завданнях були чітко згадані як особливості.

Цей розвиток подій має значні наслідки для корпоративного ринку. За даними аналітиків Gartner, до кінця 2026 року приблизно 70 відсотків компаній зі списку Fortune 500 можуть використовувати архітектури агентів GPT 5.x для основних робочих процесів, що чинить значний тиск на традиційних постачальників корпоративного програмного забезпечення. Більше половини всіх компаній вже вивчають використання агентів штучного інтелекту, плануючи такі програми, як адміністративні завдання, обслуговування клієнтів та створення контенту, але лише 12 відсотків вийшли з експериментальної фази та перейшли до повного розгортання.

Інвестиції великих технологічних компаній у базову інфраструктуру відображають очікування щодо цього ринку. Microsoft планує капітальні витрати у розмірі 85 мільярдів доларів, Google – 70 мільярдів доларів, Meta – 65 мільярдів доларів, а Amazon – 97 мільярдів доларів, що загалом становитиме майже 320 мільярдів доларів лише на обчислювальну інфраструктуру. Ці суми витрачаються не на покращення чат-ботів, а на створення основи для автономних робочих процесів, у яких агенти штучного інтелекту візьмуть на себе завдання, які раніше вимагали втручання людини.

Питання довіри: Безпека в тіні перегонів

Прискорена частота випусків та зростання продуктивності моделей піднімають питання, яке виходить за рамки технічних та економічних аспектів: а як щодо безпеки? Деміс Хассабіс, генеральний директор Google DeepMind, публічно попередив, що конкурентні умови та тиск, спрямований на перевершення конкурентів, можуть призвести до поспішних та небезпечних рішень, оскільки галузь наближається до надлюдського штучного інтелекту.

GPT-5.3 Instant показала неоднозначну картину в цьому відношенні. Модель досягла зниження рівня галюцинацій на 26,8 відсотка для веб-запитів у критичних галузях, таких як медицина, право та фінанси, та зниження на 19,7 відсотка при використанні лише внутрішніх баз знань. Водночас незалежні аналізи показали, що модель регресувала в деяких сферах безпеки порівняно з попередницею, пропускаючи більше потенційно шкідливого контенту. Зменшення кількості відхилень, яке рекламується як покращення зручності використання, схоже, знизило поріг, за яким модель блокує запити.

Для GPT-5.4 з його режимом екстремального мислення ці проблеми безпеки ще гостріші. Модель, здатна автономно працювати над складними проблемами годинами, повинна мати надійні механізми, що запобігають відхиленню від заздалегідь визначених обмежень під час цих тривалих фаз обробки. Послаблення бар'єрів безпеки в гонитві за частку ринку не є абстрактним ризиком, як ілюструє нещодавній звіт Axios, який показує, що компанії, що займаються штучним інтелектом, дедалі більше послаблюють свої протоколи безпеки, щоб отримати конкурентну перевагу в інноваціях.

Перспектива: Нова норма постійних збоїв

GPT-5.4 — це не ізольований продукт, а радше симптом динаміки галузі, яка в кількох аспектах переживає незвідані часи. Щомісячний випуск OpenAI дедалі потужніших моделей у поєднанні з майже одночасними оновленнями від Google та Anthropic створює стан постійних збоїв, коли будь-яку технологічну перевагу можна подолати протягом кількох тижнів.

Для компаній, що використовують технології штучного інтелекту, це означає фундаментальну зміну принципів планування. Створення застосунків на основі однієї моделі або постачальника стає дедалі ризикованішим. Модельно-агностичні архітектури, які дозволяють безперешкодне перемикання між OpenAI, Anthropic та Google, стають необхідністю. Цикли оцінювання, які раніше відбувалися щоквартально, мають бути скорочені до щомісячних або навіть двотижневих циклів.

Водночас, логіка оцінювання моделей штучного інтелекту змінюється. Питання більше не в тому, яка модель досягає найвищого балу в бенчмарках, а в тому, яка модель забезпечує найнадійніші результати за найнижчою ціною в конкретному випадку використання. GPT-5.4 з режимом екстремального мислення може бути найкращим вибором для передових наукових досліджень, тоді як для повсякденних бізнес-застосунків швидший та економічніший GPT-5.3 Instant залишається більш прагматичним варіантом.

Ринкові прогнози, які дають GPT-5.4 ймовірність випуску до квітня становить 55%, а до червня – 74%, що свідчить про те, що очікування буде недовгим. Деякі спостерігачі навіть припускають дату випуску 4 травня, згідно з американським форматом дати 5/4, що відповідало б схильності OpenAI до таких культурних посилань. Одне можна сказати напевно: GPT-5.4 – це не спекуляція. Це код, на який посилаються у продакшені. Питання не в тому, чи це станеться, а в тому, коли і якою саме мірою він виконає обіцянки, запропоновані витікаючим кодом.

Залишається лише галузь, яка трансформується з безпрецедентною швидкістю, зумовлена гонкою за технологічну перевагу, яка щорічно поглинає сотні мільярдів доларів і чия економічна життєздатність ще не доведена. GPT-5.4 – це наступний розділ у цій історії, але точно не останній.

Ваш глобальний партнер з маркетингу та розвитку бізнесу

☑️ Наша ділова мова – англійська або німецька

☑️ НОВИНКА: Листування вашою рідною мовою!

Konrad Wolfenstein

Я та моя команда раді бути вашим особистим консультантом.

Ви можете зв'язатися зі мною, заповнивши контактну форму тут , або просто зателефонувавши мені за номером +49 89 89 674 804 ( Мюнхен) . Моя адреса електронної пошти: [email protected]

Я з нетерпінням чекаю нашого спільного проєкту.

☑️ Підтримка МСП у стратегії, консалтингу, плануванні та впровадженні

☑️ Створення або переорієнтація цифрової стратегії та діджиталізації

☑️ Розширення та оптимізація процесів міжнародних продажів

☑️ Глобальні та цифрові торгові платформи B2B

☑️ Розвиток бізнесу Pioneer / Маркетинг / PR / Виставки

🎯🎯🎯 Скористайтеся перевагами великого, п'ятикратного досвіду Xpert.Digital в одному комплексному пакеті послуг | Розробка бізнес-аналітики, дослідження та розробки, XR, зв'язки з громадськістю та оптимізація цифрової видимості

Скористайтеся перевагами великого, п'ятикратного досвіду Xpert.Digital у комплексному пакеті послуг | Дослідження та розробки, XR, PR та оптимізація цифрової видимості - Зображення: Xpert.Digital

Xpert.Digital має глибокі знання в різних галузях. Це дозволяє нам розробляти індивідуальні стратегії, точно узгоджені з вимогами та викликами вашого конкретного сегмента ринку. Завдяки постійному аналізу ринкових тенденцій та моніторингу розвитку галузі ми можемо діяти проактивно та пропонувати інноваційні рішення. Поєднання досвіду та знань створює додаткову цінність та надає нашим клієнтам вирішальну конкурентну перевагу.

Більше інформації тут:

Скористайтеся перевагами 5 галузей експертизи Xpert.Digital в одному пакеті – від €500/місяць

Щойно GPT-5.3 запустили, як усі вже говорять про GPT-5.4: Екстремальні міркування та 2 мільйони токенів

Зв'яжіться зі мною:

КАТЕГОРІЇ

Квантовий стрибок для OpenAI? Прихований гігант ШІ: Як OpenAI прагне перевершити Google та Anthropic за допомогою GPT-5.4

Випадково витік інформації: нова мега-модель OpenAI GPT-5.4 ось-ось вийде

GPT-5.4: Наступний квантовий стрибок OpenAI між екстремальним мисленням та боротьбою за верховенство ШІ

Анатомія мимовільного одкровення

Обіцянка двох мільйонів токенів та її обмеження

Екстремальні міркування: коли ШІ потрібно більше часу на роздуми

Аналіз зображень з точністю до пікселя: кінець компромісів

Задаючи темп перегонів: прискорена частота випусків OpenAI

Новий вимір цифрової трансформації з «керованим ШІ» (штучним інтелектом) – платформа та рішення B2B | Xpert Consulting

Гонка за ШІ загострюється: як GPT-5.4 прагне затьмарити Google та Anthropic

Конкурентне середовище: три корпорації, одні перегони, немає явного переможця

Пентагон, протести та криза довіри

Економічне рівняння: між рекордними доходами та рекордними збитками

Що означає GPT-5.4 для економіки інфраструктури

Штучний інтелект на основі агентів: реальний зсув парадигми, що стоїть за цифрами

Питання довіри: Безпека в тіні перегонів

Перспектива: Нова норма постійних збоїв

Ваш глобальний партнер з маркетингу та розвитку бізнесу

☑️ Наша ділова мова – англійська або німецька

☑️ НОВИНКА: Листування вашою рідною мовою!

☑️ Підтримка МСП у стратегії, консалтингу, плануванні та впровадженні

☑️ Створення або переорієнтація цифрової стратегії та діджиталізації

☑️ Розширення та оптимізація процесів міжнародних продажів

☑️ Глобальні та цифрові торгові платформи B2B

☑️ Розвиток бізнесу Pioneer / Маркетинг / PR / Виставки

Інші теми

Зв'яжіться зі мною:

КАТЕГОРІЇ