«Токенмаксінг» – чи це був Amazon? Чому корпорація витратила півмільярда доларів на токени: керований штучний інтелект як захисний механізм

Konrad Wolfenstein

2 місяці тому

«Токенмаксінг» – чи це був Amazon? Чому корпорація витратила півмільярда доларів на токени: керований штучний інтелект як захисний механізм – Зображення: Xpert.Digital

«Токенмаксінг» коштує мільйони: секретний тренд штучного інтелекту, який ставить Amazon, Uber та інші компанії на коліна

Пастка на 500 мільйонів доларів: чому автономні агенти зі штучним інтелектом роздують корпоративні бюджети

Один місяць, необмежений доступ до моделей ШІ та неймовірний рахунок у 500 мільйонів доларів: нещодавно розкритий інцидент з корпоративного світу викриває величезні фінансові ризики штучного інтелекту, коли він використовується без чітких інструкцій. У той час як так званий «агентський ШІ» все частіше бере на себе складні завдання автономно, такі явища, як «максимізація токенів», призводять до експоненціального зростання витрат за лаштунками — часто без будь-якої відчутної доданої цінності для компанії. Навіть такі технологічні гіганти, як Amazon, Uber та Meta, вже на власному гіркому досвіді переконалися, що неконтрольоване розгортання ШІ пожирає бюджети в рекордно короткі терміни. Цей випадок проливає світло на те, що, можливо, є найдорожчим провалом ШІ в історії корпорацій, і яскраво ілюструє, чому «керований ШІ» — систематичний контроль, управління та обмеження робочих процесів ШІ — більше не є додатковою ІТ-функцією, а абсолютною стратегічною необхідністю для кожної компанії.

Коли відсутність управління стає дорожчою, ніж сама модель штучного інтелекту

Десь у бухгалтерії великої корпорації фінансова команда досі обробляє події одного місяця. Жодного квартального звіту, жодного річного плану — одного місяця було достатньо, щоб переказати приблизно 500 мільйонів доларів на платформу Claude компанії Anthropic, і ніхто не зміг би запустити заморожування витрат. Не тому, що компанія не могла встановити ліміт. А просто тому, що ніхто цього не робив.

Цей випадок, про який вперше повідомила компанія Axios 28 травня 2026 року та який підтвердив консультант зі штучного інтелекту, зараз вважається найбільшою публічно відомою збитковою статтею за один місяць через перевитрати на штучний інтелект в історії корпорацій. Це не поодинокий інцидент на периферії галузі — це симптом структурної слабкості, яка зараз переслідує численні великі компанії: поєднання необмеженого використання агентного ШІ та майже повної відсутності керованих структур ШІ.

Детальний опис справи: 500 мільйонів доларів без обмеження ліміту

Назва компанії, про яку йде мова, не була названа ні Axios, ні цитований консультант. На платформі X поширювалися чутки про Amazon, але без жодних доказів. Відомо лише те, що корпорація надала своїм співробітникам необмежений доступ до платформи Claude від Anthropic – без обмежень витрат, без квот на використання та без панелей моніторингу споживання токенів у режимі реального часу.

Результатом стало експоненціальне зростання витрат. Працівники широко використовували агентів кодування на основі штучного інтелекту, робочі процеси з довгими контекстними вікнами та багаторівневі агентні системи штучного інтелекту, які автономно об'єднували завдання разом. Ні фінансовий відділ, ні структури управління ІТ не втручалися. Коли надійшов рахунок, було витрачено 500 мільйонів доларів — за один місяць.

Anthropic пропонує механізми контролю на рівні підприємства: адміністративні панелі, обмеження використання на основі користувачів та інструменти для забезпечення відповідності. Однак ці функції вимагають проактивного налаштування. У цьому випадку це налаштування було повністю проігноровано. Результат: Anthropic генерувала щомісячний дохід від одного клієнта на рівні, про який венчурні капіталісти зазвичай лише мріють.

Агентський ШІ: Тихий множник витрат

Щоб зрозуміти, як можливо заробити 500 мільйонів доларів за 30 днів, потрібно зрозуміти природу так званих агентних систем штучного інтелекту. Типовий запит до мовної моделі — ви вводите запитання, отримуєте відповідь — споживає керовану кількість токенів. Агент штучного інтелекту, з іншого боку, функціонує принципово інакше.

Системи агентного ШІ планують автономно, послідовно виконують кілька завдань, оцінюють власні проміжні результати, виправляють себе, звертаються до зовнішніх інструментів та переосмислюють всю попередню історію розмов з кожним кроком. Кожна нова дія вимагає від моделі обробки не лише поточного запиту, а й усієї накопиченої історії розмов — ефект снігової кулі, який призводить до експоненціального зростання вартості токенів. Нещодавнє дослідження Лабораторії цифрової економіки Стенфорда, в якому брав участь Ерік Бріньйольфссон, емпірично продемонструвало, що завдання агентного ШІ споживають в середньому до 1000 разів більше токенів, ніж прості завдання кодового мислення або кодовий чат.

У статті було виявлено особливо важливе відкриття: моделі структурно не здатні передбачати власні витрати на токени. Для ідентичних завдань фактичне споживання токенів тим самим агентом може відрізнятися в 30 разів. Причому вище споживання токенів не обов'язково означає вищу якість результатів – точність часто досягає свого максимуму при середньому використанні токенів і стабілізується при вищих рівнях споживання.

Ця притаманна стохастичність робить бюджетування токенів відповідно до класичної фінансової логіки практично неможливим – якщо не створити структурні рамки за допомогою керованих систем штучного інтелекту, які контролюють потік витрат незалежно від поведінки моделі.

Токенізація: коли стимули для досягнення результатів стають спотвореними

Справа з 500 мільйонами токенів не є поодиноким інцидентом. Вона є частиною ширшого явища, яке тепер має власну назву: максимізація токенів. Це стосується навмисного завищення споживання токенів – не через суттєву потребу, а для досягнення внутрішніх показників ефективності, підйому по кар'єрних сходах або простого використання неточності вимірювань продуктивності, що базуються на штучному інтелекті.

Компанія Amazon запровадила внутрішню систему рейтингу під назвою «KiroRank» для своєї платформи розробників Kiro, яка оцінювала співробітників на основі використання ними штучного інтелекту. Початкова мета була похвальною: сприяти впровадженню ШІ та висвітлювати передовий досвід. Непередбачуваний наслідок: співробітники почали призначати агентам ШІ безглузді завдання просто для того, щоб збільшити кількість своїх токенів та піднятися в рейтингу. Старший віце-президент Amazon Дейв Тредвелл згодом пояснив співробітникам, що хоча таблиця лідерів була розроблена з добрими намірами, вона призвела до непотрібних додаткових витрат. Його послання було однозначним: «Не використовуйте ШІ заради самого використання». Систему було закрито. Як новий критерій оцінки Amazon запровадила «нормалізовані розгортання» – метрику, яка вимірює не кількість токенів, а фактичну кількість згенерованих корисних розгортань коду.

Кілька тижнів тому Meta запустила аналогічну раду лідерства співробітників під назвою «Кладеономіка». Ця схема повторюється системно: щойно споживання токенів стає вимірюваним показником, співробітники оптимізують свою діяльність для споживання токенів, а не для створення цінності.

Uber надав додаткові докази масштабу проблеми. Технічний директор Правін Неппаллі Нага підтвердив The Information, що Uber вже вичерпав весь свій бюджет на штучний інтелект на 2026 рік до квітня – лише через чотири місяці року. Це було спричинено швидким розширенням штату Claude Code приблизно до 5000 інженерів, що повністю перевантажило внутрішні фінансові моделі компанії. Uber вже витратив 3,4 мільярда доларів на дослідження та розробки у 2025 році – на дев'ять відсотків більше, ніж у попередньому році. Тому бюджетна катастрофа була не проблемою ресурсів, а проблемою управління.

Виконавчий директор Uber Ендрю Макдональд публічно заявив те, що багато бізнес-лідерів обговорюють внутрішньо, але рідко висловлюють так прямо: високе споживання токенів не має очевидної кореляції з вигідними результатами для клієнтів. Uber також використовував внутрішні рейтинги для просування впровадження штучного інтелекту — з таким самим збоченим результатом, як і Amazon.

Галузь під тиском витрат: Більш вражаючі випадки

Справа Клода про 500 мільйонів доларів – найвидовищніший окремий випадок, але аж ніяк не єдиний. Тільки травень 2026 року приніс низку сенсаційних катастрофічних витрат, які, взраховані разом, малюють структурну картину.

Розробник Пітер Штайнбергер, творець вірусного інструменту розробки агентів штучного інтелекту OpenClaw, опублікував скріншот своєї панелі інструментів API OpenAI: $1 305 088,81 споживання токенів протягом 30 днів, розподілене між 603 мільярдами токенів через 7,6 мільйона запитів API, згенерованих приблизно 100 екземплярами Codex, що керуються командою з трьох осіб. Штайнбергер зараз працює безпосередньо в OpenAI і особисто не сплачував цю суму – OpenAI покрила витрати в рамках угоди про фінансування. Тим не менш, цей випадок ілюструє масштаб витрат, яких можуть досягти середовища розробки на основі агентів.

У квітні 2026 року австралійському консультанту зі штучного інтелекту на ім'я Джессі Дейвіс було пред'явлено рахунок за Google Cloud на суму 25 672,86 австралійських доларів (приблизно 18 391 доларів США), незважаючи на те, що бюджет його облікового запису становив лише 10 австралійських доларів. Атаку було здійснено за допомогою загальнодоступного ключа API, що зберігався як змінна у відкритому тексті в середовищі контейнера. Дев'ять функцій безпеки Google Cloud могли б запобігти цьому інциденту, проте всі вони були вимкнені за замовчуванням. На додачу до всього, Google автоматично оновив обліковий запис до вищого рівня з лімітом витрат від 20 000 до 100 000 доларів США без повідомлення після перевищення порогу в 1000 доларів.

Microsoft почала скорочувати кількість внутрішніх ліцензій на код Claude після того, як щомісячні витрати на одного інженера зросли до 500–2000 доларів. Компанія переводить своїх інженерів на GitHub Copilot CLI як більш економічно ефективну альтернативу.

Генеральний директор OpenAI Сем Альтман публічно визнав, що регулярно чує від бізнес-лідерів: «Наші витрати постійно зростають, люди відчувають себе продуктивними, але де дохід, де фактичне зростання продуктивності?»

🤖🚀 Керована платформа штучного інтелекту: Швидші, безпечніші та розумніші рішення на основі штучного інтелекту з UNFRAME.AI

Керована платформа штучного інтелекту - Зображення: Xpert.Digital

Тут ви дізнаєтеся, як ваша компанія може швидко, безпечно та без високих бар'єрів входу впроваджувати індивідуальні рішення на основі штучного інтелекту.

Керована платформа штучного інтелекту — це ваше комплексне та безтурботне рішення для штучного інтелекту. Замість того, щоб мати справу зі складними технологіями, дорогою інфраструктурою та тривалими процесами розробки, ви отримуєте готове рішення, адаптоване до ваших потреб, від спеціалізованого партнера — часто всього за кілька днів.

Основні переваги з першого погляду:

⚡ Швидке впровадження: від ідеї до готового до використання застосунку за лічені дні, а не місяці. Ми пропонуємо практичні рішення, які створюють негайну додану цінність.

🔒 Максимальна безпека даних: Ваші конфіденційні дані залишаються з вами. Ми гарантуємо безпечну та відповідність вимогам обробку без передачі даних третім особам.

💸 Без фінансових ризиків: Ви платите лише за результат. Повністю виключаються значні початкові інвестиції в обладнання, програмне забезпечення чи персонал.

🎯 Зосередьтеся на своєму основному бізнесі: Зосередьтеся на тому, що ви робите найкраще. Ми подбаємо про повне технічне впровадження, експлуатацію та обслуговування вашого рішення на базі штучного інтелекту.

📈 Орієнтований на майбутнє та масштабований: Ваш ШІ зростає разом з вами. Ми забезпечуємо постійну оптимізацію та масштабованість, а також гнучко адаптуємо моделі до нових вимог.

Більше інформації тут:

Керована платформа штучного інтелекту

Керований ШІ як корпоративна відповідальність: Як захистити бюджет та дотримання вимог

Що означає керований штучний інтелект – і чому він міг би запобігти цій шкоді

У бізнес-контексті термін «керований ШІ» стосується структурованого, платформного підходу до контролю, моніторингу та управління всіма видами діяльності зі ШІ в організації. На відміну від неконтрольованого прямого доступу до API, керований ШІ розміщує рівень адміністративного контролю між співробітниками та базовими мовними моделями.

У повністю впровадженій керованій системі штучного інтелекту сценарій з витратами 500 мільйонів доларів ніколи б не стався – з кількох технічних та організаційних причин.

По-перше, обмеження витрат на рівні проекту, команди або користувача дозволяють автоматично обмежувати або повністю припиняти трафік API після досягнення попередньо визначених бюджетних лімітів. Google Cloud визнав це та на своїй конференції Next у квітні 2026 року оголосив про запровадження «обмежень витрат» для Gemini, Cloud Run та інших сервісів — обмежень, які не лише попереджають користувачів, але й активно призупиняють трафік.

По-друге, детальний моніторинг у режимі реального часу на рівні користувача, команди та робочого процесу забезпечує ранні сигнали про аномалії, перш ніж витрати можуть зрости. Технічний директор модального відділу Акшат Бубна оцінює, що близько 50 відсотків внутрішнього споживання токенів у компаніях є абсолютно марним — проблема наразі полягає в нездатності відрізнити нікчемну половину від продуктивної. Керовані системи штучного інтелекту забезпечують саме таку диференціацію завдяки детальній атрибуції використання.

По-третє, управління доступом на основі ролей дозволяє розмежовувати групи користувачів: рутинні завдання перенаправляються на менш дорогі моделі (такі як Claude Haiku), тоді як обчислювально ресурсоємні робочі процеси виконуються на потужніших, але дорожчих моделях. Сама Anthropic у своїй офіційній документації з ціноутворення чітко рекомендує розподіл завдань з урахуванням моделі як стратегію витрат: Haiku для простих завдань, Sonnet для більшості виробничих навантажень, а Opus лише для найскладніших завдань міркування.

По-четверте, механізми кешування запитів захищають від надлишкових циклів споживання токенів: повторювані блоки контексту, такі як системні запити або політики компанії, не потрібно перезавантажувати з кожним запитом. Для робочих процесів Agentic, які завантажують один і той самий контекст сотні разів на день, це може зменшити вартість токенів на 60-80 відсотків.

По-п'яте, пакетна обробка забезпечує значну економію коштів для завдань, які не є критичними за часом: пакетний API Anthropic пропонує знижки до 50 відсотків порівняно із синхронними запитами. У керованій системі штучного інтелекту такі оптимізації застосовуються автоматично, що усуває необхідність для окремих розробників приймати рішення вручну.

Структурний розрив у управлінні: чому компанії не готові

Питання, яке виникає, не технічне, а організаційне: чому корпорації з тисячами співробітників, багатомільярдними ІТ-бюджетами та складними структурами управління хмарними ресурсами не змогли впровадити найпростіші механізми контролю витрат на штучний інтелект?

Відповідь криється в структурному часовому затримці. Концепції управління хмарними ресурсами, такі як FinOps — дисциплінований, міжфункціональний підхід до управління хмарними витратами, — розвивалися протягом багатьох років, коли обчислювальні витрати були передбачуваними та лінійно масштабованими. Моделі ціноутворення токенів штучного інтелекту поводяться принципово інакше: вони нелінійні, недетерміновані, а керовані агентами робочі процеси генерують витрати, які не є ні передбачуваними, ні інтуїтивно зрозумілими.

Звіт про стан FinOps за 2026 рік підтверджує, що витрати на ШІ еволюціонували від експериментальних бюджетів до базової інфраструктури, і що майже всі команди FinOps тепер несуть спільну відповідальність за робочі навантаження, пов'язані зі ШІ. Водночас відсутні встановлені показники рентабельності інвестицій: згідно з опитуванням, проведеним у прямому ефірі на саміті FinOps Foundation, найбільшою проблемою для бізнес-лідерів є не обсяг витрат на ШІ, а нездатність продемонструвати його цінність.

Цінова структура Anthropic ще більше ускладнила ситуацію. У квітні 2026 року Anthropic фундаментально реформувала свою корпоративну модель: замість фіксованої плати за підписку, що базується на кількості місць, тепер діють нижчі номінальні ціни на місця (наприклад, 20 доларів США на місяць для технічних користувачів Claude Code) у поєднанні з обов'язковими попередніми зобов'язаннями щодо споживання. Попередні знижки API у розмірі 10-15 відсотків для оптових покупців були скасовані. Ця структура повністю перекладає ризик споживання на підприємство: компанії платять за зобов'язання незалежно від фактичного споживання, тоді як неконтрольоване споживання, що перевищує зобов'язання, оплачується за повною ціною.

Gartner прогнозує, що понад 40 відсотків усіх проектів агентного штучного інтелекту будуть припинені до кінця 2027 року – головним чином через неадекватні структури управління.

Управління штучним інтелектом як стратегічний корпоративний імператив

Наслідки цих випадків очевидні: управління штучним інтелектом більше не є накладною діяльністю для ІТ-відділу, а стратегічною корпоративною відповідальністю. Компанії, які впроваджують керовані структури ШІ, отримують кілька важливих переваг порівняно з нерегульованим розгортанням.

Прозорість витрат та контроль витрат є основою. Провідні організації вже покладаються на суворі обмеження витрат, управління доступом на основі ролей, панелі моніторингу в режимі реального часу та політики, які вимагають більш економічно ефективних моделей для рутинних завдань. Databricks у своїх рекомендаціях щодо управління чітко рекомендує обмеження часу проектування та виконання: попередньо визначені обмеження токенів, обмеження довжини контексту, правила кешування та системи виявлення аномалій, які втручаються до того, як робочі процеси неконтрольовано ескалюють.

Вимірювання на основі цінності замінює метрики, засновані на токенах. Перехід Amazon від KiroRank до «нормалізованих розгортань» – вимірювання змістовних розгортань коду замість кількості сирих токенів – вказує шлях уперед: не споживання, а отриманий результат є відповідною метрикою. Ця зміна метрик не є технічною приміткою, а фундаментальною переоцінкою того, що означає продуктивність ШІ.

Спеціалізовані інструменти, а не системи загального призначення, дозволяють значно знизити витрати без шкоди для якості. Для визначених, повторюваних завдань спеціалізовані, оптимізовані для завдань рішення часто в 10-100 разів дешевші, ніж універсальна модель на межі можливостей. Саміт FinOps Foundation сформулював це як ключовий принцип: спочатку визначте, чи взагалі потрібен штучний інтелект для завдання; потім визначте, яка модель є найефективнішою з точки зору витрат; і лише потім оптимізуйте.

Архітектури шлюзів штучного інтелекту централізують контроль. Такі платформи, як Bifrost (Maxim AI), діють як центральні шлюзи, які маршрутизують, контролюють та забезпечують дотримання політик контролю всього трафіку штучного інтелекту організації. Такі архітектури дозволяють організаціям керувати лімітами витрат, маршрутизацією моделей, фільтрами конфіденційності та вимогами до відповідності в одному центральному місці, а також повністю реєструвати всі дії штучного інтелекту для цілей аудиту.

Економіка епохи токенів: нові правила фінансування підприємств

Справа про 500 мільйонів доларів знаменує собою поворотний момент у тому, як корпоративні фінанси та інфраструктуру штучного інтелекту повинні розглядатися разом. Моделі ціноутворення на основі токенів не поводяться як традиційні ліцензії на програмне забезпечення: немає фіксованої річної плати, чітко визначеного обсягу та природного обмеження споживання.

Ця фундаментальна відмінність переважає традиційні процеси корпоративного бюджетування. Фінансові директори, які звикли моделювати витрати на програмне забезпечення як постійні витрати, стикаються з моделлю змінних витрат, яка може масштабуватися в геометричній прогресії. Прогнозується, що до 2026 року світові витрати на штучний інтелект досягнуть 2,52 трильйона доларів, що на 44 відсотки більше, ніж минулого року. Такий масштаб робить неконтрольоване розгортання на підприємствах системним ризиком.

Майкл Беррі, відомий своїми ранніми попереджувальними сигналами про ринкові кризи, описав максимізацію токенів як «надмірне споживання, зумовлене квотами, таблицями лідерів та менеджментом», а також «божевільну, поспішну, тимчасову фазу». Він прогнозує, що ця фаза є нестійкою. Незалежно від того, чи виявиться його час правильним чи ні, структурний тиск на коригування вже триває.

Парадигма неконтрольованого, демократизованого доступу до ШІ як прискорювача інновацій зараз коригується реальністю масового перевитрату коштів. Залишається більш зріла модель: широкий доступ, але з визначеними межами, вимірюваними цілями та механізмами інституційного контролю – коротко кажучи, керований ШІ в його найповнішому сенсі.

Що компаніям потрібно зробити зараз

Описані випадки дозволяють робити негайні операційні висновки для компаній, які використовують ШІ в масштабах підприємства.

Першочерговим завданням є негайне впровадження суворих обмежень витрат на рівні користувача, команди та проекту. Anthropic, Google Cloud та OpenAI пропонують механізми корпоративного контролю, які потребують налаштування. Основною проблемою майже у всіх відомих випадках була не їхня відсутність у портфоліо продуктів, а радше нездатність їх налаштувати.

Паралельно, протягом 30 днів до розгортання або масштабування робочих процесів Agentic слід вимірювати базовий рівень фактичного споживання токенів. Без цього базового рівня немає точки відліку для аномалій. Системи виявлення аномалій, які автоматично запускають сповіщення на рівні 25, 50 та 75 відсотків щомісячного бюджету, забезпечують другий рівень безпеки.

Визначення метрики продуктивності ШІ має перейти від кількості токенів до метрик результатів. Amazon представила життєздатну модель із «нормалізованими розгортаннями». Інвестиції у ШІ, які не можна відстежити до виміряних бізнес-результатів, слід переглянути.

Розгортання агентного ШІ вимагає чіткого, поетапного управління: пілотні групи, чітко визначені варіанти використання, обмеження витрат на робочий процес та регулярні перевірки перед ширшим розгортанням. Масштабованість агентного ШІ є перевагою, але вона також пов'язана з витратами, якщо його використовувати без певних запобіжних заходів.

Висновок: 500 мільйонів доларів за урок, який був доступний безкоштовно

Справа на 500 мільйонів доларів вражає своїм масштабом, але її причина банальна: ніхто не перемкнув вимикач. Технічна інфраструктура для контролю витрат була на місці, але конфігурація була відсутня. Бракувало стратегії керованого ШІ — інституційної бази, яка поєднує доступ до ШІ з управлінням ШІ.

Послання для бізнес-лідерів чітке: щедрий доступ до інструментів штучного інтелекту без системи управління не є ознакою довіри до співробітників, а є фінансовою недбалістю. Випадки Uber, Amazon, Microsoft та анонімної корпорації з інвестиціями в півмільярда доларів не описують разом проблеми початківців нової технології. Вони описують системну нездатність інтегрувати нові технології з перевіреними принципами корпоративного управління.

Керований штучний інтелект є відповіддю на цю прогалину. Не як обмеження інновацій, а як умова їхньої стійкості.

Консалтинг - Планування - Впровадження