„Токенмаксиране“ – Дали беше Amazon? Защо една корпорация изгори половин милиард долара в токени: Управляван изкуствен интелект като защитен механизъм

Konrad Wolfenstein

преди 3 дни

„Токенмаксиране“ – Дали беше Amazon? Защо една корпорация изгори половин милиард долара в токени: Управляван изкуствен интелект като защитен механизъм – Изображение: Xpert.Digital

„Токенмаксирането“ струва милиони: Тайната тенденция в изкуствения интелект, която поставя Amazon, Uber и други на колене

Капанът от 500 милиона долара: Защо автономните агенти с изкуствен интелект взривяват корпоративните бюджети

Един-единствен месец, неограничен достъп до модели на изкуствен интелект и невероятна сметка от 500 милиона долара: Наскоско разкрит инцидент от корпоративния свят разкрива огромните финансови рискове от изкуствения интелект, когато се използва без ясни насоки. Докато така нареченият „агентен изкуствен интелект“ все по-често поема сложни задачи автономно, явления като „максимализиране на токените“ водят до експоненциално увеличение на разходите зад кулисите – често без осезаема добавена стойност за компанията. Дори технологични гиганти като Amazon, Uber и Meta вече са научили по трудния начин, че неконтролираното внедряване на изкуствен интелект поглъща бюджети за рекордно кратко време. Този случай хвърля светлина върху може би най-скъпия провал на изкуствения интелект в корпоративната история и ярко илюстрира защо „управляваният изкуствен интелект“ – систематичният контрол, управление и ограничаване на работните процеси, свързани с изкуствен интелект – вече не е опционална ИТ функция, а абсолютна стратегическа необходимост за всяка компания.

Когато липсата на управление стане по-скъпа от самия модел на изкуствен интелект

Някъде в счетоводния отдел на голяма корпорация, финансов екип все още обработва събитията от един-единствен месец. Няма тримесечен отчет, няма годишен план - един-единствен месец беше достатъчен, за да се прехвърлят приблизително 500 милиона долара към платформата Claude на Anthropic, без никой да може да задейства замразяване на разходите. Не защото компанията не е могла да определи лимит. А просто защото никой не го е правил.

Този случай, за който Axios съобщи за първи път на 28 май 2026 г. и който е потвърден от консултант по изкуствен интелект, сега се счита за най-голямата публично известна едномесечна загуба, дължаща се на превишаване на разходите за изкуствен интелект в корпоративната история. Това не е изолиран инцидент в периферията на индустрията – това е симптом на структурна слабост, която в момента измъчва множество големи компании: комбинацията от необуздано използване на агентен изкуствен интелект и почти пълната липса на управлявани структури за изкуствен интелект.

Детайл на случая: 500 милиона долара без таван

Въпросната компания не беше посочена нито от Axios, нито от цитирания консултант. Спекулации за Amazon циркулираха на платформа X, но без никакви доказателства. Известно е, че корпорацията е предоставила на служителите си неограничен достъп до платформата Claude на Anthropic – без ограничения за разходи, без квоти за използване и без табла за управление в реално време за наблюдение на потреблението на токени.

Резултатът беше експоненциално увеличение на разходите. Служителите използваха широко агенти за кодиране с изкуствен интелект, работни потоци с дълги контекстни прозорци и многопластови агентни системи с изкуствен интелект, които автономно свързваха задачите. Нито финансовият отдел, нито структурите за управление на ИТ се намесиха. Когато сметката пристигна, 500 милиона долара бяха похарчени – само за един месец.

Anthropic предлага механизми за контрол на корпоративно ниво: администраторски табла, ограничения за използване, базирани на потребители, и инструменти за съответствие. Тези функции обаче изискват проактивна конфигурация. В този случай тази конфигурация беше напълно пренебрегната. Резултатът: Anthropic генерира месечни приходи от един-единствен клиент на ниво, за което рисковите капиталисти обикновено само мечтаят.

Агентски ИИ: Тихият мултипликатор на разходите

За да се разбере как е възможно да се спечелят 500 милиона долара за 30 дни, човек трябва да разбере природата на така наречените агентни системи с изкуствен интелект. Типична заявка към езиков модел – въвеждате въпрос, получавате отговор – консумира управляем брой токени. Агентът с изкуствен интелект, от друга страна, функционира коренно различно.

Системите с агентен изкуствен интелект планират автономно, изпълняват множество задачи последователно, оценяват собствените си междинни резултати, коригират се, извикват външни инструменти и преконтекстуализират цялата история на предишните разговори с всяка стъпка. Всяко ново действие изисква моделът да обработва не само текущото подканване, но и цялата натрупана история на разговорите – ефект на снежна топка, който води до експоненциално нарастване на разходите за токени. Неотдавнашно проучване на Станфордската лаборатория за дигитална икономика, в което участва Ерик Бринйолфсон, емпирично демонстрира, че задачите с агентен изкуствен интелект консумират средно до 1000 пъти повече токени от простите задачи за разсъждение в кода или чат с код.

В статията е установено особено важно откритие: моделите са структурно неспособни да предскажат собствените си разходи за токени. За идентични задачи, действителното потребление на токени от един и същ агент може да варира 30 пъти. А по-високото потребление на токени не означава непременно по-високо качество на резултатите – точността често достига своя максимум при средно потребление на токени и се стабилизира при по-високи нива на потребление.

Тази присъща стохастичност прави бюджетирането на токени съгласно класическата финансова логика почти невъзможно – освен ако не се създадат структурни рамки чрез управлявани системи с изкуствен интелект, които контролират потока на разходите независимо от поведението на модела.

Токенизиране: Когато стимулите за ефективност се изопачат

Случаят с 500-те милиона токена не е изолиран инцидент. Той е част от по-широко явление, което вече има собствено име: максимизиране на токените. Това се отнася до умишленото завишаване на потреблението на токени – не от съществена нужда, а за да се постигнат вътрешни показатели за ефективност, да се изкачи по корпоративната стълбица или просто да се използва неточността на измерванията на производителността, базирани на изкуствен интелект.

Amazon въведе вътрешна система за класиране, наречена „KiroRank“, за своята платформа за разработчици Kiro, която оценяваше служителите въз основа на използването на изкуствен интелект от тяхна страна. Първоначалната цел беше похвална: да се насърчи приемането на изкуствен интелект и да се подчертаят най-добрите практики. Неочакваното последствие: служителите започнаха да възлагат безсмислени задачи на агенти с изкуствен интелект, само за да увеличат броя на токените си и да се изкачат в класацията. Старши вицепрезидентът на Amazon Дейв Тредуел впоследствие обясни на служителите, че макар класацията да е разработена с добри намерения, тя е довела до ненужни допълнителни разходи. Посланието му беше недвусмислено: „Не използвайте изкуствен интелект само заради самото му използване.“ Системата беше спряна. Като нов критерий за оценка Amazon въведе „нормализирани внедрявания“ – показател, който измерва не броя на токените, а по-скоро действителния брой генерирани полезни внедрявания на код.

Няколко седмици по-рано Meta стартира подобен съвет за лидерство на служителите, наречен „Claudeonomics“. Моделът се повтаря системно: веднага щом потреблението на токени стане измерим показател, служителите оптимизират потреблението на токени, а не създаването на стойност.

Uber предостави допълнителни доказателства за мащаба на проблема. Главният технологичен директор Правийн Непали Нага потвърди пред The Information, че Uber вече е изчерпала целия си бюджет за изкуствен интелект за 2026 г. до април – само четири месеца след началото на годината. Това беше предизвикано от бързото разширяване на Claude Code до приблизително 5000 инженери, динамика, която напълно надхвърли вътрешните финансови модели на компанията. Uber вече беше похарчила 3,4 милиарда долара за научноизследователска и развойна дейност през 2025 г. – девет процента увеличение спрямо предходната година. Следователно бюджетната катастрофа не беше проблем с ресурсите, а проблем с управлението.

Главният оперативен директор на Uber, Андрю Макдоналд, публично заяви това, което много бизнес лидери обсъждат вътрешно, но рядко изразяват толкова директно: Високото потребление на токени няма доказуема корелация с благоприятни резултати за клиентите. Uber също използва вътрешни класации, за да насърчи приемането на изкуствен интелект – със същия перверзен резултат като Amazon.

Индустрия под ценови натиск: Още по-впечатляващи случаи

Случаят на Клод за 500 милиона долара е най-зрелищният индивидуален случай, но в никакъв случай не е единственият. Само май 2026 г. донесе серия от сензационни катастрофи в разходите, които, взети заедно, рисуват структурна картина.

Разработчикът Питър Щайнбергер, създател на инструмента за вирусни AI агенти OpenClaw, публикува екранна снимка на своето табло за управление на OpenAI API: $1 305 088,81 потребление на токени за 30 дни, разпределено в 603 милиарда токена чрез 7,6 милиона API заявки, генерирани от приблизително 100 екземпляра на Codex, управлявани от екип от трима души. Щайнбергер сега работи директно в OpenAI и не е платил лично тази сума – OpenAI е покрил разходите като част от споразумение за финансиране. Въпреки това, този случай е пример за мащаба на разходите, които могат да достигнат средите за разработка, управлявани от агенти.

През април 2026 г. австралийски консултант по изкуствен интелект на име Джеси Дейвис получи фактура от Google Cloud за 25 672,86 австралийски долара (приблизително 18 391 щатски долара) – въпреки че бюджетът на акаунта му беше само 10 австралийски долара. Атаката беше извършена с помощта на публично достъпен API ключ, съхраняван като променлива в открит текст в контейнерна среда. Девет функции за сигурност на Google Cloud можеха да предотвратят този инцидент – всички те обаче бяха деактивирани по подразбиране. За да влоши нещата, Google автоматично надстрои акаунта до по-високо ниво с лимит на разходите от 20 000 до 100 000 щатски долара без уведомление, след като прагът от 1000 долара беше превишен.

Microsoft започна да намалява вътрешните си лицензи за код Claude, след като месечните разходи на инженер се увеличиха до между 500 и 2000 долара. Компанията мигрира своите инженери към GitHub Copilot CLI като по-рентабилна алтернатива.

Главният изпълнителен директор на OpenAI Сам Алтман публично призна, че редовно чува от бизнес лидери: „Разходите ни продължават да се увеличават, хората се чувстват продуктивни – но къде са приходите, къде са действителните постижения в производителността?“

🤖🚀 Управлявана платформа с изкуствен интелект: По-бързи, по-безопасни и по-интелигентни решения с изкуствен интелект с UNFRAME.AI

Управлявана AI платформа - Изображение: Xpert.Digital

Тук ще научите как вашата компания може да внедри персонализирани решения с изкуствен интелект бързо, сигурно и без високи бариери за навлизане.

Управляваната AI платформа е вашето цялостно и безпроблемно решение за изкуствен интелект. Вместо да се занимавате със сложни технологии, скъпа инфраструктура и продължителни процеси на разработка, вие получавате готово решение, съобразено с вашите нужди, от специализиран партньор – често само в рамките на няколко дни.

Ключовите предимства накратко:

⚡ Бързо внедряване: От идея до готово за употреба приложение за дни, а не за месеци. Ние предлагаме практични решения, които създават незабавна добавена стойност.

🔒 Максимална сигурност на данните: Вашите чувствителни данни остават при вас. Гарантираме сигурна и съвместима обработка без споделяне на данни с трети страни.

💸 Без финансов риск: Плащате само за резултати. Високите първоначални инвестиции в хардуер, софтуер или персонал са напълно елиминирани.

🎯 Фокусирайте се върху основния си бизнес: Концентрирайте се върху това, което правите най-добре. Ние се грижим за цялостното техническо внедряване, експлоатация и поддръжка на вашето AI решение.

📈 Готов за бъдещето и мащабируем: Вашият изкуствен интелект расте с вас. Ние гарантираме непрекъсната оптимизация и мащабируемост и гъвкаво адаптираме моделите към новите изисквания.

Повече информация тук:

Управлявана платформа с изкуствен интелект

Управляемият изкуствен интелект като корпоративна отговорност: Как да защитим бюджета и съответствието

Какво означава управляван изкуствен интелект – и защо би предотвратил тези щети

В бизнес контекст терминът „Управляван ИИ“ се отнася до структуриран, базиран на платформа подход за контролиране, наблюдение и управление на всички дейности, свързани с ИИ, в рамките на една организация. За разлика от неконтролирания директен достъп до API, управляваният ИИ поставя административен контролен слой между служителите и основните езикови модели.

В напълно внедрена управлявана система с изкуствен интелект, сценарият с 500 милиона долара никога не би могъл да се случи – поради няколко технически и организационни причини.

Първо, ограниченията, базирани на разходите на ниво проект, екип или потребител, позволяват автоматично ограничаване или пълно спиране на API трафика, след като бъдат достигнати предварително дефинираните бюджетни лимити. Google Cloud разпозна това и обяви въвеждането на „ограничения на разходите“ за Gemini, Cloud Run и други услуги на своята конференция Next през април 2026 г. – ограничения, които не само предупреждават потребителите, но и активно спират трафика.

Второ, детайлното наблюдение в реално време на ниво потребител, екип и работен процес осигурява ранни сигнали за аномалии, преди разходите да ескалират. Акшат Бубна, главен технологичен директор на модалните услуги, изчислява, че около 50% от вътрешното потребление на токени в компаниите е напълно безполезно – проблемът в момента е невъзможността да се разграничи безполезната от продуктивната половина. Управляваните системи с изкуствен интелект осигуряват именно това разграничение чрез подробна атрибуция на употребата.

Трето, управлението на достъпа въз основа на роли позволява разграничаване между потребителските групи: рутинните задачи се насочват към по-евтини модели (като Claude Haiku), докато изчислително интензивните работни процеси се изпълняват на по-мощни, но по-скъпи модели. Самата Anthropic изрично препоръчва разпределение на задачите, чувствително към модела, като стратегия за разходи в официалната си ценова документация: Haiku за прости задачи, Sonnet за повечето производствени натоварвания и Opus само за най-сложните задачи за разсъждение.

Четвърто, механизмите за кеширане на подкани предпазват от излишни цикли на потребление на токени: Повтарящите се контекстни блокове, като системни подкани или фирмени политики, не е необходимо да се презареждат с всяка заявка. За работни процеси на агенти, които зареждат един и същ контекст стотици пъти на ден, това може да намали разходите за токени с 60 до 80 процента.

Пето, пакетната обработка осигурява огромни икономии на разходи за задачи, които не са критични във времето: Batch API на Anthropic предлага до 50 процента отстъпки в сравнение със синхронните заявки. В управлявана система с изкуствен интелект подобни оптимизации се прилагат автоматично, елиминирайки необходимостта отделните разработчици да вземат ръчни решения.

Структурна празнина в управлението: Защо компаниите са неподготвени

Въпросът, който възниква, не е технически, а организационен: Защо корпорации с хиляди служители, многомилиардни ИТ бюджети и сложни структури за управление на облака не успяха да внедрят най-простите механизми за контрол на разходите за изкуствен интелект?

Отговорът се крие в структурно забавяне във времето. Концепциите за управление на облачните услуги, като FinOps – дисциплинираният, междуфункционален подход за управление на разходите за облачни услуги – са се развивали в продължение на много години, когато разходите за изчисления са били предвидими и линейно мащабируеми. Моделите за ценообразуване на AI токени се държат коренно различно: те са нелинейни, недетерминистични и управляваните от агенти работни процеси генерират разходи, които не са нито предвидими, нито интуитивни.

Докладът за състоянието на FinOps за 2026 г. потвърждава, че разходите за изкуствен интелект са се развили от експериментални бюджети до основна инфраструктура и че почти всички FinOps екипи вече споделят отговорността за натоварванията, свързани с изкуствен интелект. В същото време липсват установени показатели за възвръщаемост на инвестициите: Според анкета на живо на срещата на върха на FinOps Foundation, най-големият проблем за бизнес лидерите не е размерът на разходите за изкуствен интелект, а невъзможността да се демонстрира неговата стойност.

Ценовата структура на Anthropic допълнително усложни нещата. През април 2026 г. Anthropic коренно реформира своя корпоративен модел: Вместо фиксирани абонаментни такси, базирани на места, сега има по-ниски номинални цени на местата (например 20 долара на месец за технически потребители на Claude Code), комбинирани със задължителни, предварителни ангажименти за потребление. Предишните отстъпки за API от 10 до 15 процента за купувачи на едро бяха премахнати. Тази структура прехвърля риска от потребление изцяло върху предприятието: Компаниите плащат за поети количества, независимо от действителното потребление, докато неконтролираното потребление, надвишаващо ангажимента, се таксува на пълна цена.

Gartner прогнозира, че повече от 40 процента от всички проекти за агентен изкуствен интелект ще бъдат прекратени до края на 2027 г. – главно поради неадекватни структури на управление.

Управлението на ИИ като стратегически корпоративен императив

Последиците от тези случаи са ясни: управлението на ИИ вече не е режийна дейност за ИТ отдела, а стратегическа корпоративна отговорност. Компаниите, които внедряват управляеми структури на ИИ, получават няколко ключови предимства пред нерегулираните внедрявания.

Прозрачността на разходите и контролът върху разходите са в основата. Водещите организации вече разчитат на строги ограничения на разходите, управление на достъпа, базирано на роли, табла за наблюдение в реално време и политики, които налагат по-рентабилни модели за рутинни задачи. Databricks изрично препоръчва предпазни мерки по време на проектиране и изпълнение в своите насоки за управление: предварително дефинирани ограничения за токени, ограничения за дължина на контекста, правила за кеширане и системи за откриване на аномалии, които се намесват, преди работните процеси да ескалират неконтролируемо.

Измерването, базирано на стойност, замества показателите, базирани на токени. Преминаването на Amazon от KiroRank към „нормализирани внедрявания“ – измерване на смислени внедрявания на код вместо сурови количества токени – посочва пътя напред: не потреблението, а полученият резултат е съответният показател. Тази промяна в показателите не е техническа бележка под линия, а фундаментална преоценка на това какво означава производителност на изкуствения интелект.

Специализираните инструменти, а не системите с общо предназначение, позволяват значително намаляване на разходите, без да се прави компромис с качеството. За дефинирани, повтарящи се задачи, специализираните, оптимизирани за задачи решения често са от 10 до 100 пъти по-евтини от универсалния граничен модел. Срещата на върха на фондация FinOps формулира това като ключов принцип: Първо, определете дали задачата изобщо изисква изкуствен интелект; след това определете кой модел е най-рентабилен; и едва след това оптимизирайте.

Архитектурите на AI шлюзове централизират контрола. Платформи като Bifrost (Maxim AI) действат като централни шлюзове, които маршрутизират, наблюдават и прилагат контрол на политиките върху целия AI трафик на организацията. Такива архитектури позволяват на организациите да управляват ограниченията на разходите, маршрутизирането на модели, филтрите за поверителност и изискванията за съответствие на едно централно място – и да регистрират напълно всички AI дейности за целите на одита.

Икономика на ерата на токените: Нови правила за финансиране на предприятията

Случаят с 500 милиона долара бележи повратна точка в начина, по който корпоративните финанси и инфраструктурата с изкуствен интелект трябва да се разглеждат заедно. Моделите за ценообразуване, базирани на токени, не се държат като традиционните софтуерни лицензи: няма фиксирана годишна такса, няма ясно дефиниран обхват и няма естествен таван на потреблението.

Тази фундаментална разлика надделява над традиционните процеси на корпоративно бюджетиране. Финансовите директори, свикнали да моделират разходите за софтуер като фиксирани разходи, са изправени пред модел на променливи разходи, който може да се мащабира експоненциално. Очаква се глобалните разходи за изкуствен интелект да достигнат 2,52 трилиона долара до 2026 г. – 44% увеличение на годишна база. Този мащаб прави неконтролираното внедряване в предприятията системен риск.

Майкъл Бъри, известен с ранните си предупредителни сигнали за пазарни кризи, описа максимизирането на токените като „свръхконсумация, обусловена от квоти, класации и управление“ и „луда, прибързана, временна фаза“. Той прогнозира, че тази фаза е неустойчива. Независимо дали времето му се окаже правилно или не, структурният натиск за корекция вече е в ход.

Парадигмата за неконтролиран, демократизиран достъп до ИИ като ускорител на иновациите в момента се коригира от реалността на масивните превишавания на разходите. Остава по-зрял модел: широк достъп, но с определени граници, измерими цели и институционални механизми за контрол – накратко, управляван ИИ в най-пълния му смисъл.

Какво трябва да направят компаниите сега

Описаните случаи позволяват незабавни оперативни заключения за компании, които използват ИИ в корпоративен мащаб.

Първият приоритет е незабавното въвеждане на строги ограничения за разходите на ниво потребител, екип и проект. Anthropic, Google Cloud и OpenAI предлагат механизми за корпоративен контрол, които е необходимо да бъдат конфигурирани. Основният проблем в почти всички известни случаи не е било отсъствието им от продуктовото портфолио, а по-скоро невъзможността за конфигурирането им.

Успоредно с това, трябва да се измери базова линия на действителното потребление на токени в продължение на 30 дни, преди работните процеси на Agentic да бъдат внедрени или мащабирани. Без тази базова линия няма референтна точка за аномалии. Системите за откриване на аномалии, които автоматично задействат предупреждения на 25, 50 и 75 процента от месечния бюджет, осигуряват второто ниво на сигурност.

Дефиницията на показателите за производителност на ИИ трябва да мигрира от количества токени към показатели за резултатите. Amazon представи жизнеспособен модел с „нормализирани внедрявания“. Инвестициите в ИИ, които не са проследими до измерени бизнес резултати, трябва да бъдат преоценени.

Внедряването на агентен ИИ изисква ясно, поетапно управление: пилотни групи, ясно дефинирани случаи на употреба, ограничения на разходите за всеки работен процес и редовни прегледи преди по-широко внедряване. Мащабируемостта на агентния ИИ е силна страна, но е и риск от разходи, ако се използва без предпазни мерки.

Заключение: 500 милиона долара за урок, който беше достъпен безплатно

Случаят с 500 милиона долара е впечатляващ по мащаб, но каузата му е банална: никой не беше превключил. Техническата инфраструктура за контрол на разходите беше налице, но конфигурацията липсваше. Липсваше управлявана стратегия за изкуствен интелект – институционална рамка, която да съчетава достъпа до изкуствен интелект с управлението на изкуствения интелект.

Посланието към бизнес лидерите е ясно: Щедрият достъп до инструменти с изкуствен интелект без рамка за управление не е знак за доверие в служителите – това е фискална небрежност. Случаите с Uber, Amazon, Microsoft и анонимната корпорация с инвестицията от половин милиард долара не описват колективно проблемите, които възникват при една нова технология. Те описват системния провал в интегрирането на новите технологии с доказани принципи на корпоративното управление.

Управляемият изкуствен интелект е отговорът на тази празнина. Не като ограничение на иновациите, а като условие за тяхната устойчивост.

Консултиране - Планиране - Внедряване