„Токенмаксирање“ – Да ли је то био Амазон? Зашто је корпорација потрошила пола милијарде долара у токенима: Управљана вештачка интелигенција као заштитни механизам

Konrad Wolfenstein

Пре 2 месеца

„Токенмаксирање“ – Да ли је то био Амазон? Зашто је корпорација потрошила пола милијарде долара у токенима: Управљана вештачка интелигенција као заштитни механизам – Слика: Xpert.Digital

„Токенмаксирање“ кошта милионе: Тајни тренд вештачке интелигенције који баца Амазон, Убер и компаније на колена

Замка од 500 милиона долара: Зашто аутономни агенти вештачке интелигенције уништавају корпоративне буџете

Један месец, неограничен приступ моделима вештачке интелигенције и невероватан рачун од 500 милиона долара: Недавно откривени инцидент из корпоративног света открива огромне финансијске ризике вештачке интелигенције када се користи без јасних смерница. Док такозвана „агентска вештачка интелигенција“ све више аутономно преузима сложене задатке, феномени попут „максималног искоришћавања токена“ узрокују експоненцијално повећање трошкова иза кулиса – често без икакве опипљиве додате вредности за компанију. Чак су и технолошки гиганти попут Амазона, Убера и Мете већ на тежи начин научили да неконтролисано распоређивање вештачке интелигенције прождире буџете у рекордном року. Овај случај баца светло на оно што је вероватно најскупљи неуспех вештачке интелигенције у корпоративној историји и живописно илуструје зашто „управљана вештачка интелигенција“ – систематска контрола, управљање и ограничавање радних процеса вештачке интелигенције – више није опционална ИТ функција, већ апсолутна стратешка неопходност за сваку компанију.

Када недостатак управљања постане скупљи од самог модела вештачке интелигенције

Негде у рачуноводственом одељењу велике корпорације, финансијски тим и даље обрађује догађаје из једног месеца. Без кварталног извештаја, без годишњег плана - један месец је био довољан да се отприлике 500 милиона долара пребаци на Anthropic-ову платформу Claude, а да нико није могао да покрене замрзавање трошкова. Не зато што компанија није могла да постави ограничење. Већ једноставно зато што нико није успео.

Овај случај, који је први пут пријавио Аксиос 28. маја 2026. године, а потврдио га је консултант за вештачку интелигенцију, сада се сматра највећим јавно познатим губитком у једном месецу због прекорачења трошкова вештачке интелигенције у корпоративној историји. То није изолован инцидент на маргинама индустрије – то је симптом структурне слабости која тренутно мучи бројне велике компаније: комбинација неограничене употребе агентске вештачке интелигенције и готово потпуног одсуства управљаних структура вештачке интелигенције.

Детаљ случаја: 500 милиона долара без ограничења

Компанија Аксиос или цитирани консултант нису именовали о којој компанији је реч. Спекулације о Амазону кружиле су на платформи X, али без икаквих доказа. Оно што се зна јесте да је корпорација својим запосленима дала неограничен приступ Anthropic-овој платформи Claude – без ограничења потрошње, без квота коришћења и без контролних табли у реалном времену за праћење потрошње токена.

Резултат је био експоненцијално повећање трошкова. Запослени су интензивно користили агенте за вештачку интелигенцију (AI) кодирање, токове рада са дугим контекстним прозорима и вишеслојне агентске AI системе који су аутономно повезивали задатке. Ни финансијско одељење нити структуре управљања ИТ-ом нису интервенисале. Када је стигао рачун, потрошено је 500 милиона долара – за само један месец.

Антропик нуди механизме контроле на нивоу предузећа: администраторске контролне табле, ограничења коришћења заснована на корисницима и алате за усклађеност. Међутим, ове функције захтевају проактивну конфигурацију. У овом случају, ова конфигурација је потпуно занемарена. Резултат: Антропик је генерисао месечни приход од једног купца на нивоу о коме ризични капиталисти обично само сањају.

Агентска вештачка интелигенција: Тихи мултипликатор трошкова

Да би се разумело како је могуће зарадити 500 милиона долара за 30 дана, мора се разумети природа такозваних агентских вештачких система. Типичан упит језичком моделу – откуцате питање, добијете одговор – троши одређен број токена. С друге стране, вештачки агент функционише фундаментално другачије.

Агентски системи вештачке интелигенције планирају аутономно, извршавају више задатака секвенцијално, процењују сопствене међурезултате, исправљају се, позивају спољне алате и реконтекстуализују целу претходну историју разговора са сваким кораком. Свака нова акција захтева од модела да обради не само тренутни упит већ и целу акумулирану историју разговора – ефекат снежне грудве који узрокује експоненцијалну ескалацију трошкова токена. Недавна студија Станфордске лабораторије за дигиталну економију, у којој је учествовао Ерик Брињолфсон, емпиријски је показала да задаци агентске вештачке интелигенције троше, у просеку, до 1.000 пута више токена него једноставни задаци резоновања кода или ћаскање кроз код.

У раду је идентификовано посебно критично откриће: модели су структурно неспособни да предвиде сопствене трошкове токена. За идентичне задатке, стварна потрошња токена истог агента може да варира за фактор 30. А већа потрошња токена не значи нужно и резултате вишег квалитета – тачност често достиже максимум при средњој употреби токена, а стагнира на вишим нивоима потрошње.

Ова инхерентна стохастичност чини буџетирање токена према класичној финансијској логици готово немогућим – осим ако се не створе структурни оквири путем управљаних система вештачке интелигенције који контролишу ток трошкова независно од понашања модела.

Токенизација: Када се подстицаји за учинак изопаче

Случај са 500 милиона токена није изолован инцидент. Он је део ширег феномена који сада има своје име: максимално коришћење токена. Ово се односи на намерно надувавање потрошње токена – не из суштинске потребе, већ да би се испунили интерни индикатори учинка, пењали на корпоративној лествици или једноставно искористила непрецизност мерења продуктивности заснованих на вештачкој интелигенцији.

Амазон је увео интерни систем рангирања под називом „KiroRank“ за своју Kiro платформу за програмере, који је оцењивао запослене на основу њиховог коришћења вештачке интелигенције. Првобитни циљ је био похвалан: промовисање усвајања вештачке интелигенције и истицање најбољих пракси. Ненамерна последица: запослени су почели да додељују бесмислене задатке агентима вештачке интелигенције само да би повећали број својих токена и попели се на ранг листи. Виши потпредседник Амазона, Дејв Тредвел, накнадно је објаснио запосленима да, иако је ранг листа развијена са добрим намерама, резултирала је непотребним додатним трошковима. Његова порука је била недвосмислена: „Не користите вештачку интелигенцију само да бисте је користили.“ Систем је угашен. Као нови критеријум за евалуацију, Амазон је увео „нормализована распоређивања“ – метрику која не мери број токена, већ стварни број генерисаних корисних распоређивања кода.

Мета је неколико недеља раније покренула сличну управну таблу за запослене под називом „Кладеономика“. Образац се системски понавља: чим потрошња токена постане мерљива метрика, запослени оптимизују потрошњу токена – не стварање вредности.

Убер је пружио додатне доказе о обиму проблема. Технички директор Правин Непали Нага потврдио је за The Information да је Убер већ исцрпео цео свој буџет за вештачку интелигенцију за 2026. годину до априла – само четири месеца у години. Ово је покренуто брзим ширењем компаније Claude Code на приближно 5.000 инжењера, динамиком која је потпуно преплавила интерне финансијске моделе компаније. Убер је већ потрошио 3,4 милијарде долара на истраживање и развој у 2025. години – што је повећање од девет процената у односу на претходну годину. Буџетска катастрофа стога није била питање ресурса, већ проблем управљања.

Уберов оперативни директор, Ендру Макдоналд, јавно је изјавио оно о чему многи пословни лидери интерно разговарају, али ретко изражавају тако директно: Висока потрошња токена нема доказиву корелацију са корисним исходима за купце. Убер је такође користио интерне ранг-листе за промоцију усвајања вештачке интелигенције – са истим перверзним резултатом као и Амазон.

Индустрија под притиском трошкова: Још спектакуларних случајева

Клодов случај од 500 милиона долара је најспектакуларнији појединачни случај, али никако једини. Само мај 2026. донео је низ сензационалних катастрофалних трошкова које, узете заједно, сликају структурну слику.

Програмер Питер Штајнбергер, творац виралног алата за вештачку интелигенцију OpenClaw, објавио је снимак екрана своје OpenAI API контролне табле: 1.305.088,81 долара потрошње токена током 30 дана, распоређених на 603 милијарде токена путем 7,6 милиона API захтева, генерисаних од стране приближно 100 Codex инстанци које води тим од три особе. Штајнбергер сада ради директно у OpenAI-ју и није лично платио овај износ – OpenAI је покрио трошкове као део споразума о финансирању. Ипак, овај случај илуструје обим трошкова које развојна окружења вођена агентима могу достићи.

У априлу 2026. године, аустралијски консултант за вештачку интелигенцију по имену Џеси Дејвис добио је рачун за Google Cloud у износу од 25.672,86 аустралијских долара (приближно 18.391 америчких долара) – упркос томе што је његов налог имао буџет од само 10 аустралијских долара. Напад је извршен коришћењем јавно доступног API кључа сачуваног као променљива у обичном тексту у контејнерском окружењу. Девет безбедносних функција Google Cloud-а могло је да спречи овај инцидент – међутим, све су биле подразумевано онемогућене. Да ствар буде гора, Google је аутоматски надоградио налог на виши ниво са ограничењем потрошње од 20.000 до 100.000 америчких долара без обавештења када је прекорачен праг од 1.000 долара.

Мајкрософт је почео да смањује број интерних лиценци за Claude код након што су месечни трошкови по инжењеру порасли на између 500 и 2.000 долара. Компанија мигрира своје инжењере на GitHub Copilot CLI као исплативију алтернативу.

Генерални директор компаније OpenAI, Сем Алтман, јавно је признао да редовно чује од пословних лидера: „Наши трошкови стално расту, људи се осећају продуктивно – али где су приходи, где су стварни добици у продуктивности?“

🤖🚀 Управљана AI платформа: Брже, безбедније и паметније AI решењима уз UNFRAME.AI

Управљана AI платформа - Слика: Xpert.Digital

Овде ћете сазнати како ваша компанија може брзо, безбедно и без високих баријера за улазак имплементирати прилагођена решења за вештачку интелигенцију.

Управљана AI платформа је ваше свеобухватно и безбрижно решење за вештачку интелигенцију. Уместо да се бавите сложеном технологијом, скупом инфраструктуром и дуготрајним процесима развоја, добијате готово решење прилагођено вашим потребама од специјализованог партнера – често у року од само неколико дана.

Кључне предности на први поглед:

⚡ Брза имплементација: Од идеје до апликације спремне за употребу за дане, а не месеци. Нудимо практична решења која стварају тренутну додату вредност.

🔒 Максимална безбедност података: Ваши осетљиви подаци остају код вас. Гарантујемо безбедну и усклађену обраду без дељења података са трећим лицима.

💸 Без финансијског ризика: Плаћате само за резултате. Велика почетна улагања у хардвер, софтвер или особље су потпуно елиминисана.

🎯 Фокусирајте се на свој основни посао: Концентришите се на оно што најбоље радите. Ми се бринемо о целокупној техничкој имплементацији, раду и одржавању вашег вештачке интелигенције.

📈 Спремно за будућност и скалабилно: Ваша вештачка интелигенција расте са вама. Обезбеђујемо континуирану оптимизацију и скалабилност и флексибилно прилагођавамо моделе новим захтевима.

Више информација овде:

Управљана AI платформа

Управљана вештачка интелигенција као корпоративна одговорност: Како заштитити буџет и усклађеност

Шта значи управљана вештачка интелигенција – и зашто би спречила ову штету

У пословном контексту, термин „Управљана вештачка интелигенција“ односи се на структурирани, платформски приступ контроли, праћењу и управљању свим активностима вештачке интелигенције унутар организације. За разлику од неконтролисаног директног приступа API-ју, управљана вештачка интелигенција поставља административни слој контроле између запослених и основних језичких модела.

У потпуно имплементираном систему управљане вештачке интелигенције, сценарио од 500 милиона долара никада се не би могао догодити – из неколико техничких и организационих разлога.

Прво, ограничења трошкова на нивоу пројекта, тима или корисника омогућавају аутоматско ограничавање или потпуни прекид API саобраћаја када се достигну унапред дефинисана ограничења буџета. Google Cloud је ово препознао и на својој Next конференцији у априлу 2026. године најавио увођење „ограничења трошкова“ за Gemini, Cloud Run и друге сервисе – ограничења која не само да упозоравају кориснике већ и активно паузирају саобраћај.

Друго, детаљно праћење у реалном времену на нивоу корисника, тима и тока посла пружа ране сигнале о аномалијама пре него што трошкови могу да порасту. Акшат Бубна, технички директор модалног сектора, процењује да је око 50 процената интерне потрошње токена у компанијама потпуно бескорисно – проблем је тренутно немогућност разликовања безвредне половине од продуктивне половине. Управљани системи вештачке интелигенције пружају управо ову диференцијацију кроз детаљну атрибуцију коришћења.

Треће, управљање приступом засновано на улогама омогућава разликовање између корисничких група: рутински задаци се усмеравају на јефтиније моделе (као што је Claude Haiku), док се рачунарски интензивни токови рада извршавају на моћнијим, али скупљим моделима. Сам Anthropic експлицитно препоручује расподелу задатака осетљиву на модел као стратегију трошкова у својој званичној документацији о ценама: Haiku за једноставне задатке, Sonnet за већину производних радних оптерећења, а Opus само за најсложеније задатке резоновања.

Четврто, механизми кеширања упита штите од сувишних петљи потрошње токена: Понављајући блокови контекста, као што су системски упити или политике компаније, не морају се поново учитaвати са сваким захтевом. За агентске токове рада који учитавају исти контекст стотине пута дневно, ово може смањити трошкове токена за 60 до 80 процената.

Пето, пакетна обрада доноси огромне уштеде трошкова за задатке који нису временски критични: Anthropic-ов Batch API нуди попусте до 50 процената у поређењу са синхроним захтевима. У систему управљане вештачке интелигенције, такве оптимизације се примењују аутоматски, елиминишући потребу да појединачни програмери доносе ручне одлуке.

Структурни јаз у управљању: Зашто су компаније неспремне

Питање које се поставља није техничке, већ организационе природе: Зашто корпорације са хиљадама запослених, ИТ буџетима од више милијарди долара и софистицираним структурама управљања облаком нису успеле да имплементирају најједноставније механизме контроле трошкова за вештачку интелигенцију?

Одговор лежи у структурном временском кашњењу. Концепти управљања облаком попут FinOps-а – дисциплинованог, међуфункционалног приступа управљању трошковима у облаку – еволуирали су током многих година када су трошкови рачунарства били предвидљиви и линеарно скалабилни. Модели одређивања цена AI токена понашају се фундаментално другачије: они су нелинеарни, недетерминистички, а токови рада вођени агентима генеришу трошкове који нису ни предвидљиви ни интуитивни.

Извештај о стању FinOps-а за 2026. годину потврђује да се потрошња на вештачку интелигенцију развила од експерименталних буџета до основне инфраструктуре и да скоро сви FinOps тимови сада деле одговорност за радна оптерећења везана за вештачку интелигенцију. Истовремено, недостају утврђене метрике за повраћај инвестиција: Према анкети уживо на самиту FinOps фондације, највећи проблем за пословне лидере није износ трошкова вештачке интелигенције, већ немогућност да се демонстрира њена вредност.

Структура цена компаније Anthropic је додатно закомпликовала ствари. У априлу 2026. године, Anthropic је фундаментално реформисао свој пословни модел: Уместо фиксних претплата заснованих на броју места, сада постоје ниже номиналне цене места (нпр. 20 долара месечно за техничке кориснике Claude Code-а), у комбинацији са обавезним, унапред плаћеним обавезама потрошње. Претходни API попусти од 10 до 15 процената за купце на велико су укинути. Ова структура у потпуности пребацује ризик потрошње на предузеће: Компаније плаћају за обавезане количине без обзира на стварну потрошњу, док се неконтролисана потрошња која прелази обавезу наплаћује по пуној цени.

Гартнер предвиђа да ће више од 40 процената свих пројеката Agentic AI бити обустављено до краја 2027. године – првенствено због неадекватних структура управљања.

Управљање вештачком интелигенцијом као стратешки корпоративни императив

Последице ових случајева су јасне: управљање вештачком интелигенцијом више није режија за ИТ одељење, већ стратешка корпоративна одговорност. Компаније које имплементирају управљане структуре вештачке интелигенције добијају неколико кључних предности у односу на нерегулисана примене.

Транспарентност трошкова и контрола потрошње чине темељ. Водеће организације се већ ослањају на строга ограничења трошкова, управљање приступом засновано на улогама, контролне табле за праћење у реалном времену и политике које налажу исплативије моделе за рутинске задатке. Databricks експлицитно препоручује заштитне ограде за време дизајнирања и извршавања у својим смерницама за управљање: унапред дефинисана ограничења токена, ограничења дужине контекста, правила кеширања и системе за откривање аномалија који интервенишу пре него што се токови посла неконтролисано појачају.

Мерење засновано на вредности замењује метрике засноване на токенима. Амазонов прелазак са KiroRank-а на „нормализована распоређивања“ – мерење значајних распоређивања кода уместо количина сирових токена – указује на пут напред: не потрошња, већ произведени резултат је релевантна метрика. Ова промена у метрикама није техничка фуснота, већ фундаментално поновно евалуирање шта значи продуктивност вештачке интелигенције.

Специјализовани алати, уместо система опште намене, омогућавају значајно смањење трошкова без угрожавања квалитета. За дефинисане, понављајуће задатке, специјализована, решења оптимизована за задатке су често 10 до 100 пута јефтинија од универзалног граничног модела. Самит FinOps фондације формулисао је ово као кључни принцип: Прво, утврдите да ли задатак уопште захтева вештачку интелигенцију; затим, утврдите који је модел најисплативији; и тек онда оптимизујте.

Архитектуре вештачке интелигенције централизују контролу. Платформе попут Bifrost-а (Maxim AI) делују као централни пролази који усмеравају, прате и спроводе контроле политика на сав вештачки интелигентни саобраћај организације. Такве архитектуре омогућавају организацијама да управљају ограничењима потрошње, усмеравањем модела, филтерима приватности и захтевима за усклађеност на једној централној локацији – и да у потпуности евидентирају све вештачке интелигенције у сврху ревизије.

Економија доба токена: Нова правила за финансирање предузећа

Случај од 500 милиона долара означава прекретницу у начину на који се корпоративне финансије и инфраструктура вештачке интелигенције морају посматрати заједно. Модели одређивања цена засновани на токенима не понашају се као традиционалне софтверске лиценце: нема фиксне годишње накнаде, нема јасно дефинисаног обима и нема природног ограничења потрошње.

Ова фундаментална разлика превазилази традиционалне процесе корпоративног буџетирања. Финансијски директори, навикли да моделирају трошкове софтвера као фиксне трошкове, суочавају се са моделом варијабилних трошкова који се може експоненцијално скалирати. Пројектовано је да ће глобална потрошња на вештачку интелигенцију достићи 2,52 билиона долара до 2026. године – што је повећање од 44 процента у односу на претходну годину. Оваква скала чини неконтролисано примењивање у предузећима системским ризиком.

Мајкл Бери, познат по својим раним упозоравајућим сигналима тржишних криза, описао је максимално коришћење токена као „прекомерну потрошњу вођену квотама, ранг листама и менаџментом“ и „луду, ужурбану, привремену фазу“. Он предвиђа да је ова фаза неодржива. Без обзира да ли се његов тајминг покаже исправним или не, структурни притисак за прилагођавање је већ у току.

Парадигма неконтролисаног, демократизованог приступа вештачкој интелигенцији као акцелератору иновација тренутно се коригује стварношћу масовних прекорачења трошкова. Оно што преостаје је зрелији модел: широк приступ, али са дефинисаним границама, мерљивим циљевима и механизмима институционалне контроле – укратко, управљана вештачка интелигенција у свом најпунијем смислу.

Шта компаније треба сада да ураде

Описани случајеви омогућавају тренутне оперативне закључке за компаније које користе вештачку интелигенцију на нивоу предузећа.

Први приоритет је хитна имплементација строгих ограничења трошкова на нивоу корисника, тима и пројекта. Anthropic, Google Cloud и OpenAI нуде механизме контроле предузећа које је потребно конфигурисати. Главни проблем у скоро свим познатим случајевима није био њихово одсуство из портфолија производа, већ немогућност њихове конфигурације.

Паралелно са тим, основна вредност стварне потрошње токена треба да се мери током 30 дана пре него што се агентски токови посла имплементирају или скалирају. Без ове основне вредности, не постоји референтна тачка за аномалије. Системи за детекцију аномалија који аутоматски покрећу упозорења на 25, 50 и 75 процената месечног буџета пружају други слој безбедности.

Дефиниција метрике за продуктивност вештачке интелигенције мора да се пребаци са количина токена на метрике исхода. Амазон је представио одржив модел са „нормализованим имплементацијама“. Инвестиције у вештачку интелигенцију које се не могу пратити до измерених пословних резултата требало би поново проценити.

Примена агентске вештачке интелигенције захтева експлицитно, фазно управљање: пилот групе, јасно дефинисане случајеве употребе, ограничења трошкова по радном току и редовне прегледе пре ширег примене. Скалабилност агентске вештачке интелигенције је предност, али је такође и ризик од трошкова ако се примени без заштитних ограда.

Закључак: 500 милиона долара за лекцију која је била доступна бесплатно

Случај од 500 милиона долара је спектакуларан по својим размерама, али његов узрок је баналан: нико није променио прекидач. Техничка инфраструктура за контролу трошкова је била на месту, али је конфигурација недостајала. Оно што је недостајало била је управљана стратегија вештачке интелигенције – институционални оквир који комбинује приступ вештачкој интелигенцији са управљањем вештачком интелигенцијом.

Порука пословним лидерима је јасна: великодушан приступ алатима вештачке интелигенције без оквира управљања није знак поверења у запослене – то је фискални немар. Случајеви Убера, Амазона, Мајкрософта и анонимне корпорације са инвестицијом од пола милијарде долара не описују колективно почетне проблеме нове технологије. Они описују системски неуспех интеграције нове технологије са провереним принципима корпоративног управљања.

Управљана вештачка интелигенција је одговор на ову празнину. Не као ограничење иновације, већ као услов за њену одрживост.

Консалтинг - Планирање - Имплементација