Финансијски директори оглашавају узбуну: Неконтролисани трошкови нових вештачке интелигенције

Konrad Wolfenstein

Пре 7 сати

Нема више бројача токена: Зашто би компаније од сада требало да плаћају само за праве резултате вештачке интелигенције – Слика: Xpert.Digital

Нема више бројача токена: Зашто би компаније од сада требало да плаћају само за праве резултате вештачке интелигенције

Генеративна вештачка интелигенција је у фундаменталној кризи – не зато што технологија не успева, већ зато што се њена комерцијална архитектура урушава.

Технолошки гиганти попут Мајкрософта, Убера и ГитХаба већ предузимају драстичне мере: годишњи буџети за алате вештачке интелигенције смањују се у року од неколико месеци због употребе аутономних агената, док су очекивани добици у продуктивности често немерљиви. Кривац је прелазак целе индустрије на моделе наплате засноване на токенима. Под маском „плаћања по ономе што користите“, добављачи пребацују пуни финансијски ризик на своје пословне клијенте, наплаћујући само саму рачунарску снагу – без обзира на то да ли вештачка интелигенција исправно решава задатак или пружа стварну економску вредност. Овај чланак анализира скривене ризике тренутне трансформације цена вештачке интелигенције, објашњава фаталну тензију између контроле буџета и усвајања вештачке интелигенције и показује зашто је одређивање цена засновано на исходима једино одрживо решење за будућност пословне вештачке интелигенције.

У вези са овим:

UNFRAME.AI: Цене засноване на токенима не раде. Модели засновани на исходима то исправљају

Ко плаћа када вештачка интелигенција ништа не испоручи? Обрачун индустрије која није разумела сопствено стварање вредности

Пословни модел генеративне вештачке интелигенције је у фундаменталној кризи. Не зато што сама технологија не успева, већ зато што начин наплате окреће економску логику наглавачке: компаније сносе цео финансијски ризик – провајдер наплаћује без обзира на исход. У мају 2026. године, Мајкрософт је отказао интерне лиценце за Клод Код за хиљаде запослених у свом одељењу за искуства и уређаје. Убер је исцрпео цео свој буџет за вештачку интелигенцију за 2026. годину за четири месеца, јер је 5.000 инжењера интензивно радило са Клод Кодом, генеришући месечне трошкове од 500 до 2.000 долара по особи. ГитХаб, највећа светска платформа за програмере у власништву Мајкрософта, укинула је фиксне цене 1. јуна 2026. године и прешла на систем кредитирања заснован на токенима. Ова три догађаја у року од неколико недеља нису случајност – они су симптоми структурне мане дубоко укорењене у архитектури цена индустрије вештачке интелигенције.

Крај ере субвенција: Када тржиште открије цену

Прва фаза генеративне вештачке интелигенције била је у великој мери субвенционисана. Провајдери попут Anthropic, OpenAI и Microsoft нудили су своје услуге знатно испод стварних трошкова инфраструктуре како би стекли тржишни удео, разумели понашање корисника и изградили екосистеме програмера. Фиксне накнаде за асистенте кодирања, неограничене сесије ћаскања за једноцифрене месечне износе и издашно тестирање предузећа на рачун провајдера — све је то било могуће зато што је ризични капитал финансирао разлику у цени и зато што прави трошкови коришћења радних процеса заснованих на агентима још нису били познати.

Ова фаза је сада очигледно завршена. GitHub је експлицитно оправдао свој прелазак на наплату засновану на токенима наводећи да је коришћење засновано на агентима постало норма и да повезани трошкови рачунарства једноставно више не могу да подрже претходне моделе са фиксном ценом. Компанија је то рекла отворено: Кратко питање у ћаскању и вишечасовна аутономна сесија кодирања раније су коштали исто – ово је било неодрживо. Програмери који су раније могли да раде засновано на агентима без ограничења за 10 до 39 долара месечно видели су да су им се трошкови повећали са само 50 на преко 3.000 долара месечно након преласка. Тема заједнице која је објавила промену добила је скоро 900 гласова против.

Гартнер предвиђа да ће глобална потрошња на вештачку интелигенцију (ВИ) у 2026. години износити 2,52 билиона долара, што је повећање од 44 процента у односу на исти период прошле године. Са глобалним расходима овог обима, питање ко сноси трошкове, а ко убира користи више није академска дискусија, већ фундаментално питање корпоративног управљања. Предвиђа се да ће само потрошња на ВИ инфраструктуру порасти на 1,37 билиона долара у 2026. години. Истовремено, према студији МИТ-а из јула 2025. године, приближно 95 процената пилот пројеката GenAI на нивоу целог предузећа није успело да оствари мерљив ефекат добити и губитка. Ова контрадикција – растући расходи, недостатак поврата – је срж проблема.

Пет класа ризика које модели одређивања цена токена преносе на компанију

Иза безазлене фразе „плати колико користиш“ крије се систематско померање пет различитих класа ризика са провајдера на корпоративног купца. Свако ко разуме овај механизам препознаје зашто наплата токенима није неутралан метод наплате, већ структурни недостатак за купца.

Буџетски ризик: Добављач контролише јединицу, а не купац

Са моделом цена заснованим на токенима, компанија се обавезује на годишњи буџет за јединицу трошкова чију цену провајдер може променити у било ком тренутку и чија се потрошња понаша нелинеарно са повећањем употребе. На пример, у мају 2026. године, Anthropic је објавио да ће претплатници за алате агента и интеграције трећих страна добијати одвојене месечне додатке који се наплаћују по стандардним API ценама. Ово је једнострано прилагођавање цена које одмах обезвређује постојећи буџет. Убер је то искусио из прве руке: буџет израчунат за дванаест месеци истекао је за четири. Усвајање није био проблем - то је заправо био знак успеха. Проблем је био у томе што се јединица „токена“ експоненцијално скалира чим се имплементирају токови рада засновани на агентима, док је буџет планиран линеарно.

Ризик усвајања: Употреба и стварање вредности су одвојени

Систем заснован на токенима наплаћује рачунарску снагу, а не резултате. Модел који користи 100.000 токена и даје нетачан одговор кошта потпуно исто као модел који користи 100.000 токена и даје тачан одговор. Ово раздвајање трошкова и користи је фундаментални економски проблем. То значи да компанија може да изгради ток рада око система заснованог на токенима, да управља тим током рада и да га плати - а да никада не види било какву мерљиву додату вредност. Чињеница да је 42 одсто компанија напустило већину својих вештачких интелигенција иницијатива у 2025. години, што је драматичан пораст у односу на 17 одсто претходне године, у том светлу је мање технолошки проблем него проблем цена. Неисправна архитектура подстицаја доводи до погрешних улагања која постају очигледна тек након више месеци рада.

Ризик прогнозе: Неконтролисана варијабилност у планирању трошкова

За финансијске директоре, наплата токенима је категорија трошкова која се понаша као грешке у хеџингу валута: фундаментално је немоделна јер превише спољних варијабли утиче на наплату. Сваки нови случај употребе, сваки нови интерни корисник, свака промена у понашању модела, свако повећање величине контекстног прозора – све ово гура рачун у непредвидивом правцу. Овоме се додаје такозвано ширење агената: када компаније уведу токове рада засноване на агентима у различитим одељењима, непредвидивост се множи. Сваки нови агент додаје још један унос у књигу токена, без икакве гаранције поврата. Са Claude Opus 4.7, Anthropic је увео скок верзије који, због продужених ланаца резоновања, троши око 30 процената више токена од свог претходника – повећање трошкова од 30 процената преко ноћи, без иједне нове трансакције или поруџбине купца која би то оправдала.

Ризик управљања: Заштита података и усклађеност се скалирају са потрошњом

У регулисаним индустријама – финансијским услугама, здравству, осигурању – сваки позив токена има димензију управљања: корпоративни подаци се усмеравају кроз инфраструктуру закључивања треће стране са сваким API позивом. То значи да што се више токена потроши, више података напушта интерни безбедносни периметар. У окружењу регулисаном GDPR-ом, SOC 2, HIPAA-ом и Законом ЕУ о вештачкој интелигенцији, ово генерише трошкове усклађености, изложеност ревизији и ризике од одговорности који се повећавају са интензитетом коришћења. Наплата токена и суверенитет података су стога у структурној тензији: они који користе више вештачке интелигенције аутоматски преузимају већи регулаторни ризик – проблем подстицаја који омета безбедну и скалабилну употребу вештачке интелигенције.

Ризик од исхода: Ћутање добављача вештачке интелигенције у вези са утицајем

Најмање помињани ризик је најзначајнији. Модели одређивања цена токена мере потрошњу, а не стварање вредности. Добављач прима уплату без обзира на то да ли програм вештачке интелигенције компаније има мерљив утицај на добитак и губитак или се придружио дугој листи пилот пројеката корпоративне генерације вештачке интелигенције који нису успели да генеришу мерљив повраћај. Студија МИТ-а наводи ову бројку на 95 процената. Другим речима, у великој већини случајева, компанија плаћа без примања било какве проверљиве економске вредности – а добављач нема подстицај везан за пословни модел да то промени.

Логика цена у индустрији: Тржиште које није знало сопствену вредност

Основни узрок тренутне кризе цена лежи у пореклу тржишта GenAI. Индустрија је пласирала своје производе на тржиште пре него што је схватила њихову праву цену коришћења у продуктивним пословним окружењима. Фиксне цене и модели цена засновани на токенима замишљени су као стратегије за улазак на тржиште, а не као одрживе комерцијалне структуре. Сам GitHub је признао да постојећи модели фиксних цена апсорбују стварне трошкове закључивања и да овај механизам није одржив за добављаче на дужи рок.

Ово је створило парадоксалну ситуацију: што је усвајање успешније, то је већи ризик од губитка за провајдера и већи буџетски ризик за компанију. Убер је најживљи пример: усвајање Клода Кода повећало се са 32 на 84 процента програмера, 70 процената посвећеног кода генерисано је помоћу вештачке интелигенције, а повећање продуктивности је било стварно и мерљиво. Па ипак, технички директор Убера, Правин Непали Нага, описао је ситуацију на следећи начин: „Вратио сам се на почетак јер је буџет који сам сматрао неопходним већ потрошен.“ Технологија је функционисала. Модел цена није.

Ово такође објашњава зашто је Мајкрософт одлучио да откаже лиценце за Claude Code за своју дивизију за искуства и уређаје и да мигрира програмере на GitHub Copilot CLI. Званични разлог који се наводи је „уједињење ланца алата“ – интерно, то је била финансијска одлука. Хиљаде инжењера који развијају Windows, Microsoft 365, Teams, Outlook и Surface интензивно су користили Claude Code од његовог пилот лансирања у децембру 2025. године, а трошкови токена су исцрпели годишњи буџет много пре краја године. Мајкрософт, компанија која је инвестирала 13 милијарди долара у OpenAI и управља облаком на којем ради већина лабораторија за фронт-енд развој вештачке интелигенције, погледала је бројке и донела одлуку на основу трошкова, а не перципиране вредности.

Модели цена усмерених на резултате: Другачија комерцијална архитектура, без попуста

Термин „цене засноване на исходима“ често се погрешно схвата на тржишту. Не ради се о јефтинијим ценама токена, пакетима попуста или одложеном плаћању. То је фундаментално другачија комерцијална архитектура: Пружалац услуга се плаћа по завршеном задатку – ако и само ако је дефинисани пословни исход верификован на дефинисаном радном току. Не за рачунарски напор који је настао успут.

Деценијама је пословни софтвер функционисао по принципу система и SLA: Добављач је одговоран за економију јединице и осигурава да решење испоручује обећане резултате. ERP системи, CRM платформе, рачуноводствени софтвер – ниједна од ових категорија никада није наплаћивана на основу приступа бази података, API позива или циклуса рачунања. Наплаћују се на основу корисника, модула или резултата учинка. Цене вештачке интелигенције морају се придржавати истог стандарда.

Међутим, модел одређивања цена заснован на исходима је економски исплатив само ако добављач може сам да апсорбује варијансу – то јест, ако је изградио ефикасност платформе која му омогућава да интернализује ризик. Већина добављача то не може да уради. Њихови трошкови производње су исти жетон који компанија сноси – и они једноставно преносе тај тезгу даље. Одређивање цена засновано на исходима захтева од добављача да повеже сопствени приход са исходом. Ово је знатно другачији профил ризика – и објашњава зашто је овај модел одређивања цена још увек редак на тржишту.

🤖🚀 Управљана AI платформа: Брже, безбедније и паметније AI решењима уз UNFRAME.AI

Управљана AI платформа - Слика: Xpert.Digital

Овде ћете сазнати како ваша компанија може брзо, безбедно и без високих баријера за улазак имплементирати прилагођена решења за вештачку интелигенцију.

Управљана AI платформа је ваше свеобухватно и безбрижно решење за вештачку интелигенцију. Уместо да се бавите сложеном технологијом, скупом инфраструктуром и дуготрајним процесима развоја, добијате готово решење прилагођено вашим потребама од специјализованог партнера – често у року од само неколико дана.

Кључне предности на први поглед:

⚡ Брза имплементација: Од идеје до апликације спремне за употребу за дане, а не месеци. Нудимо практична решења која стварају тренутну додату вредност.

🔒 Максимална безбедност података: Ваши осетљиви подаци остају код вас. Гарантујемо безбедну и усклађену обраду без дељења података са трећим лицима.

💸 Без финансијског ризика: Плаћате само за резултате. Велика почетна улагања у хардвер, софтвер или особље су потпуно елиминисана.

🎯 Фокусирајте се на свој основни посао: Концентришите се на оно што најбоље радите. Ми се бринемо о целокупној техничкој имплементацији, раду и одржавању вашег вештачке интелигенције.

📈 Спремно за будућност и скалабилно: Ваша вештачка интелигенција расте са вама. Обезбеђујемо континуирану оптимизацију и скалабилност и флексибилно прилагођавамо моделе новим захтевима.

Више информација овде:

Управљана AI платформа

Суверенитет података наспрам хиперскалера: Ко ће победити у бици за инфраструктуру вештачке интелигенције?

Практични модел: Како функционише испорука вештачке интелигенције оријентисана на резултате

Платформе које доследно примењују принцип заснован на исходима прате другачију логику ангажовања. Уместо изнајмљивања инфраструктуре и једноставног мерења, оне прво идентификују ток рада који генерише највећу вредност за случај употребе компаније – то јест, процес који може најбрже да оствари мерљив утицај. Решење спремно за производњу се затим примењује унутар инфраструктуре компаније: у облаку предузећа, локално, у приватном облаку или као потпуно управљана SaaS понуда, при чему подаци никада не напуштају периметр компаније. Плаћање почиње тек када је резултат доступан и купац је задовољан.

Овај модел има далекосежне импликације на поделу ризика. Приморава добављача да усмери своје ресурсе на случајеве употребе који заиста стварају вредност, а не на оне који троше много токена. Ствара директно усклађивање интереса између добављача и купца: обоје профитирају када вештачка интелигенција заиста ради; ниједно не профитира на рачун другог када не ради. За регулисане индустрије, претпоставка да подаци не напуштају периметр компаније такође пружа архитектуру усклађености компатибилну са GDPR-ом, SOC 2, HIPAA и Законом ЕУ о вештачкој интелигенцији.

Кључна предност добро имплементираних, платформи оријентисаних на резултате је њихова кумулативна структура знања: сваки успешно завршен ток рада надограђује се на заједничку интерну базу знања која постаје вреднија са сваким наредним задатком. Ово је у директној супротности са имплементацијама заснованим на токенима, које, иако акумулирају трошкове, не учвршћују институционално знање унутар компаније.

Перспектива финансијског директора: Наплата токенима као категорички буџетски проблем

За финансијске стручњаке, наплата токенима представља категорички нову врсту оперативних трошкова за које не постоје утврђене структуре управљања. Трошкови облака – рачунарство, складиштење, мрежа – су професионализовани током протеклих петнаест година. FinOps као дисциплина је изнедрио методе, алате и организационе јединице које чине трошкове облака предвидљивим и контролисаним. Потпуни еквивалент за трошкове извршавања AI агента још увек недостаје.

Потрошња токена се не скалира са бројем корисника, већ са амбицијом упита, дужином контекстуалних прозора, бројем истовремено покренутих агената и сложеношћу ланаца резоновања. То значи да компанија која прелази 100 инжењера са једноставног аутоматског довршавања на токове рада засноване на агентима може да умножи свој месечни напор вештачке интелигенције за фактор од пет до двадесет – без додавања иједног новог корисника. Стандардне претпоставке планирања засноване на броју корисника или обиму сесија су структурно погрешне у овом контексту.

Ово има конкретне последице по планирање буџета. Структура потрошње захтева сличне механизме контроле као они за енергију: мерење у реалном времену, упозорења о праговима, квоте тимова и чврста ограничења на нивоу агента. Компаније које ово не имплементирају пре почетка усвајања суочиће се са последицама када буџет већ буде исцрпљен - попут Убера. Компанија није имала ограничења по тиму, није имала централизовано праћење и није имала увид у потрошњу у реалном времену све док технички директор није прерано пријавио да је годишњи буџет исцрпљен.

Динамика тржишта: Ко држи моћ у овој трансформацији цена

Тренутна трансформација цена није симетрична. Велики хиперскалери попут Мајкрософта, Гугла и Амазона имају структурну предност која их разликује од мањих добављача: они контролишу дистрибутивне канале, пословне уговоре, клауд инфраструктуру и алате за програмере. Мајкрософт није угасио Клод Код зато што је Копилот бољи – интерне анкете су показале да програмери преферирају Клод Код. Компанија га је угасила јер контролише дистрибуцију и не може да контролише или стратешки искористи трошкове токена за конкурентски производ.

Ова динамика је значајна за тумачење трансформације цена у целини. За хиперскалере, удаљавање од фиксних цена и увођење наплате токенима није реформа цена – то је оптимизација прихода. Они који контролишу инфраструктуру на којој модели раде, који управљају системима наплате и који држе пословне уговоре структурно имају користи од наплате засноване на потрошњи. Супротан модел – одређивање цена усмерено на резултате – угрожава ове позиције прихода јер приморава добављача да сноси ризик уместо да га пренесе.

За средња предузећа и корпорације које нису међу хиперскалерима, ово је значајно питање моћи када је у питању следеће обнављање уговора. Према анализи JP Morgan-а, стрес на инфраструктуру вештачке интелигенције могао би да створи економске трење пре него што се обећани приноси испуне. Они који активно не преговарају о расподели ризика у следећем уговору о вештачкој интелигенцији прихватиће стандардну позицију која је структурно неповољна за њих.

Порука инвестиционе економије: Ако ефикасност није циљ, она постаје проблем

Постоји контрааргумент на критику трошкова наплате засноване на токенима који се мора схватити озбиљно. У Уберу, вештачка интелигенција је генерисала 70 процената посвећеног кода и 11 процената свих ажурирања уживо. Инжењер у Сан Франциску кошта компанију знатно више годишње него 2.000 долара месечно за трошкове токена. Ако кодирање засновано на вештачкој интелигенцији повећа продуктивност чак и за једноцифрени проценат најскупљег ресурса компаније, повраћај инвестиције би могао да надмаши трошкове.

Аргумент није погрешан – непотпун је. Прво, важи само ако су повећања продуктивности заиста квантификована и узрочно приписива скупу алата, што се ретко систематски мери у већини компанија. Друго, претпоставља да се уштеђено време инжењеринга претвара у остварене уштеде трошкова или директно приписиве додатне приходе – а не, као у многим организацијама, једноставно доводи до више посла, што заузврат троши више токена из система вештачке интелигенције. Треће, упоредивост је валидна само ако је резултат рада вештачке интелигенције валидиран: код који је генерисан, али се не користи продуктивно није еквивалентан вредности рада виших инжењера.

Основни аргумент за одређивање цена усмерених на резултате стога остаје валидан: ако је повраћај стваран, добављач може уговорно да га поткрепи и повеже свој приход са њим. Ако то не може или неће да учини, за то постоје структурни разлози, који иду на штету купца.

Стратешке последице по корпоративно управљање

Догађаји из прве половине 2026. године пружиће менаџменту компаније јасне оперативне закључке.

Прво, контрола трошкова вођена вештачком интелигенцијом захтева посебну FinOps дисциплину, која мора бити структурирана слично cloud FinOps-у, али захтева сопствене методологије. Потрошња токена је нелинеарна, специфична за агента и зависи од верзије модела. Контролне табле нису довољне; оно што је потребно су ограничења буџета у реалном времену на нивоу тима и агента, аутоматски механизми за искључивање након прекорачења прагова и евиденције ревизије на нивоу појединачног покретања.

Друго, пилот пројекти који користе наплату токенима не пружају поуздане прогнозе трошкова производње. Пилот пројекат који кошта 1.000 евра месечно може се повећати и до 100 пута у односу на своју првобитну употребу у производном окружењу, чиме премашује буџетске ресурсе. Планирање трошкова за вештачку интелигенцију мора се заснивати на претпоставкама о производњи, а не на пилотској употреби.

Треће, свако обнављање уговора са добављачима вештачке интелигенције има димензију стратешког преговарања која је тренутно недовољно искоришћена. Питање које свака компанија треба да постави свом добављачу вештачке интелигенције на следећем састанку је једноставно и прецизно: Колико ћу платити ако не функционише? Добављач који није спреман да подели ризик од негативних последица има сукоб интереса са купцем који се не може игнорисати у озбиљном процесу набавке.

Четврто, суверенитет података је посебна променљива трошкова и ризика, а не само питање усаглашености. Компаније у регулисаним индустријама које користе услуге засноване на токенима у јавном облаку акумулирају напоре у погледу усаглашености, изложеност ревизији и потенцијалне ризике од одговорности са сваком јединицом употребе. Суверена вештачка интелигенција – то јест, инфраструктура вештачке интелигенције која се користи унутар сопственог периметра компаније – достигнуће технолошки паритет са моделима фронт-енда у облаку до 2026. године: Према индексу вештачке интелигенције Станфорда за 2026. годину, разлика у перформансама између најбољих модела са отвореном тежином и најнапреднијих власничких система смањиће се на просечно три месеца.

Изгледи: Шта трансформација цена значи за 2027. годину

Тржиште се мења. Прелазак са фиксних цена на наплату токенима је краткорочна победа за провајдере – приходи расту са коришћењем. Међутим, на средњи рок то је катализатор за три паралелна развоја који ће фундаментално променити структуру цена.

Прво, конкурентски притисак ће се повећати због модела отвореног кода. Ако трошкови власничких токена за агентска имплементирања на нивоу целог предузећа достигну шестоцифрени износ годишње, а модели отворене тежине пруже упоредиве перформансе на локалном хардверу, обрачун укупних трошкова власништва ће се окренути у корист локалне инфраструктуре – посебно за европске компаније које дају приоритет усклађености са GDPR-ом и суверенитету података.

Друго, модели цена усмерених ка резултатима ће расти на тржишту јер дају пословним корисницима преговарачку позицију коју токенски начин наплате, по дефиницији, не нуди. Иако тренутно само неколико добављача има ефикасност платформе да профитабилно понуди овај модел, конкуренција ће приморати на имитацију.

Треће, управљање вештачком интелигенцијом – укључујући мерење повраћаја улагања у вештачку интелигенцију, праћење доприноса стварању вредности и уговорно дефинисање метрика успеха – постаће засебна пословна област, упоредива са заштитом података или сајбер безбедношћу. Гартнер очекује да ће глобална потрошња на вештачку интелигенцију достићи 3,34 билиона долара до 2027. године. На овој скали, руководиоци компанија више неће прихватати вештачку интелигенцију као буџетску категорију без проверљивих метрика успеха.

Кључно питање није да ли ће наплата заснована на токенима бити замењена моделима оријентисаним на резултате – економска логика сугерише да ће се то догодити. Питање је да ли ће компаније активно обликовати ову транзицију или ће дозволити да им се она пасивно намеће стално растућим рачунима. Они који сада прилагођавају архитектуру уговора својих инвестиција у вештачку интелигенцију вуку прави крај конопца.

Консалтинг - Планирање - Имплементација