Tokenomika | Když se umělá inteligence stane dražší než personál: Tichá exploze nákladů umělé inteligence a co s tím může dělat řízená umělá inteligence

Konrad Wolfenstein

Před 1 měsícem

Tokenomika | Když se umělá inteligence stane dražší než personál: Tichý nárůst nákladů na umělou inteligenci a co s tím může dělat řízená umělá inteligence – Obrázek: Xpert.Digital

Explodující účty za tokeny: Jak „spravovaná umělá inteligence“ chrání váš IT rozpočet před krachem

### Uberův rozpočet na umělou inteligenci byl vyčerpán: Proč náklady na tokeny nyní převyšují platy ### Skryté náklady na agenty s umělou inteligencí: Proč účty za cloud náhle explodují ### 113 000 dolarů za jeden měsíc umělé inteligence: Varovný signál, nebo budoucnost práce? ###

Neviditelná nákladová past ve firmách: Jak fakturace založená na tokenech ničí firemní rozpočty

Umělá inteligence byla dlouho považována za ultimátní nástroj pro zvýšení produktivity – nyní však způsobuje, že se mnoho zasedacích místností polévá studeným potem. Důvod: explodující a nepředvídatelné účty za cloud a tokeny. Když korporace jako Uber vyčerpají své roční rozpočty na umělou inteligenci po pouhých několika měsících a technologickí giganti zjistí, že výpočetní výkon je v některých oblastech dražší než jejich vlastní zaměstnanci, bylo dosaženo kritického bodu zlomu. Počáteční euforie ustupuje drsné realitě, kdy skryté náklady na autonomní agenty umělé inteligence a modely fakturace založené na využití ohrožují ziskovost. Existují však cesty ven: Abyste se vyhnuli pádu do pasti nákladů na tokeny, dostává se do centra pozornosti nový strategický koncept – řízená umělá inteligence. Zjistěte, proč se výpočty nákladů mnoha společností v současné době již nesčítají a které konkrétní strategie FinOps můžete použít k tomu, abyste své výdaje na umělou inteligenci dostali zpět pod kontrolu dříve, než bude rozpočet vyčerpán.

Konec éry paušálních sazeb: Jak mohou firmy zastavit cenovou past umělé inteligence

Technologický průmysl v současné době zažívá dlouho očekávané rozčarování: Umělá inteligence již v mnoha firmách není jen zvyšovačem produktivity, ale stala se nezávislým, obtížně kalkulovatelným nákladovým faktorem – faktorem, který v extrémních případech převyšuje osobní náklady. Co by před dvěma lety znělo jako odvážná předpověď, je dnes v roce 2026 drsnou obchodní realitou. Otázkou už není, zda umělá inteligence vytváří přidanou hodnotu, ale zda tato přidaná hodnota ospravedlňuje explodující provozní náklady. A na obzoru se objevuje koncept, který slibuje poskytnout odpovědi: řízená umělá inteligence.

Základy jsou vratké: Proč výpočet nákladů už nesedí

Technologické společnosti dva roky sotva zpochybňovaly své rozpočty na umělou inteligenci. Logika byla až zdánlivě jednoduchá: ti, kdo investují včas, si zajistí konkurenční výhodu; ti, kdo váhají, zaostávají. V této atmosféře optimismu proudily miliardy do jazykových modelů, kódovacích asistentů a autonomních agentů – často bez důsledného měření výkonu a bez cenových limitů. Nyní se účty blíží a čísla je těžké ignorovat.

Problém se stává obzvláště patrným tam, kde se umělá inteligence nepoužívá jen jako nástroj, ale jako primární pracovní síla. Bryan Catanzaro, viceprezident pro aplikované hluboké učení ve společnosti Nvidia, to pro Axios shrnul jednou větou: „Náklady na výpočetní techniku v jeho týmu daleko převyšují náklady na personál.“ Toto je tvrzení značné váhy – nejen proto, že pochází od společnosti, která je sama v centru vlny infrastruktury umělé inteligence, ale také proto, že popisuje systémový posun, který se dosud v manažerských zprávách sotva objevil.“.

Důvod spočívá ve struktuře moderních fakturačních modelů umělé inteligence. Velké jazykové modely jako GPT, Claude nebo Gemini neúčtují paušální poplatek, ale spíše se účtují na základě tokenů – nejmenších jednotek, na které je text během zpracování rozdělen. Prémiové modely stojí 2,50 až 5,00 dolarů za milion vstupních tokenů a 10 až 25 dolarů za milion výstupních tokenů. Zní to abstraktně, ale rychle se to stává konkrétním: Každý, kdo denně odesílá tisíce dotazů prostřednictvím produkčního systému umělé inteligence, spouští agenty s dlouhými kontextovými okny nebo provádí automatizované kontroly kódu, hromadí obrovské částky – často aniž by si to uvědomoval, dokud nedorazí měsíční faktura.

Moment Uberu: Varování pro celé odvětví

Žádný z nedávných případů neilustruje problém živěji než případ Uberu. Praveen Neppalli Naga, technický ředitel společnosti zabývající se spolujízdou, deníku The Information přiznal, že společnost již během několika měsíců vyčerpala celý svůj rozpočet na umělou inteligenci na rok 2026 – především kvůli rychlému přijetí Claude Code od Anthropic. Naga to řekl bez obalu: „Jsem zpátky u rýsovacího prkna, protože rozpočet, o kterém jsem si myslel, že ho potřebuji, už byl vyčerpán.“ Spouštěčem nebyl jeden velký projekt, ale spíše postupné šíření nástroje v celém technickém oddělení. Uber poskytl přístup k Claude Code přibližně 5 000 vývojářům – a dopad na rozpočet byl odpovídajícím způsobem významný.

Naga také odhalil pozoruhodné: 11 procent všech živých aktualizací kódového repozitáře Uberu nyní píší agenti umělé inteligence, nikoli lidé. Společnost se tedy nachází uprostřed skutečné transformace vývoje softwaru – a platí cenu, která zmařila všechny počáteční výpočty. Paradox je zřejmý: čím je umělá inteligence užitečnější, tím více se používá a tím vyšší jsou náklady. Model tvorby cen založený na využití přímo promítá úspěch do tlaku na náklady.

Jason Calacanis, známý investor ze Silicon Valley, popsal podobnou zkušenost: náklady agenta ve výši 300 dolarů denně na rozhraní Claude API od Anthropic – za zlomek práce jednoho zaměstnance. Jeho verdikt: v jakém okamžiku náklady na tokeny překročí plat osoby, kterou mají nahradit? Tato otázka – rétorická, ale matematicky reálná – se stala ústřední otázkou ekonomie umělé inteligence v roce 2026.

Hrdý na šestimístný účet: Fenomén umělé inteligence Swan

Na opačném konci spektra je Amos Bar-Joseph, generální ředitel čtyřčlenného startupu Swan AI. Na LinkedInu zveřejnil fakturu od Anthropic ve výši 113 421,87 dolarů za jediný měsíc a napsal, že na fakturu nikdy nebyl hrdší. Swan AI, společnost specializující se na autonomní prodejní agenty, vnímá své výdaje na umělou inteligenci jako strukturální náhradu nákladů na personál: méně zaměstnanců, více inteligence – to je slib. Generální ředitel to výslovně formuloval jako obchodní model: cílem je dosáhnout 10 milionů dolarů ročního výnosu na zaměstnance.

Skutečnost, že společnost Swan AI již hlásí sedmimístné opakující se tržby a že podle vlastních prohlášení nedávno získala za jediný týden ročný reálný výnos (ARR) ve výši přibližně 200 000 dolarů, zní přesvědčivě. Co však Bar-Joseph nezveřejnil, zůstává klíčové: marže. Pokud účet za umělou inteligenci ve výši 113 000 dolarů měsíčně odpovídá ročním nákladům přesahujícím 1,3 milionu dolarů, musí být generované tržby výrazně vyšší – a s dostatečnou marží k pokrytí infrastruktury, daní a dalších výdajů. Potvrzeno nezávislými zdroji: Společnost odmítla poskytnout konkrétní údaje o tržbách. To, co se prodává jako úspěšný příběh, by stejně snadno mohlo být neúplným účetnictvím.

Bar-Josephův příspěvek nicméně odhaluje posun v myšlení: V některých částech technologického průmyslu se výše účtu za umělou inteligenci stává symbolem statusu – podobně jako počet zaměstnanců nebo kancelářských prostor býval považován za ukazatel velikosti společnosti. Tato logika s sebou nese značná rizika, pokud nejsou výdaje a příjmy úzce propojeny.

Trh exploduje: výdaje na IT ve výši 6,31 bilionu dolarů slouží jako varovný signál

Individuální tlaky na náklady se odrážejí v makroekonomickém obrazu. Podle společnosti Gartner vzrostou globální výdaje na IT v roce 2026 na 6,31 bilionu dolarů, což představuje nárůst o 13,5 procenta oproti roku 2025. Nárůst je obzvláště prudký v sektoru datových center: Očekává se, že výdaje na serverové systémy vzrostou o 36,9 procenta a celkový objem datových center by měl poprvé překročit 650 miliard dolarů. Gartner zároveň očekává 80,8procentní růst výdajů na generativní modely umělé inteligence.

Tato čísla nepopisují organický investiční cyklus řízený očekáváními měřené přidané hodnoty. Popisují trh, který se stále pohybuje plnou rychlostí, zatímco brzdy – jinými slovy, povědomí o nákladech – se zapínají jen pomalu. Souběžně s údaji společnosti Gartner studie ukazuje, že globální výdaje na umělou inteligenci se v roce 2026 zvýší o 44 procent, zatímco rozpočty na školení a rozvoj zaměstnanců porostou pouze o 5 procent. Společnosti, které zvyšují své výdaje na technologie téměř desetkrát rychleji než posilování postavení lidí, kteří tyto technologie používají, riskují masivní nesprávnou alokaci zdrojů.

Společnost Forrester Research to vyjadřuje ještě přímočařeji: Méně než 15 procent osob s rozhodovací pravomocí v oblasti umělé inteligence vykázalo za posledních dvanáct měsíců měřitelné zlepšení EBITDA z investic do umělé inteligence. Méně než třetina dokáže spojit hodnotu svých výdajů na umělou inteligenci s konkrétními změnami ve výkazu zisku a ztráty. Důsledek: Forrester předpovídá, že společnosti odloží 25 procent svých plánovaných výdajů na umělou inteligenci z roku 2026 na rok 2027 – což je korekce trhu způsobená rostoucími obavami mezi finančními řediteli.

Tokenomika: Neviditelná nákladová past v každodenním podnikání

Abychom pochopili rozsah problému, stojí za to se blíže podívat na strukturu fakturačních modelů založených na tokenech. Pro firmy jsou obzvláště zákeřné ze dvou důvodů: Zaprvé, neškálují se lineárně s hodnotou, ale spíše s využitím. Každá špatně formulovaná výzva, každé zbytečně dlouhé kontextové okno, každá smyčka opakování v důsledku chyb s sebou nese náklady – bez ohledu na to, zda je výsledek použitelný, či nikoli. Zadruhé, je obtížné je integrovat s tradičními systémy FinOps, které měří podle virtuálních strojů, výpočetních instancí nebo uživatelských licencí, nikoli podle textových segmentů.

Konkrétní příklad z praxe: Azure OpenAI účtuje vstupní a výstupní tokeny odděleně, přičemž výstupní tokeny jsou obvykle třikrát až pětkrát dražší než vstupní tokeny. Zároveň systémové výzvy, které se spouštějí před každým uživatelským požadavkem, mohou spotřebovávat značné množství vstupních tokenů – aniž by to bylo pro uživatele ve frontendu viditelné. Každý, kdo provozuje tisíce agentů s dlouhými systémovými výzvami, za to bude průběžně platit, i když agenti aktuálně nedělají nic užitečného.

Struktura nákladů se s koncem éry paušálních sazeb stává náročnější. Společnost Anthropic již přešla na svůj podnikový fakturační model z paušálních poplatků na ceny plně založené na tokenech – očekává se, že do šesti měsíců budou následovat i ostatní poskytovatelé. To, co dříve sloužilo jako bezpečnostní rezerva – paušální poplatek, který zároveň absorboval nadměrné využití – je nyní minulostí. Správci rozpočtu, kteří stále počítali své náklady na umělou inteligenci podle starého modelu, čelí strukturálnímu přehodnocení celé své strategie v oblasti umělé inteligence.

Proč investoři požadují odpovědi: Krize správy a řízení

Ve veřejně obchodovaných společnostech se problém stupňuje na další úroveň: úroveň odpovědnosti vůči akcionářům. Představenstva a finanční ředitelé se ptají na měřitelnou přidanou hodnotu investic do umělé inteligence s frekvencí a vehementností, které by byly před dvěma lety nemyslitelné. Podle průzkumu finančních ředitelů společnosti Grant Thornton za první čtvrtletí roku 2026 očekává 68 procent finančních ředitelů další zvýšení svých výdajů na IT a digitální transformaci – což je nejvyšší číslo za 21 čtvrtletí průzkumu. Toto číslo zpočátku zní optimisticky, ale vyznívá jinak, když vezmeme v úvahu doprovodné sdělení: Finanční ředitelé se aktivně podílejí na rozhodnutích v oblasti umělé inteligence, která dříve spadala výhradně do odpovědnosti CIO nebo CTO.

Brad Owens z Asymblu popisuje zásadní posun v povědomí vrcholových manažerů: Klíčovou otázkou již nejsou pouze náklady na umělou inteligenci, ale spíše skutečná hodnota zaměstnance – ať už lidského nebo digitálního. I když definitivní odpověď zatím neexistuje, tato otázka se klade mnohem častěji. To signalizuje změnu paradigmatu: Umělá inteligence již není vnímána jako diskreční experiment, ale jako řízené obchodní aktivum – s odpovídajícími požadavky na měřitelnost a zdůvodnění.

Krize odpovědnosti je statisticky zřejmá: Podle Larridinovy studie State of Enterprise AI 2025 72 procent všech společností aktivně ničí hodnotu neefektivním využíváním umělé inteligence. Zní to drasticky, ale je to pravděpodobné, když vezmeme v úvahu, že mnoho společností měří zavádění nástrojů umělé inteligence, ale ne skutečnou změnu v produktivitě nebo generování obchodní hodnoty. Existuje významný rozdíl mezi pozorováním, že zaměstnanci používají nástroj umělé inteligence, a prokázáním, že tento nástroj vede k měřitelnému zlepšení hospodářského výsledku společnosti.

Ledovec skrytých nákladů: Co skrývají ceníky tokenů

Veřejná diskuse se primárně zaměřuje na náklady na API pro jazykové modely. To je jen špička ledovce. Mnohem větší podíl skutečných provozních nákladů umělé inteligence se skrývá pod povrchem – a v mnoha obchodních případech je jednoduše přehlížen.

Podle společnosti Gartner běží více než 75 procent všech podnikových úloh umělé inteligence v cloudu. To k nákladům modelu přidává náklady na infrastrukturu: výpočetní výkon, úložiště, síť, CDN a fronty zpráv. U systémů založených na agentech s 10 000 až 20 000 konverzacemi měsíčně se čisté náklady na infrastrukturu pohybují od 200 do 500 eur měsíčně – kromě nákladů na LLM API. U škálovaných nasazení se stovkami tisíc interakcí se tato čísla odpovídajícím způsobem násobí.

Mezi dodatečné náklady, které se v nabídkách dodavatelů objevují jen zřídka, patří: integrace a orchestrace podnikových systémů (10 000 až 60 000 eur), testování a validace (5 000 až 15 000 eur), infrastruktura pro nasazení (10 000 až 30 000 eur), průběžná údržba, přeškolení modelů a bezpečnostní záplaty (10 000 až 50 000 eur ročně a více). Společnost Technova Partners vypočítala, že z dlouhodobého hlediska tvoří implementační náklady pouze 25 až 35 procent celkových nákladů na vlastnictví – 65 až 75 procent vzniká během probíhajícího provozu. Každý, kdo si myslí, že největší výdaje jsou po počátečním nasazení za ním, systematicky podceňuje realitu.

Rozdíl je ještě výraznější, pokud jde o autonomní agenty s umělou inteligencí. Salesforce si za svůj produkt Agentforce účtuje dva dolary za konverzaci – což zpočátku zní rozumně. Skryté náklady na licence pro datový cloud, předpoklady pro CRM, integrační práce a průběžný dohled však skutečné výdaje značně převyšují. Společnost Gartner předpovídá, že do konce roku 2027 bude ukončeno více než 40 procent všech projektů s agenty s umělou inteligencí – analytická skupina uvádí jako hlavní důvody rostoucí náklady a nejasnou přidanou hodnotu.

Když se autonomie stane problémem s náklady: Cena agentů s umělou inteligencí

Obzvláště nákladní jsou plně autonomní agenti s umělou inteligencí, kteří se rozhodují a provádějí akce bez neustálého lidského dohledu. Na rozdíl od chatbotů, kteří spotřebovávají tokeny epizodicky, agenti s umělou inteligencí tak činí průběžně – během plánování, monitorování, opravy chyb a zpětné vazby. Analýza scénářů autonomního nasazení odhalila, že nekontrolovaní agenti mohou ročně vynaložit 120 000 až 270 000 dolarů na výpočetní náklady – kromě skrytých nákladů na infrastrukturu, které mohou být o 200 až 400 procent vyšší než nabídky dodavatelů.

Mylná představa, že tito agenti jsou skutečně autonomní, a proto nákladově efektivní, přetrvává. Ve skutečnosti i ty nejpokročilejší systémy vyžadují lidský dohled, pravidelné korekce a kontextové zásahy. Lidský prvek nezmizí – přesouvá se. Přímé provádění úkolů se stává dohledem, kalibrací a zajištěním kvality strojů. Tato práce je méně viditelná, ale o nic méně reálná. Každý, kdo považuje agenty za levnou náhradu lidských pracovníků bez zohlednění těchto nákladů na monitorování, se zabývá kreativním účetnictvím.

🤖🚀 Platforma spravované umělé inteligence: Rychlejší, bezpečnější a chytřejší řešení umělé inteligence s UNFRAME.AI

Platforma spravované umělé inteligence – obrázek: Xpert.Digital

Zde se dozvíte, jak může vaše společnost rychle, bezpečně a bez vysokých vstupních bariér implementovat řešení umělé inteligence na míru.

Spravovaná platforma umělé inteligence je vaším komplexním a bezstarostným řešením pro umělou inteligenci. Místo řešení složitých technologií, drahé infrastruktury a zdlouhavých vývojových procesů získáte hotové řešení šité na míru vašim potřebám od specializovaného partnera – často během několika dní.

Klíčové výhody na první pohled:

⚡ Rychlá implementace: Od nápadu k aplikaci připravené k použití během několika dnů, nikoli měsíců. Dodáváme praktická řešení, která vytvářejí okamžitou přidanou hodnotu.

🔒 Maximální zabezpečení dat: Vaše citlivá data zůstanou u vás. Garantujeme bezpečné a kompatibilní zpracování bez sdílení dat s třetími stranami.

💸 Žádné finanční riziko: Platíte pouze za výsledky. Vysoké počáteční investice do hardwaru, softwaru nebo personálu jsou zcela eliminovány.

🎯 Zaměřte se na své hlavní podnikání: Soustřeďte se na to, co děláte nejlépe. Postaráme se o kompletní technickou implementaci, provoz a údržbu vašeho řešení s umělou inteligencí.

📈 Připraveno na budoucnost a škálovatelné: Vaše umělá inteligence roste s vámi. Zajišťujeme neustálou optimalizaci a škálovatelnost a flexibilně přizpůsobujeme modely novým požadavkům.

Více informací zde:

Spravovaná platforma umělé inteligence

Systematické snižování nákladů: Techniky, které snižují náklady na tokeny až o 40 %

Řízená umělá inteligence: Koncept navržený pro kontrolu nákladů

V tomto kontextu nabývá koncept řízené umělé inteligence strategického významu. To se nevztahuje na jednu technologii, ale na komplexní model řízení celého dodavatelského řetězce umělé inteligence společnosti – od výběru modelu a rychlého inženýrství až po průběžné sledování nákladů a hodnocení výsledků. Služby řízené umělé inteligence poskytují externí dodavatelé, kteří se plně starají o nasazení, monitorování a údržbu řešení umělé inteligence a přispívají odbornými znalostmi v oblasti nákladové efektivity, zabezpečení a dodržování předpisů.

Společnost KPMG odhaduje, že moderní spravované služby mohou snížit celkové provozní náklady o 15 až 45 procent – prostřednictvím optimalizace procesů, snížení technického dluhu a efektivnějšího provozu umělé inteligence a cloudu. Slib zní lákavě, ale přidaná hodnota se nedostaví automaticky. Vyžaduje jasnou strukturu řízení, definované odpovědnosti a kulturu transparentnosti nákladů, která sahá až na úroveň tokenů.

Rámec FinOps, původně vyvinutý pro náklady na cloud, se stále častěji uplatňuje i v oblasti umělé inteligence. Nadace FinOps popisuje klíčové prvky robustního řízení nákladů na umělou inteligenci jako: jasné vlastnické struktury pro výdaje na umělou inteligenci, podrobné sledování až na úroveň tokenů nebo GPU, implementaci modelů postupného financování s pravidelnými kontrolami „rychlého selhání“ a zřízení celopodnikové investiční rady pro umělou inteligenci. Tato opatření nejsou technické, ale organizační povahy – což vysvětluje, proč mnoho společností selhává, i když mají nástroje: Chybí jim procesy a kultura, nikoli nástroje.

Technické páky: Jak systematicky optimalizovat spotřebu tokenů

Na technické úrovni existuje zavedená sada nástrojů pro optimalizaci nákladů na tokeny, která zatím není v mnoha společnostech konzistentně používána.

Prvním a nejúčinnějším nástrojem je prompts engineering. Zbytečně dlouhé systémové prompts, nadbytečné kontextové informace nebo redundantní instrukce spotřebovávají vstupní tokeny, aniž by zlepšily výstup. Profesionální prompts engineering může snížit spotřebu tokenů o 20 až 40 procent a zároveň zachovat kvalitu výstupu. V kombinaci s prompts caching – mechanismem, který opakovaně používá často používané komponenty prompts – lze dosáhnout značných úspor.

Druhým kladným faktorem je směrování modelů: uvědomění si, že ne každý úkol vyžaduje nejvýkonnější a nejdražší model. Jednoduché klasifikace, formátovací úlohy nebo sumarizace lze stejně dobře řešit s ekonomickými modely, které stojí 0,15 až 1,00 dolaru za milion vstupních tokenů, jako s prémiovými modely, které stojí sedmkrát až třicetinásobek této částky. Inteligentní systém směrování, který automaticky přiřazuje požadavky k cenově nejvýhodnějšímu modelu, může drasticky snížit průměrné náklady na požadavek.

Třetí páka: správa kontextových oken. Mnoho architektur agentů předává s každým požadavkem kompletní historii konverzace – i když jen zlomek z ní je relevantní pro aktuální úkol. Techniky, jako je včasné zastavení, okamžité zkrácení a selektivní vzorkování kontextu, snižují počet výstupních tokenů bez obětování kvality. Deloitte Insights zdůrazňuje, že model továrny umělé inteligence v místním prostředí může přinést více než 50procentní úsporu nákladů během tří let ve srovnání s řešeními založenými na API – jakmile je dosaženo kritického objemu produkce tokenů.

Čtvrtá páka: Řízení prostřednictvím rozpočtových stráží a detekce anomálií. Automatizované systémy, které spouštějí upozornění, pozastavují úlohy nebo přesměrovávají na nákladově efektivnější modely při dosažení definovaných prahových hodnot, jsou nejúčinnější ochranou proti překročení rozpočtu typu Uber. Tyto systémy existují – jen se příliš zřídka implementují předtím, než dorazí první šokující účet.

FinOps pro AI: Správa a řízení jako strategická konkurenční výhoda

Za technickými nástroji se skrývá hlubší posun v řízení společnosti: výdaje na umělou inteligenci musí být řízeny jako plnohodnotné nákladové středisko – se všemi nástroji, které firmy používají pro personální řízení, nákup nebo kapitálové investice. Zní to zřejmě, ale není. Mnoho firem dosud zahrnovalo výdaje na umělou inteligenci do vágních rozpočtů na inovace, které nepodléhaly důslednému sledování návratnosti investic.

Tredence popisuje úroveň vyspělosti struktury správy a řízení umělé inteligence (AI) pomocí specifických klíčových ukazatelů výkonnosti (KPI): rozhodovací tření (snížení rozpočtových úniků a výdajů na mimořádné události), investiční zaměření (podíl rozpočtu na AI pro škálované nasazení ve srovnání s čistě experimentálními výdaji) a důvěra v správu a řízení (jasná vlastnická struktura pro každou iniciativu v oblasti AI). Společnosti, které tyto metriky měří, mohou prostřednictvím přímého srovnání jasněji komunikovat, zda jsou jejich výdaje na AI strategicky opodstatněné – a tím získat rychlejší schválení rozpočtu od finančních manažerů.

Ve studii založené na rozhovorech s přibližně 40 společnostmi analyzovala banka Goldman Sachs strukturální posun v cenách umělé inteligence: poskytovatelé přecházejí od fakturace založené na uživatelích k fakturaci založené na výkonu – již neprodávají uživatelský přístup, ale spíše jednotky práce. To vytváří nové příležitosti pro společnosti, jak přímo propojit výdaje na umělou inteligenci s obchodními výsledky – ale také to činí výpočet složitějším. Ti, kteří nakupují umělou inteligenci jako „jednotku práce“, potřebují znát hodnotu jednotky práce. Většina společností tyto znalosti zatím nemá.

Nová aritmetika práce: Člověk versus stroj – ale jinak, než se očekávalo

Oblíbené srovnání mezi náklady na umělou inteligenci a personálními náklady je často zjednodušené: nahrazení člověka umělou inteligencí ušetří 90 procent. Tento výpočet platí za velmi specifických podmínek – a za jiných selhává. U opakujících se, jasně definovaných úkolů, jako je zadávání dat, standardní zákaznický servis nebo jednoduché generování kódu, praxe ukazuje, že systémy umělé inteligence ve skutečnosti stojí 3 000 až 25 000 dolarů ročně, zatímco plně započítáné náklady na pozici na plný úvazek (včetně benefitů, kancelářských prostor a fluktuace zaměstnanců) se pohybují od 75 000 do 95 000 dolarů. Během pěti let činí celková investice do pozice na plný úvazek 375 000 až 475 000 dolarů, ve srovnání s 15 000 až 100 000 dolary u ekvivalentního systému umělé inteligence.

Tato výhoda se však snižuje s tím, jak se úkoly stávají složitějšími, kontextově citlivějšími nebo kreativnějšími. Systémy umělé inteligence, které se spoléhají na drahé prémiové modely pro vysokou kvalitu výstupu a zároveň vyžadují intenzivní lidský dohled, se mohou rychle stát dražšími než lidé, které mají nahradit. Fenomén popsaný manažerem společnosti Nvidia Catanzarem vzniká právě tehdy, když umělá inteligence podporuje úkoly s vysokou dimenzí – výzkum hlubokého učení, rozhodnutí o architektonickém návrhu, strategické uvažování – ale vyžadují tolik výpočetního výkonu, že náklady převyšují náklady na personál.

Klíčovou proměnnou je struktura úkolu: čím standardizovanější a objemnější je úkol, tím jasnější je nákladová výhoda umělé inteligence. Čím kreativnější, strategičtější a kontextově náročnější je úkol, tím rozptýlenější je výpočet. Společnosti, které zahrnují umělou inteligenci plošně jako náhradu personálu, aniž by rozlišovaly podle typu úkolu, padají do klasické nákladové pasti.

Cenový paradox: Levnější tokeny, ale vyšší celkové náklady

Jednou z nejpřekvapivějších dynamik problému s náklady na umělou inteligenci je cenový paradox, který společnost Deloitte ve své analýze popsala jako „Klesající ceny, rostoucí spotřeba“. Jednotková cena tokenů skutečně klesá: poskytovatelé modelů, jako jsou OpenAI a Anthropic, v posledních dvou letech opakovaně snižovali ceny tokenů, v některých případech o 80 až 90 procent ve srovnání s jejich spouštěcími cenami. Zároveň celkové výdaje na umělou inteligenci prudce rostou.

Důvod spočívá ve vzorci spotřeby: S klesajícími cenami se intenzita užívání neúměrně zvyšuje. Vznikají nové případy užití, které by za vyšších cen nebyly ekonomicky životaschopné. Počet agentů, uživatelů, volání modelů a délky kontextů roste rychleji než klesají ceny. Toto je klasický odrazový efekt z energetické ekonomie: Levnější energie nevede k menší spotřebě, ale k větší. Absolutní nákladová základna roste, i když se mezní jednotka zlevní.

Pro finanční ředitele to znamená, že cenová vyjednávání s poskytovateli umělé inteligence problém strukturálně neřeší. 20% snížení ceny tokenu je více než kompenzováno 25% nárůstem jeho využívání. Strukturálního snížení nákladů je možné dosáhnout pouze prostřednictvím správy a řízení, nikoli lepšími nákupními cenami.

Strategický výhled: Co dobře řízené společnosti nyní dělají jinak

Společnosti, které berou náklady na umělou inteligenci vážně, budou v roce 2026 dělat několik věcí jinak než průměrně. Zaprvé nebudou s výdaji na umělou inteligenci zacházet jako s položkou nákladů na IT, ale jako se strategickou investicí s definovanými očekáváními návratnosti investic. Každá iniciativa v oblasti umělé inteligence bude mít sponzora v podniku, nikoli v IT oddělení, a definovaný obchodní případ s měřitelnými kritérii úspěchu.

Za druhé, implementovali viditelnost tokenů: dashboardy v reálném čase, které rozdělují výdaje na úrovni týmu, aplikace a případu užití. Platformy FinOps, jako je Finout, umožňují virtuální označování na úrovni tokenů bez nutnosti změn kódu – což umožňuje modely chargeback, kde obchodní jednotky přímo odpovídají za své výdaje na umělou inteligenci. Tato interní transparentnost je často účinnější než externí cenová vyjednávání.

Za třetí, přední společnosti zavádějí portfoliový model pro modely: Nepoužívají jeden vlajkový model pro všechny úkoly, ale spíše kombinaci ekonomických modelů pro standardní úkoly, prémiových modelů pro komplexní požadavky a specializovaných open-source modelů pro případy použití citlivé na data. Deloitte doporučuje používat open-source modely tam, kde lze požadavky na kvalitu splnit menšími, jemně vyladěnými modely – což vede k významným úsporám nákladů a menší závislosti na komerčních dodavatelích.

Za čtvrté, tyto společnosti zavedly modely postupného financování: Namísto ex ante přidělování ročních rozpočtů na umělou inteligenci je financování poskytováno čtvrtletně s povinnými kontrolními intervaly, které umožňují pokračování v nasazení pouze v případě, že jsou prokázány měřitelné přínosy. Nadace FinOps tento princip nazývá „financování rychlého selhání“ – motivuje k předčasnému ukončení špatně fungujících projektů umělé inteligence, spíše než k vyhazování dobrých peněz za špatné.

Trh hledá svou rovnováhu

Celkový obraz ukazuje, že odvětví je stále v procesu určování skutečné hodnoty umělé inteligence v průmyslovém měřítku. Technické možnosti modelů jsou působivé a rychle rostou. Ekonomická kontrolovatelnost výsledných nákladů zaostává – ne proto, že by chyběly nástroje, ale proto, že organizační zralost pro důsledné zavádění těchto nástrojů je stále nedostatečná.

Společnosti, které škálují výdaje na umělou inteligenci bez ohledu na správu a řízení, riskují, že se z vnímané konkurenční výhody stane problém s tichou marží. Naopak ty, které od samého začátku investují do správy tokenů, směrování modelů, procesů FinOps a jasného měření návratnosti investic, vytvářejí infrastrukturu, která zůstává nákladově efektivní i při rostoucím využívání umělé inteligence.

Rozvahy umělé inteligence se v nadcházejících čtvrtletích stanou ústředním tématem zasedání představenstev. Ne proto, že by umělá inteligence selhávala, ale proto, že se stala příliš úspěšnou – a její náklady ztěžují její kontrolu. Společnost Forrester odhaduje, že trh do konce roku 2026 zažije skutečnou korekci: Neocloudy – specializovaní poskytovatelé zaměření na GPU – budou stále více přebírat podíl na trhu od velkých hyperškálovacích společností a nabízet dostupnější infrastrukturu pro úlohy s umělou inteligencí. To zintenzivní cenovou konkurenci a dá společnostem novou výhodu.

Klíčovou dovedností pro příští dva až tři roky nebude používání umělé inteligence. Prakticky každá společnost to již dělá. Klíčovou dovedností bude používání umělé inteligence takovým způsobem, aby poměr nákladů a přínosů zůstal trvale pozitivní. Řízená umělá inteligence – ve všech svých podobách – není něco příjemného, ale strukturální odpovědí na strukturální výzvu.

Poradenství - Plánování - Implementace