Tokenomics | Wanneer AI duurder wordt dan personeel: De stille kostenexplosie van AI en wat Managed AI eraan kan doen

Available in 27 languages 📢

Gepubliceerd op: 28 april 2026 / Bijgewerkt op: 28 april 2026 – Auteur: Konrad Wolfenstein

Tokenomics | Wanneer AI duurder wordt dan personeel: De stille kostenexplosie van AI en wat Managed AI eraan kan doen – Afbeelding: Xpert.Digital

Exploderende tokenbiljetten: Hoe 'Managed AI' uw IT-budget redt van de ondergang

### Uber's AI-budget overschreden: Waarom tokenkosten nu de salarissen overstijgen ### Verborgen kosten voor AI-agenten: Waarom cloudrekeningen plotseling exploderen ### $113.000 voor één maand AI: Waarschuwingssignaal of de toekomst van werk? ###

De onzichtbare kostenval in bedrijven: hoe facturering op basis van tokens bedrijfsbudgetten overhoop gooit

Kunstmatige intelligentie werd lange tijd beschouwd als de ultieme productiviteitsbooster, maar nu zorgt het voor de nodige paniek in directiekamers. De reden: explosief stijgende, onvoorspelbare kosten voor cloudcomputing en tokens. Wanneer bedrijven zoals Uber hun jaarlijkse AI-budget na slechts een paar maanden al hebben opgebruikt en techreuzen ontdekken dat rekenkracht in sommige gebieden duurder wordt dan hun eigen personeel, is een kritiek kantelpunt bereikt. De aanvankelijke euforie maakt plaats voor een harde realiteit waarin verborgen kosten voor autonome AI-agenten en op gebruik gebaseerde factureringsmodellen de winstgevendheid bedreigen. Maar er zijn oplossingen: om te voorkomen dat je in de valkuil van tokenkosten trapt, komt een nieuw strategisch concept in beeld: Managed AI. Ontdek waarom de kostenberekeningen van veel bedrijven momenteel niet meer kloppen en welke specifieke FinOps-strategieën je kunt gebruiken om je AI-uitgaven weer onder controle te krijgen voordat het budget is overschreden.

Het einde van het tijdperk van de vaste tarieven: hoe bedrijven de kostenval van AI kunnen vermijden

De techindustrie beleeft momenteel een langverwachte ontgoocheling: kunstmatige intelligentie is in veel bedrijven niet langer alleen een productiviteitsverhoger, maar is een onafhankelijke, moeilijk te berekenen kostenfactor geworden – een factor die in extreme gevallen de personeelskosten overstijgt. Wat twee jaar geleden nog een gewaagde voorspelling leek, is nu in 2026 de harde realiteit. De vraag is niet langer of AI toegevoegde waarde creëert, maar of deze toegevoegde waarde de explosief stijgende operationele kosten rechtvaardigt. En aan de horizon doemt een concept op dat antwoorden belooft te bieden: Managed AI.

Het fundament wankelt: Waarom de kostenberekening niet langer klopt

Twee jaar lang stelden technologiebedrijven hun AI-budgetten nauwelijks ter discussie. De logica was bedrieglijk eenvoudig: wie vroeg investeert, verzekert zich van een concurrentievoordeel; wie aarzelt, raakt achterop. In deze sfeer van optimisme stroomden miljarden naar taalmodellen, programmeerassistenten en autonome agenten – vaak zonder strenge prestatiemetingen en zonder kostenlimieten. Nu moeten ze de rekening betalen, en de cijfers zijn moeilijk te negeren.

Het probleem wordt vooral duidelijk wanneer AI niet alleen als hulpmiddel wordt gebruikt, maar als de primaire arbeidskracht. Bryan Catanzaro, Vice President of Applied Deep Learning bij Nvidia, vatte het in één zin samen voor Axios: de computerkosten in zijn team overstijgen de personeelskosten ruimschoots. Dit is een uitspraak met aanzienlijk gewicht – niet alleen omdat deze afkomstig is van een bedrijf dat zelf centraal staat in de AI-infrastructuurgolf, maar ook omdat het een systemische verschuiving beschrijft die tot nu toe nauwelijks in managementrapporten is terug te vinden.

De reden hiervoor ligt in de structuur van moderne AI-factureringsmodellen. Grote taalmodellen zoals GPT, Claude of Gemini rekenen geen vast bedrag, maar een bedrag gebaseerd op tokens – de kleinste eenheden waarin tekst tijdens de verwerking wordt opgedeeld. Premiummodellen kosten tussen de $ 2,50 en $ 5,00 per miljoen inputtokens en tussen de $ 10 en $ 25 per miljoen outputtokens. Dit klinkt abstract, maar wordt al snel concreet: iedereen die dagelijks duizenden query's verstuurt via een AI-systeem in een productieomgeving, agents met lange contextvensters gebruikt of geautomatiseerde codebeoordelingen uitvoert, verzamelt enorme bedragen – vaak zonder het te beseffen totdat de maandelijkse rekening binnenkomt.

Het Uber-moment: een wake-up call voor de hele branche

Geen enkel recent voorbeeld illustreert het probleem zo treffend als dat van Uber. Praveen Neppalli Naga, de Chief Technology Officer van het taxibedrijf, gaf tegenover The Information toe dat het bedrijf zijn volledige AI-budget voor 2026 al na een paar maanden had opgebruikt – voornamelijk door de snelle implementatie van Anthropic's Claude Code. Naga zei het ronduit: "Ik moet helemaal opnieuw beginnen, want het budget dat ik dacht nodig te hebben, is al overschreden." De aanleiding was niet één groot project, maar de geleidelijke verspreiding van een tool binnen de gehele engineeringafdeling. Uber had zo'n 5.000 ontwikkelaars toegang gegeven tot Claude Code – en de impact op het budget was navenant aanzienlijk.

Wat Naga ook onthulde is opmerkelijk: 11 procent van alle live-updates aan de code-repository van Uber wordt nu geschreven door AI-agenten, niet door mensen. Het bedrijf bevindt zich dus midden in een echte transformatie van softwareontwikkeling – en betaalt daarvoor een prijs die alle aanvankelijke berekeningen overtreft. De paradox is duidelijk: hoe nuttiger de AI is, hoe meer deze wordt gebruikt, en hoe hoger de kosten. Het op gebruik gebaseerde prijsmodel vertaalt succes direct in kostenstijging.

Jason Calacanis, een bekende investeerder uit Silicon Valley, beschreef een vergelijkbare ervaring: agentkosten van $300 per dag voor de Claude API van Anthropic – voor een fractie van het werk van één enkele werknemer. Zijn conclusie: op welk punt overschrijden de kosten van tokens het salaris van de persoon die ze moeten vervangen? Deze vraag – retorisch, maar wiskundig gezien reëel – is de centrale vraag geworden in de AI-economie van 2026.

Trots op een rekening van zes cijfers: het Swan AI-fenomeen

Aan de andere kant van het spectrum staat Amos Bar-Joseph, CEO van de vierkoppige startup Swan AI. Hij plaatste een factuur van Anthropic van $113.421,87 voor één maand op LinkedIn en schreef dat hij nog nooit zo trots was geweest op een factuur. Swan AI, een bedrijf dat gespecialiseerd is in autonome verkoopagenten, ziet de investeringen in AI als een structurele vervanging voor personeelskosten: minder werknemers, meer intelligentie – dat is de belofte. De CEO omschreef dit expliciet als een businessmodel: het doel is om een jaarlijkse terugkerende omzet van $10 miljoen per werknemer te realiseren.

Het feit dat Swan AI al terugkerende inkomsten van zeven cijfers rapporteert en, volgens eigen verklaringen, onlangs in één week zo'n $200.000 aan jaarlijkse terugkerende inkomsten (ARR) heeft gegenereerd, klinkt overtuigend. Wat Bar-Joseph echter niet heeft onthuld, blijft cruciaal: de winstmarge. Als een AI-factuur van $113.000 per maand neerkomt op jaarlijkse kosten van meer dan $1,3 miljoen, moeten de gegenereerde inkomsten aanzienlijk hoger liggen – en met een voldoende grote marge om de infrastructuur, belastingen en andere kosten te dekken. Onafhankelijke bronnen bevestigen dat het bedrijf weigerde specifieke omzetcijfers te verstrekken. Wat als een succesverhaal wordt gepresenteerd, zou net zo goed een onvolledige boekhouding kunnen zijn.

Wat Bar-Josephs bericht echter wel onthult, is een mentaliteitsverandering: in bepaalde delen van de techindustrie wordt de hoogte van de AI-rekening een statussymbool – net zoals het aantal werknemers of de kantoorruimte vroeger als maatstaf voor de bedrijfsgrootte werd beschouwd. Deze logica brengt aanzienlijke risico's met zich mee als uitgaven en inkomsten niet nauw met elkaar verbonden zijn.

De markt explodeert: de IT-uitgaven van $6,31 biljoen dienen als waarschuwingssignaal

De individuele kostenstijgingen weerspiegelen zich in het macrobeeld. Volgens Gartner zullen de wereldwijde IT-uitgaven in 2026 stijgen tot 6,31 biljoen dollar – een groei van 13,5 procent ten opzichte van 2025. De stijging is met name sterk in de datacentersector: de uitgaven aan serversystemen zullen naar verwachting met 36,9 procent toenemen en het totale datacentervolume zal naar verwachting voor het eerst de 650 miljard dollar overschrijden. Tegelijkertijd verwacht Gartner een groei van 80,8 procent in de uitgaven aan generatieve AI-modellen.

Deze cijfers beschrijven geen organische investeringscyclus die wordt gedreven door gemeten verwachtingen ten aanzien van toegevoegde waarde. Ze beschrijven een markt die nog steeds op volle snelheid draait, terwijl de remmen – met andere woorden, het kostenbewustzijn – pas langzaam in werking treden. Parallel aan de cijfers van Gartner laat een studie zien dat de wereldwijde uitgaven aan AI in 2026 met 44 procent zullen stijgen, terwijl de budgetten voor training en ontwikkeling van werknemers slechts met 5 procent zullen toenemen. Bedrijven die hun technologie-uitgaven bijna tien keer sneller verhogen dan de mogelijkheden voor de mensen die die technologie gebruiken om zich verder te ontwikkelen, lopen het risico op een enorme verkeerde allocatie van middelen.

Forrester Research verwoordt het nog botter: minder dan 15 procent van de besluitvormers op het gebied van AI meldde een meetbare verbetering van de EBITDA als gevolg van AI-investeringen in de afgelopen twaalf maanden. Minder dan een derde kan de waarde van hun AI-uitgaven zelfs maar koppelen aan concrete veranderingen in de winst- en verliesrekening. Het gevolg: Forrester voorspelt dat bedrijven 25 procent van hun geplande AI-uitgaven zullen uitstellen van 2026 naar 2027 – een marktcorrectie die wordt veroorzaakt door een groeiende onrust onder CFO's.

Tokenomics: De onzichtbare kostenval in het dagelijks bedrijfsleven

Om de omvang van het probleem te begrijpen, is het de moeite waard om de structuur van op tokens gebaseerde factureringsmodellen eens nader te bekijken. Ze zijn om twee redenen bijzonder verraderlijk voor bedrijven: Ten eerste schalen ze niet lineair met de waarde, maar met het gebruik. Elke slecht geformuleerde prompt, elk onnodig lang contextvenster, elke herhalingslus als gevolg van fouten brengt kosten met zich mee – ongeacht of het resultaat bruikbaar is of niet. Ten tweede zijn ze moeilijk te integreren met traditionele FinOps-systemen, die meten op basis van virtuele machines, rekeninstanties of gebruikerslicenties, niet op basis van tekstsegmenten.

Een concreet praktijkvoorbeeld: Azure OpenAI brengt invoer- en uitvoertokens apart in rekening, waarbij uitvoertokens doorgaans drie tot vijf keer duurder zijn dan invoertokens. Tegelijkertijd kunnen systeemprompts, die vóór elk gebruikersverzoek worden uitgevoerd, aanzienlijke hoeveelheden invoertokens verbruiken – zonder dat gebruikers dit in de frontend kunnen zien. Iedereen die duizenden agents met lange systeemprompts beheert, betaalt hier continu voor, zelfs wanneer de agents op dat moment niets nuttigs doen.

De kostenstructuur wordt complexer nu het tijdperk van de vaste tarieven ten einde is. Anthropic heeft zijn factureringsmodel voor bedrijven al omgezet van vaste tarieven naar een volledig op tokens gebaseerd prijsmodel – naar verwachting zullen andere aanbieders binnen zes maanden volgen. Wat voorheen als vangnet diende – een vast tarief dat ook overmatig gebruik opving – is nu verleden tijd. Budgetbeheerders die hun AI-kosten nog steeds volgens het oude model berekenden, staan voor een structurele herziening van hun gehele AI-strategie.

Waarom investeerders antwoorden eisen: De bestuurscrisis

Bij beursgenoteerde bedrijven escaleert het probleem naar een ander niveau: dat van verantwoording aan aandeelhouders. Raden van bestuur en chief financial officers vragen met een frequentie en felheid naar de meetbare toegevoegde waarde van AI-investeringen die twee jaar geleden ondenkbaar waren. Volgens het CFO-onderzoek van Grant Thornton voor het eerste kwartaal van 2026 verwacht 68 procent van de CFO's hun uitgaven aan IT en digitale transformatie verder te verhogen – het hoogste percentage in de 21 kwartalen dat het onderzoek is uitgevoerd. Dit cijfer klinkt in eerste instantie optimistisch, maar het krijgt een andere betekenis wanneer men de bijbehorende boodschap in ogenschouw neemt: CFO's worden actief betrokken bij AI-beslissingen die voorheen uitsluitend de verantwoordelijkheid waren van CIO's of CTO's.

Brad Owens van Asymbl beschrijft een ingrijpende verandering in het bewustzijn van topmanagers: de kernvraag is niet langer alleen de kosten van AI, maar de werkelijke waarde van een medewerker – of die nu menselijk of digitaal is. Hoewel er nog geen definitief antwoord is, wordt de vraag veel vaker gesteld. Dit duidt op een paradigmaverschuiving: AI wordt niet langer gezien als een experiment naar keuze, maar als een beheersbaar bedrijfsmiddel – met bijbehorende eisen voor meetbaarheid en rechtvaardiging.

De verantwoordingscrisis is statistisch aantoonbaar: volgens Larridin's State of Enterprise AI 2025 vernietigt 72 procent van alle bedrijven actief waarde door inefficiënt gebruik van AI. Dit klinkt drastisch, maar het is aannemelijk als je bedenkt dat veel bedrijven de adoptie van AI-tools meten, maar niet de daadwerkelijke verandering in productiviteit of waardecreatie. Er is een significant verschil tussen vaststellen dat werknemers een AI-tool gebruiken en aantonen dat deze tool leidt tot een meetbare verbetering van de bedrijfsresultaten.

De ijsberg van verborgen kosten: wat prijslijsten voor tokens verbergen

Het publieke debat richt zich voornamelijk op de API-kosten voor taalmodellen. Dit is echter slechts het topje van de ijsberg. Het veel grotere deel van de werkelijke operationele kosten van AI ligt onder de oppervlakte – en wordt in veel zakelijke analyses simpelweg over het hoofd gezien.

Volgens Gartner draait meer dan 75 procent van alle AI-workloads binnen bedrijven in de cloud. Dit brengt infrastructuurkosten met zich mee bovenop de modelkosten: rekenkracht, opslag, netwerken, CDN en berichtenwachtrijen. Voor agentgebaseerde systemen met 10.000 tot 20.000 gesprekken per maand variëren de pure infrastructuurkosten van € 200 tot € 500 per maand – bovenop de kosten voor de LLM API. Voor grootschalige implementaties met honderdduizenden interacties lopen deze bedragen navenant op.

Extra kosten die zelden in offertes van leveranciers voorkomen, zijn onder andere: integratie en orkestratie van bedrijfssystemen (10.000 tot 60.000 euro), testen en validatie (5.000 tot 15.000 euro), implementatie-infrastructuur (10.000 tot 30.000 euro), doorlopend onderhoud, hertraining van modellen en beveiligingspatches (10.000 tot 50.000 euro per jaar en meer). Technova Partners heeft berekend dat implementatiekosten op de lange termijn slechts 25 tot 35 procent van de totale eigendomskosten uitmaken – 65 tot 75 procent ontstaat tijdens de operationele fase. Iedereen die denkt dat de grootste uitgaven na de initiële implementatie achter de rug zijn, onderschat de werkelijkheid stelselmatig.

Het verschil is nog groter als het gaat om autonome AI-agenten. Salesforce rekent twee dollar per gesprek voor zijn Agentforce-product – wat in eerste instantie redelijk klinkt. Maar de verborgen kosten voor datacloudlicenties, CRM-vereisten, integratiewerk en doorlopend toezicht drijven de werkelijke kosten veel hoger op. Gartner voorspelt dat meer dan 40 procent van alle AI-agentprojecten tegen eind 2027 zal worden stopgezet – de analistengroep noemt stijgende kosten en onduidelijke toegevoegde waarde als belangrijkste redenen.

Wanneer autonomie een kostenprobleem wordt: de prijs van AI-agenten

Bijzonder kostbaar zijn volledig autonome AI-agenten die beslissingen nemen en acties uitvoeren zonder constant menselijk toezicht. In tegenstelling tot chatbots, die tokens episodisch verbruiken, doen AI-agenten dit continu – tijdens planning, monitoring, foutcorrectie en feedback. Een analyse van scenario's voor de implementatie van autonome systemen toonde aan dat ongecontroleerde agenten jaarlijks tussen de $120.000 en $270.000 aan rekenkosten kunnen veroorzaken – bovenop verborgen infrastructuurkosten die 200 tot 400 procent hoger kunnen liggen dan de aanbiedingen van leveranciers.

De misvatting dat deze agenten werkelijk autonoom en daarom kosteneffectief zijn, blijft bestaan. In werkelijkheid vereisen zelfs de meest geavanceerde systemen menselijk toezicht, regelmatige correcties en contextuele interventie. Het menselijke element verdwijnt niet, het verschuift. De directe uitvoering van taken wordt het toezicht, de kalibratie en de kwaliteitscontrole van machines. Dit werk is minder zichtbaar, maar niet minder reëel. Iedereen die agenten beschouwt als een goedkope vervanging voor menselijke werknemers zonder rekening te houden met deze monitoringkosten, maakt zich schuldig aan creatieve boekhouding.

🤖🚀 Beheerd AI-platform: Sneller, veiliger en slimmer naar AI-oplossingen met UNFRAME

Beheerd AI-platform - Afbeelding: Xpert.Digital

Hier leert u hoe uw bedrijf snel, veilig en zonder hoge drempels AI-oplossingen op maat kan implementeren.

Een beheerd AI-platform is uw allesomvattende, zorgeloze oplossing voor kunstmatige intelligentie. In plaats van te worstelen met complexe technologie, dure infrastructuur en langdurige ontwikkelprocessen, ontvangt u een kant-en-klare oplossing op maat van een gespecialiseerde partner – vaak al binnen enkele dagen.

De belangrijkste voordelen in één oogopslag:

⚡ Snelle implementatie: Van idee tot gebruiksklare applicatie in dagen, niet maanden. Wij leveren praktische oplossingen die direct toegevoegde waarde creëren.

🔒 Maximale gegevensbeveiliging: Uw gevoelige gegevens blijven bij u. Wij garanderen een veilige en conforme verwerking zonder gegevens met derden te delen.

💸 Geen financieel risico: u betaalt alleen voor de resultaten. Hoge investeringen vooraf in hardware, software of personeel zijn volledig uitgesloten.

🎯 Focus op uw kernactiviteiten: concentreer u op waar u het beste in bent. Wij zorgen voor de volledige technische implementatie, werking en het onderhoud van uw AI-oplossing.

📈 Toekomstbestendig en schaalbaar: Uw AI groeit met u mee. Wij garanderen continue optimalisatie en schaalbaarheid en passen de modellen flexibel aan nieuwe eisen aan.

Meer informatie vindt u hier:

Beheerd AI-platform

Systematische kostenreductie: Technieken die de tokenkosten met wel 40% verlagen

Managed AI: Het concept dat is ontworpen om de kosten onder controle te houden

Tegen deze achtergrond wint het concept van Managed AI aan strategische relevantie. Dit verwijst niet naar één enkele technologie, maar naar een alomvattend governance-model voor de gehele AI-toeleveringsketen van een bedrijf – van modelselectie en snelle ontwikkeling tot continue kostenbewaking en resultaatsevaluatie. Managed AI-diensten worden geleverd door externe leveranciers die de implementatie, monitoring en het onderhoud van AI-oplossingen volledig verzorgen en expertise inbrengen op het gebied van kostenefficiëntie, beveiliging en compliance.

KPMG schat dat moderne managed services de totale operationele kosten met 15 tot 45 procent kunnen verlagen – door procesoptimalisatie, vermindering van technische schulden en efficiëntere AI- en cloudactiviteiten. De belofte klinkt aantrekkelijk, maar de toegevoegde waarde ontstaat niet vanzelf. Het vereist een duidelijke governance-structuur, gedefinieerde verantwoordelijkheden en een cultuur van kostentransparantie die tot op het niveau van de tokens reikt.

Het FinOps-framework, oorspronkelijk ontwikkeld voor cloudkosten, wordt steeds vaker toegepast op AI. De FinOps Foundation beschrijft de kernelementen van robuust AI-kostenbeheer als volgt: duidelijke eigendomsstructuren voor AI-uitgaven, gedetailleerde tracering tot op token- of GPU-niveau, implementatie van incrementele financieringsmodellen met regelmatige evaluaties op basis van mislukkingen, en de oprichting van een bedrijfsbrede AI-investeringsraad. Deze maatregelen zijn niet technisch, maar organisatorisch van aard – wat verklaart waarom veel bedrijven falen ondanks dat ze over de juiste tools beschikken: ze missen processen en cultuur, niet de instrumenten.

Technische hulpmiddelen: Hoe optimaliseer je systematisch het tokenverbruik?

Op technisch niveau bestaat er een gevestigde toolkit voor het optimaliseren van tokenkosten, die echter nog niet consistent wordt gebruikt door veel bedrijven.

De eerste en meest effectieve maatregel is prompt engineering. Onnodig lange systeemprompts, overbodige contextuele informatie of redundante instructies verbruiken invoertokens zonder de uitvoer te verbeteren. Professionele prompt engineering kan het tokenverbruik met 20 tot 40 procent verminderen, terwijl de uitvoerkwaliteit behouden blijft. In combinatie met prompt caching – een mechanisme dat veelgebruikte promptcomponenten hergebruikt – kunnen aanzienlijke besparingen worden gerealiseerd.

De tweede troef is modelroutering: het besef dat niet elke taak het krachtigste en duurste model vereist. Eenvoudige classificaties, opmaaktaken of samenvattingen kunnen net zo goed worden opgelost met budgetmodellen die $0,15 tot $1,00 per miljoen invoertokens kosten als met premiummodellen die zeven tot dertig keer zoveel kosten. Een intelligent routeringssysteem dat verzoeken automatisch toewijst aan het meest kosteneffectieve model kan de gemiddelde kosten per verzoek drastisch verlagen.

Derde hefboom: contextvensterbeheer. Veel agentarchitecturen sturen bij elk verzoek de volledige gespreksgeschiedenis mee, zelfs als slechts een fractie ervan relevant is voor de huidige taak. Technieken zoals vroegtijdig stoppen, prompttruncatie en selectieve contextbemonstering verminderen het aantal uitvoertokens zonder dat dit ten koste gaat van de kwaliteit. Deloitte Insights benadrukt dat een on-premises AI-fabriekmodel meer dan 50 procent kostenbesparing kan opleveren over een periode van drie jaar in vergelijking met API-gebaseerde oplossingen, zodra een kritisch volume aan tokenproductie is bereikt.

Vierde hefboom: Bestuur door middel van budgetbewaking en anomaliedetectie. Geautomatiseerde systemen die waarschuwingen geven, werkzaamheden pauzeren of overschakelen naar kosteneffectievere modellen bij vastgestelde drempelwaarden, vormen de meest effectieve bescherming tegen budgetoverschrijdingen zoals die bij Uber plaatsvinden. Deze systemen bestaan wel, maar worden te zelden geïmplementeerd voordat de eerste onverwachte rekening binnenkomt.

FinOps voor AI: Governance als strategisch concurrentievoordeel

Achter de technische hulpmiddelen schuilt een fundamentele verschuiving in het bedrijfsmanagement: uitgaven voor AI moeten worden beheerd als een volwaardige kostenpost – met alle instrumenten die bedrijven gebruiken voor personeel, inkoop of kapitaalinvesteringen. Dit klinkt vanzelfsprekend, maar dat is het niet. Veel bedrijven hebben AI-uitgaven tot nu toe geboekt in vage innovatiebudgetten die niet onderworpen waren aan een rigoureuze ROI-monitoring.

Tredence beschrijft het volwassenheidsniveau van een AI-governance-structuur aan de hand van specifieke KPI's: Besluitvormingswrijving (vermindering van budgetontduiking en nooduitgaven), Investeringsfocus (het aandeel van het AI-budget voor grootschalige implementaties ten opzichte van puur experimentele uitgaven) en Governancevertrouwen (een duidelijke eigendomsstructuur voor elk AI-initiatief). Bedrijven die deze metrics meten, kunnen door middel van directe vergelijkingen duidelijker communiceren of hun AI-uitgaven strategisch verantwoord zijn – en zo sneller budgetgoedkeuringen van financiële managers verkrijgen.

In een onderzoek gebaseerd op interviews met zo'n 40 bedrijven analyseerde Goldman Sachs een structurele verschuiving in de prijsstelling van AI: aanbieders stappen over van facturering op basis van gebruikers naar facturering op basis van prestaties – ze verkopen niet langer gebruikerstoegang, maar arbeidseenheden. Dit creëert nieuwe mogelijkheden voor bedrijven om AI-uitgaven direct te koppelen aan bedrijfsresultaten, maar het maakt de berekening ook complexer. Wie AI aanschaft als een "arbeidseenheid", moet de waarde van een arbeidseenheid kennen. De meeste bedrijven beschikken nog niet over deze kennis.

De nieuwe rekenkunde van werk: mens versus machine – maar anders dan verwacht

De populaire vergelijking tussen de kosten van AI en personeelskosten is vaak te simplistisch: het vervangen van een mens door AI bespaart 90 procent. Deze berekening klopt onder zeer specifieke omstandigheden – en gaat onder andere niet op. Voor repetitieve, duidelijk omschreven taken zoals data-invoer, standaard klantenservice of eenvoudige codegeneratie, blijkt uit de praktijk dat AI-systemen jaarlijks tussen de $ 3.000 en $ 25.000 kosten, terwijl de totale kosten voor een voltijdse menselijke functie (inclusief secundaire arbeidsvoorwaarden, kantoorruimte en personeelsverloop) variëren van $ 75.000 tot $ 95.000. Over een periode van vijf jaar bedraagt de totale investering in een voltijdse functie $ 375.000 tot $ 475.000, vergeleken met $ 15.000 tot $ 100.000 voor een vergelijkbaar AI-systeem.

Dit voordeel neemt echter af naarmate taken complexer, contextgevoeliger of creatiever worden. AI-systemen die afhankelijk zijn van dure premiummodellen voor een hoge outputkwaliteit, terwijl ze tegelijkertijd intensief menselijk toezicht vereisen, kunnen snel duurder worden dan de mensen die ze moeten vervangen. Het fenomeen dat Nvidia-manager Catanzaro beschrijft, doet zich precies voor wanneer taken met een hoge dimensionaliteit – zoals diepgaand onderzoek, architectonische ontwerpbeslissingen en strategisch redeneren – door AI worden ondersteund, maar zoveel rekenkracht vereisen dat de kosten de personeelskosten overstijgen.

De cruciale variabele is de taakstructuur: hoe gestandaardiseerder en hoe groter het volume van de taak, hoe duidelijker het kostenvoordeel van AI. Hoe creatiever, strategischer en contextafhankelijker de taak, hoe minder duidelijk de berekening wordt. Bedrijven die AI voor alle taken inzetten als vervanging van personeel, zonder onderscheid te maken naar taaktype, trappen in de klassieke kostenval.

De prijsparadox: goedkopere tokens, maar hogere totale kosten

Een van de meest verrassende dynamieken van het AI-kostenprobleem is de prijsparadox, die Deloitte in een analyse beschreef als "Dalende prijzen, stijgende consumptie". De eenheidskosten van tokens dalen inderdaad: modelaanbieders zoals OpenAI en Anthropic hebben de tokenprijzen de afgelopen twee jaar herhaaldelijk verlaagd, in sommige gevallen met 80 tot 90 procent ten opzichte van de introductieprijzen. Tegelijkertijd stijgen de totale uitgaven aan AI sterk.

De reden ligt in het consumptiepatroon: naarmate de prijzen dalen, neemt de gebruiksintensiteit onevenredig toe. Er ontstaan nieuwe toepassingen die bij hogere prijzen niet economisch haalbaar zouden zijn geweest. Het aantal agenten, gebruikers, modelaanroepen en contextlengtes groeit sneller dan de prijzen dalen. Dit is het klassieke reboundeffect uit de energie-economie: goedkopere energie leidt niet tot minder, maar tot meer verbruik. De absolute kostenbasis stijgt, zelfs als de marginale eenheid goedkoper wordt.

Voor CFO's betekent dit dat prijsonderhandelingen met AI-aanbieders het probleem structureel niet oplossen. Een prijsverlaging van 20 procent voor de token wordt ruimschoots gecompenseerd door een toename van 25 procent in het gebruik. Structurele kostenbesparingen komen alleen tot stand door goed bestuur, niet door betere aankoopprijzen.

Strategische vooruitzichten: Wat doen goed geleide bedrijven nu anders?

Bedrijven die de kosten van AI serieus nemen, zullen in 2026 een aantal dingen anders doen dan gemiddeld. Ten eerste zullen ze AI-uitgaven niet langer beschouwen als een IT-kostenpost, maar als een strategische investering met duidelijke ROI-verwachtingen. Elk AI-initiatief zal een sponsor binnen de organisatie hebben, niet binnen de IT-afdeling, en een duidelijke businesscase met meetbare succescriteria.

Ten tweede implementeerden ze inzicht in tokens: realtime dashboards die de uitgaven uitsplitsen op team-, applicatie- en gebruiksscenarioniveau. FinOps-platforms zoals Finout maken virtuele tagging op tokenniveau mogelijk zonder dat codeaanpassingen nodig zijn. Dit maakt chargeback-modellen mogelijk waarbij businessunits hun AI-uitgaven direct verantwoorden. Deze interne transparantie is vaak effectiever dan externe prijsonderhandelingen.

Ten derde hanteren toonaangevende bedrijven een portfoliomodel voor modellen: ze gebruiken niet één vlaggenschipmodel voor alle taken, maar een mix van budgetmodellen voor standaardtaken, premiummodellen voor complexe vereisten en gespecialiseerde open-sourcemodellen voor datagevoelige toepassingen. Deloitte adviseert het gebruik van open-sourcemodellen wanneer kwaliteitseisen kunnen worden vervuld door kleinere, nauwkeurig afgestemde modellen – wat resulteert in aanzienlijke kostenbesparingen en minder afhankelijkheid van commerciële leveranciers.

Ten vierde hebben deze bedrijven stapsgewijze financieringsmodellen geïmplementeerd: in plaats van vooraf jaarlijkse budgetten voor AI toe te wijzen, wordt de financiering in kwartaalbedragen verstrekt, met verplichte evaluatiemomenten die implementaties alleen toestaan als meetbare toegevoegde waarde wordt aangetoond. De FinOps Foundation noemt dit principe 'fail-fast funding' – het stimuleert het vroegtijdig beëindigen van slecht presterende AI-projecten in plaats van geld te blijven investeren in projecten die niet goed presteren.

Een markt op zoek naar evenwicht

Het algemene beeld laat een industrie zien die nog steeds bezig is de werkelijke waarde van AI op industriële schaal te bepalen. De technische mogelijkheden van de modellen zijn indrukwekkend en nemen snel toe. De economische beheersbaarheid van de resulterende kosten blijft echter achter – niet omdat de tools ontbreken, maar omdat de organisatorische volwassenheid om deze tools consistent te implementeren nog onvoldoende ontwikkeld is.

Bedrijven die hun AI-uitgaven opschalen zonder goed bestuur, lopen het risico dat een vermeend concurrentievoordeel verandert in een stilletjes probleem met de winstmarges. Omgekeerd creëren bedrijven die vanaf het begin investeren in tokenbeheer, modelroutering, FinOps-processen en duidelijke ROI-meting een infrastructuur die kosteneffectief blijft, zelfs wanneer het AI-gebruik toeneemt.

De balans van AI zal de komende kwartalen een centraal thema worden in directievergaderingen. Niet omdat AI faalt, maar omdat het te succesvol is geworden – en de kosten ervan moeilijk beheersbaar zijn. Forrester schat dat de markt tegen eind 2026 een echte correctie zal ondergaan: Neoclouds – gespecialiseerde, op GPU's gerichte aanbieders – zullen steeds meer marktaandeel afsnoepen van de grote hyperscalers en betaalbare infrastructuur voor AI-workloads aanbieden. Dit zal de prijsconcurrentie intensiveren en bedrijven nieuwe onderhandelingsmacht geven.

De cruciale vaardigheid voor de komende twee tot drie jaar zal niet het gebruik van AI zijn. Vrijwel elk bedrijf doet dat al. De cruciale vaardigheid zal zijn om AI zo in te zetten dat de kosten-batenverhouding consistent positief blijft. Beheerde AI – in al haar vormen – is geen luxe, maar het structurele antwoord op een structurele uitdaging.

Advisering - Planning - Implementatie

Konrad Wolfenstein

Ik sta graag tot uw beschikking als uw persoonlijke adviseur.

met mij opnemen via wolfenstein∂xpert.digital contact

U kunt me bellen op +49 7348 4088 965 .