Nauwelijks is GPT-5.3 gelanceerd of iedereen heeft het al over GPT-5.4: Extreme Reasoning & 2 Million Tokens

Konrad Wolfenstein

4 maanden geleden

Nauwelijks is GPT-5.3 gelanceerd of iedereen heeft het al over GPT-5.4: Extreme Reasoning & 2 miljoen tokens – Afbeelding: Xpert.Digital

Een kwantumsprong voor OpenAI? De verborgen AI-gigant: hoe OpenAI Google en Anthropic wil overtreffen met GPT-5.4

Per ongeluk uitgelekt: OpenAI's nieuwe megamodel GPT-5.4 staat op het punt uitgebracht te worden

Een cryptische tweet van vijf woorden en haastig verwijderde codefragmenten op GitHub hebben de wereldwijde techwereld opgeschud: OpenAI bereidt zich blijkbaar voor op de lancering van zijn volgende belangrijke taalmodel – GPT-5.4. Wat aanvankelijk een onopvallende, incrementele update lijkt, blijkt bij nader inzien een potentiële mijlpaal te zijn in de felle strijd om AI-suprematie. Met baanbrekende functies zoals een rekenintensieve "Extreme Reasoning"-modus, een enorm contextvenster van maximaal twee miljoen tokens en pixelperfecte beeldanalyse, bewapent het bedrijf zich om concurrenten als Google en Anthropic te slim af te zijn. Maar de versnelde releasecyclus heeft een prijs: terwijl de modellen steeds autonomer worden en evolueren tot echte agenten, schieten de infrastructuurkosten omhoog – en te midden van controversiële deals met het Pentagon komt de ethische en economische haalbaarheid van deze snelle vooruitgang steeds meer in het geding.

GPT-5.4: OpenAI's volgende kwantumsprong tussen Extreme Reasoning en de strijd om AI-suprematie

Als vijf woorden over X al genoeg zijn om de hele AI-industrie in beroering te brengen, dan staat er meer op het spel dan alleen een nieuw model

Het was een ongekend beknopt bericht, maar het veroorzaakte een schokgolf in de hele kunstmatige intelligentie-industrie. Op 3 maart 2026, precies een uur nadat OpenAI zijn nieuwe taalmodel, GPT-5.3 Instant, voor het grote publiek had uitgebracht, verscheen er een bericht van vijfwoorden op het officiële X-kanaal van het bedrijf. Binnen enkele uren werden de berichten drie miljoen keer bekeken en kregen ze 25.000 likes: "5.4 eerder dan je denkt." Geen afbeelding, geen uitleg, geen link naar een blogpost. Slechts vijf woorden en een opvallend grote T, die direct de speculatiemachine van de wereldwijde ontwikkelaars- en investeerdersgemeenschap op gang brachten. Wat op het eerste gezicht een marketingtruc leek, bleek bij nader inzien de duidelijkste publieke bevestiging tot nu toe dat OpenAI met GPT-5.4 een model aan het ontwikkelen is dat de regels van de AI-competitie fundamenteel zou kunnen veranderen.

De tweet verscheen niet zomaar uit het niets. Hij volgde op een week waarin drie onafhankelijke lekken uit OpenAI's eigen Codex-repository de interne werking van het aankomende model onthulden, voordat engineers de informatie haastig verwijderden om hun sporen uit te wissen. En zoals het technologiemagazine The Information meldde, op basis van een bron die bekend is met de plannen, zal GPT-5.4 een "Extreme"-redeneermodus bevatten, waardoor het model aanzienlijk meer rekenkracht kan gebruiken dan zijn voorgangers bij het aanpakken van complexe problemen. Wat aanvankelijk klinkt als een incrementele update, heeft de potentie om de machtsverhoudingen tussen OpenAI, Google en Anthropic te herdefiniëren, de kostenstructuren van AI-infrastructuur verder onder druk te zetten en de vraag op te roepen of het bedrijfsmodel achter deze steeds krachtigere modellen op de lange termijn wel houdbaar is.

Anatomie van een onvrijwillige openbaring

Het verhaal van GPT-5.4 begon niet met een gepland persbericht, maar met een fout die zich met alarmerende regelmaat herhaalt in de wereld van softwareontwikkeling: een engineer schreef code die meer onthulde dan de bedoeling was. Op 28 februari 2026 verscheen een pull request met de interne aanduiding 13050 in de openbaar toegankelijke Codex-repository op GitHub. Deze bevatte een versiecontrole die expliciet verwees naar "GPT-5.4 of nieuwer" als minimale vereiste voor een nieuwe beeldverwerkingsfunctie. De community ontdekte de fout binnen enkele uren. De betreffende regel werd haastig gewijzigd in "gpt-5.3-codex of nieuwer" en de commitgeschiedenis werd overschreven via een force push, maar tegen die tijd circuleerden er al screenshots op X en Reddit.

Het cruciale punt van dit lek was dat het geen placeholder was. De code implementeerde een specifieke functionaliteit, namelijk de verwerking van afbeeldingen met volledige resolutie, wat technisch gezien alleen werkt met de mogelijkheden van GPT-5.4. De engineer schreef de versiecontrole omdat de functie simpelweg niet werkte op oudere modellen. Het was een functionele referentie, geen speculatieve.

Een paar dagen later, op 2 maart, volgde een tweede pull request, nummer 13212, die de kwestie verder verduidelijkte. Een OpenAI-ontwikkelaar met de gebruikersnaam pash-openai had een functie voor het in- en uitschakelen van de snelle modus toegevoegd aan de Codex-terminal. De beschrijving verwees expliciet naar "schakel de snelle modus in voor GPT-5.4" en introduceerde een zogenaamde ServiceTier-enumeratie met de varianten Standaard en Snel. Ook deze verwijzing werd binnen enkele uren verwijderd, maar de technische details waren al gedocumenteerd.

Tegelijkertijd veroorzaakte een medewerker van OpenAI genaamd Tibo een ander onbedoeld lek toen hij een screenshot plaatste van de modelselectie in de Codex-applicatie, waarop GPT-5.4 als selecteerbare optie naast GPT-5.3 Codex te zien was. Het bericht werd snel verwijderd, maar de afbeelding was al viraal gegaan. Ten slotte meldde ontwikkelaar nicdunz op X dat een endpoint met het label "alpha-gpt-5.4" tijdelijk was verschenen in een openbare API-modellijst, in lijn met de gebruikelijke praktijk van OpenAI om modellen te testen in alpha-endpoints vóór hun officiële release.

Samen schetsen deze vier onafhankelijke gegevenspunten – twee codecommits, een screenshot van een medewerker en een API-endpoint – een beeld dat veel verder gaat dan louter speculatie. GPT-5.4 bestaat intern bij OpenAI, bevindt zich in een vergevorderd ontwikkelingsstadium en wordt actief voorbereid op implementatie in productie.

De belofte van twee miljoen tokens en de beperkingen ervan

De technisch meest significante bewering die uit de gelekte codeverwijzingen naar voren komt, betreft het contextvenster. De analyse van NxCode van de gelekte commits suggereert een contextvenster van twee miljoen tokens, wat vijf keer de limiet van 400.000 tokens van het huidige GPT-5-vlaggenschipmodel zou zijn en acht keer de 256.000 tokens van de GPT-5.3 Codex. Ter vergelijking: twee miljoen tokens zijn ongeveer gelijk aan 5.000 gedrukte pagina's – genoeg om een volledige codebase, een langdurige juridische procedure met alle bijbehorende documenten, of een meerdelig wetenschappelijk artikel in één sessie te verwerken.

Een belangrijk onderscheid is hier echter noodzakelijk. Hoewel de gelekte code wijst op twee miljoen tokens, meldt The Information, op basis van een bron die bekend is met de plannen, een contextvenster van één miljoen tokens. Dit zou nog steeds een verdubbeling tot verviervoudiging betekenen ten opzichte van zijn voorganger en OpenAI op gelijke hoogte brengen met Google's Gemini 2.5 Pro, dat momenteel het grootste commercieel verkrijgbare contextvenster biedt met één miljoen tokens. Een zorgvuldige analyse van de bronnen laat zien dat het cijfer van twee miljoen afkomstig is van een enkele post van een influencer en niet direct wordt bevestigd door een van de vier gedocumenteerde codelekken, terwijl het cijfer van één miljoen afkomstig is van een gevestigde technische publicatie.

Ongeacht welk getal uiteindelijk correct blijkt te zijn, de implicatie blijft hetzelfde: OpenAI dicht een van zijn grootste achterstanden op de concurrentie. De Gemini-modellen van Google boden al lange tijd een aanzienlijk groter contextueel venster dan wat OpenAI te bieden had, en Anthropic's Claude Opus 4.6, gelanceerd begin februari 2026 met een eigen venster van één miljoen tokens en ondersteuning voor parallelle agentteams, heeft deze voorsprong verder versterkt. Een GPT 5.4 met één of zelfs twee miljoen tokens zou deze machtsverhoudingen fundamenteel veranderen.

De praktische toepassingen van zo'n sprong voorwaarts zijn talloos en reiken veel verder dan academische normen. Advocatenkantoren zouden complete dossiers in één enkel gespreksvenster kunnen verwerken. Softwareontwikkelingsteams zouden complete codebases kunnen laden voor analyse en refactoring van meerdere bestanden zonder de code te hoeven opsplitsen. Onderzoeksteams zouden complete literatuurcorpora kunnen invoeren voor synthese. De overgang van honderdduizenden naar miljoenen tokens is niet incrementeel; het verandert fundamenteel welke taken überhaupt haalbaar zijn binnen één enkele modelinteractie.

Extreme Reasoning: Wanneer AI meer tijd nodig heeft om na te denken

Naast de mogelijkheid om direct naar het contextvenster te gaan, is de aangekondigde "Extreme"-redeneermodus het tweede bepalende kenmerk van GPT-5.4. Zoals The Information meldt, is dit een functie waarmee het model aanzienlijk meer rekenkracht kan inzetten voor moeilijke vragen, waardoor een diepere cognitieve analyse mogelijk wordt. Volgens de beschikbare informatie is deze modus vooral bedoeld voor onderzoekers en niet voor gewone gebruikers die snelle antwoorden verwachten.

Het idee achter de Extreme Reasoning-modus bouwt voort op een trend die zich heeft ontwikkeld sinds OpenAI de o-serie van redeneermodellen introduceerde: de gerichte verschuiving van rekenkracht van de trainingsfase naar de inferentiefase. In plaats van een model simpelweg krachtiger te maken door uitgebreidere training, kan het meer tijd en rekenkracht investeren in het daadwerkelijk genereren van antwoorden. In het geval van GPT-5.4 betekent dit dat het model aanzienlijk hogere rekenkundige eisen aankan voor bijzonder complexe wetenschappelijke, wiskundige of technische problemen, wat resulteert in nauwkeurigere en diepgaandere analyses.

De hoofdletter T in de tweet van OpenAI heeft geleid tot wijdverspreide speculatie binnen de community dat GPT-5.4 een zogenaamd Thinking-model zal zijn. OpenAI heeft intern al onderscheid gemaakt tussen verschillende modelklassen: Thinking-modellen voor diepgaand redeneren, Codex-modellen voor agentgebaseerde softwareontwikkeling en Instant-modellen voor alledaags conversatiegebruik. De hoofdletter T zou daarom een bewuste verwijzing zijn naar de interne merknaam Thinking-Mode. Deze interpretatie is plausibel, maar nog niet bevestigd.

De concrete implicaties van deze verbeterde redeneermogelijkheden voor zakelijke gebruikers kunnen worden geïllustreerd aan de hand van specifieke scenario's. In farmaceutisch onderzoek zou een extreme redeneermodus de analyse van geneesmiddelinteracties aanzienlijk kunnen verdiepen. In financiële analyses zouden complexe derivatenstructuren of macro-economische modellen grondiger kunnen worden onderzocht dan voorheen mogelijk was met meerdere opeenvolgende modelinteracties. In softwareontwikkeling zouden bugs in geneste systemen kunnen worden opgespoord, bugs die voorheen systematische problemen voor het model opleverden.

Pixelprecieze beeldanalyse: het einde van compromissen

Een derde technische doorbraak, gedocumenteerd door de gelekte pull requests, betreft beeldverwerking. De code in PR 13050 voegt een feature flag toe die originele beeldgegevens in PNG-, JPEG- en WebP-formaat direct en ongecomprimeerd doorgeeft aan de Responses API, aangestuurd door een nieuwe API-parameter, "detail: original". De minimale versievereiste voor deze functie is 5.4, wat betekent dat het een GPT 5.4-specifieke extensie is en niet kan worden teruggeporteerd naar oudere versies.

De huidige GPT-modellen comprimeren geüploade afbeeldingen vóór de verwerking, wat de analysekwaliteit vermindert voor taken die precisie op pixelniveau vereisen. Dit omvat medische beeldvorming, satellietbeelden, optische tekenherkenning (OCR) in documenten, de beoordeling van architectuurplannen en technische schema's, en kwaliteitscontrole van ontwerpmodellen en gebruikersinterfaces. De mogelijkheid om afbeeldingen met volledige resolutie te verwerken zou GPT-5.4 in staat stellen om een reeks professionele toepassingsgebieden te betreden waar eerdere modellen hun grenzen bereikten vanwege beeldcompressie.

Voor bedrijven die AI-gestuurde kwaliteitsborging gebruiken in de productie, geautomatiseerde documentverwerking in de juridische of financiële sector, of beeldgebaseerde diagnostiek in de geneeskunde, zou dit een grote sprong voorwaarts betekenen met direct praktisch voordeel. Het is geen toeval dat OpenAI deze functie expliciet heeft gekoppeld aan GPT-5.4: het verwerken van ongecomprimeerde beelden met een hoge resolutie vereist aanzienlijk meer rekenkracht en geheugenbandbreedte, wat de technische eisen aan het onderliggende model en de infrastructuur verhoogt.

De toon zetten in de race: OpenAI's versnelde releasefrequentie

Een aspect dat minstens even belangrijk is als de technische specificaties in de discussie rond GPT-5.4, betreft de snelheid waarmee OpenAI nieuwe modelvarianten uitbrengt. Sinds de lancering van GPT-5 op 7 augustus 2025 heeft het bedrijf meer varianten binnen de GPT-5-serie uitgebracht dan gedurende het gehele GPT-4-tijdperk in een vergelijkbare periode.

De chronologie illustreert de versnelling: GPT-5 werd uitgebracht in augustus 2025, GPT-5.1 volgde in november 2025 na een onderbreking van drie maanden, GPT-5.2 kwam in december 2025 na slechts één maand, GPT-5.3 Codex werd uitgebracht op 5 februari 2026, GPT-5.3 Codex Spark volgde een week later op 13 februari, en GPT-5.3 Instant werd gelanceerd op 3 maart 2026. Mocht GPT-5.4 daadwerkelijk in maart of april worden uitgebracht, dan zou de onderbreking worden verkort tot ongeveer één maand. Voorspellingsmarkten op Manifold geven het model een kans van 55 procent op een release vóór april 2026 en een kans van 74 procent vóór juni.

Volgens The Information is dit versnelde tempo een weloverwogen strategische beslissing. De frequentere modelreleases zijn bedoeld om de verwachtingen van gebruikers te temperen. De hype rond de lancering van GPT-5 had de lat zo hoog gelegd dat het vrijwel onmogelijk was om die te overtreffen, en de gebruikersgroei van OpenAI is de laatste tijd achtergebleven bij de interne prognoses. Door continu nieuwe, incrementele verbeteringen te leveren in plaats van zich te richten op één grote release, kan het bedrijf de aandacht van de sector behouden zonder het risico van een teleurstellende eenmalige gebeurtenis.

Deze strategie heeft echter ook een keerzijde. Ontwikkelaars die voortbouwen op de API van OpenAI melden steeds vaker een zekere migratiemoeheid. De snelle opeenvolging van nieuwe modelvarianten vereist terugkerende evaluatiecycli en aanpassingen aan hun eigen systemen. Voor bedrijven die AI-toepassingen in productieomgevingen gebruiken, rijst de vraag of de inspanning van constante updates opweegt tegen de voordelen van elke incrementele verbetering.

Een nieuwe dimensie van digitale transformatie met 'Managed AI' (kunstmatige intelligentie) - Platform- en B2B-oplossing | Xpert Consulting

Een nieuwe dimensie van digitale transformatie met 'Managed AI' (kunstmatige intelligentie) – Platform- en B2B-oplossing | Xpert Consulting - Afbeelding: Xpert.Digital

Hier leert u hoe uw bedrijf snel, veilig en zonder hoge drempels AI-oplossingen op maat kan implementeren.

Een beheerd AI-platform is uw allesomvattende, zorgeloze oplossing voor kunstmatige intelligentie. In plaats van te worstelen met complexe technologie, dure infrastructuur en langdurige ontwikkelprocessen, ontvangt u een kant-en-klare oplossing op maat van een gespecialiseerde partner – vaak al binnen enkele dagen.

De belangrijkste voordelen in één oogopslag:

⚡ Snelle implementatie: Van idee tot gebruiksklare applicatie in dagen, niet maanden. Wij leveren praktische oplossingen die direct toegevoegde waarde creëren.

🔒 Maximale gegevensbeveiliging: Uw gevoelige gegevens blijven bij u. Wij garanderen een veilige en conforme verwerking zonder gegevens met derden te delen.

💸 Geen financieel risico: u betaalt alleen voor de resultaten. Hoge investeringen vooraf in hardware, software of personeel zijn volledig uitgesloten.

🎯 Focus op uw kernactiviteiten: concentreer u op waar u het beste in bent. Wij zorgen voor de volledige technische implementatie, werking en het onderhoud van uw AI-oplossing.

📈 Toekomstbestendig en schaalbaar: Uw AI groeit met u mee. Wij garanderen continue optimalisatie en schaalbaarheid en passen de modellen flexibel aan nieuwe eisen aan.

Meer informatie vindt u hier:

De Managed AI Solution - Industriële AI-diensten: De sleutel tot concurrentievermogen in de dienstensector, de industrie en de machinebouw

De AI-race wordt steeds spannender: hoe GPT-5.4 Google en Anthropic wil overschaduwen

Het concurrentielandschap: drie bedrijven, één race, geen duidelijke winnaar

De AI-race wordt steeds spannender: hoe GPT-5.4 Google en Anthropic wil overschaduwen

De aankondiging van GPT-5.4 komt op een moment dat de concurrentie tussen de drie toonaangevende AI-laboratoria een ongekende intensiteit heeft bereikt. Op 5 februari 2026 brachten OpenAI en Anthropic binnen een uur na elkaar hun respectievelijke nieuwe vlaggenschipmodellen uit, wat de dynamiek van deze wapenwedloop treffend illustreert. Anthropic onthulde Claude Opus 4.6, dat verbeteringen biedt aan redeneren met lange contexten, een contextvenster van één miljoen tokens en ondersteuning voor parallelle agentteams, waardoor meerdere AI-agenten tegelijkertijd kunnen werken aan programmeer- en documentatietaken. OpenAI reageerde met GPT-5.3 Codex, geoptimaliseerd voor agentgebaseerd programmeren en softwareontwikkeling.

De resultaten van onafhankelijke vergelijkende tests toonden aan dat geen van beide modellen een duidelijke algemene voorsprong kon claimen, waarbij de prestatievoordelen varieerden afhankelijk van de toepassing. Claude Opus 4.6 presteerde bijzonder goed bij professioneel redeneren, terwijl GPT-5.3-Codex voordelen liet zien bij autonome softwareontwikkeling. Google's Gemini 2.5 Pro had ondertussen het record voor de meest uitgebreide contextgebaseerde verwerking met een contextvenster van een miljoen tokens en bood sterke multimodale mogelijkheden.

GPT-5.4 zou OpenAI's poging zijn om op meerdere fronten tegelijk technologisch leiderschap terug te winnen: in het contextvenster met de nieuwe limiet van één of twee miljoen tokens, in redeneren met de Extreme-modus en in beeldverwerking met pixelprecieze analyse. Of dit lukt, hangt grotendeels af van hoe snel Google en Anthropic reageren met hun eigen updates. De industrie opereert in een tempo waarin technologische voordelen binnen enkele weken tenietgedaan kunnen worden.

Voor de positionering in de zakelijke markt is nog een factor relevant: volgens brancheanalyses had Anthropic recent een marktaandeel van 32 procent in het gebruik van AI-taalmodellen in de zakelijke sector, een aanzienlijke ommekeer ten opzichte van twee jaar geleden toen OpenAI nog domineerde met 50 procent. Terwijl OpenAI's focus op een consumentgerichte strategie via ChatGPT het bedrijf een enorme gebruikersbasis heeft opgeleverd, heeft Anthropic aanzienlijke vooruitgang geboekt in het lucratieve zakelijke segment met zijn consistente focus op professionele workflows en tools zoals Claude Code.

Pentagon, protesten en vertrouwenscrisis

De technische dimensie van GPT-5.4 kan niet los worden gezien van de politieke en sociale context waarin OpenAI momenteel opereert. Slechts enkele dagen voor de aankondiging had OpenAI een contract getekend met het Amerikaanse ministerie van Defensie om zijn modellen beschikbaar te stellen in geheime netwerken, wat onmiddellijk tot hevige tegenreacties leidde.

De achtergrond is veelzeggend: Anthropic had geweigerd het Pentagon onbeperkte toegang te geven tot zijn technologie en stelde beperkingen aan het gebruik ervan in massasurveillance en autonome wapensystemen. Het Pentagon reageerde door Anthropic te classificeren als een risico voor de toeleveringsketen en het gebruik van Claude binnen de overheid te verbieden, waarop president Trump federale instanties opdroeg onmiddellijk te stoppen met het gebruik van Anthropic-technologie. OpenAI greep de gelegenheid aan en kondigde een eigen overeenkomst aan, die volgens het bedrijf sterkere veiligheidsgaranties bevat dan alle voorgaande overeenkomsten voor de implementatie van geclassificeerde AI-systemen.

De reactie was een storm van verontwaardiging. Onder de hashtag #CancelChatGPT en via het platform quitgpt.org ontstond een beweging die, volgens eigen cijfers, meer dan 1,5 miljoen mensen mobiliseerde door abonnementen op te zeggen, op te roepen tot een boycot op sociale media en zich te registreren op de campagnewebsite. Claude overtrof ChatGPT tijdelijk als meest gedownloade gratis app in de Apple App Store. Op de gevels van de kantoren van OpenAI in San Francisco verscheen graffiti met krijt die de overeenkomst met het Pentagon bekritiseerde, terwijl op de gevels van de kantoren van Anthropic graffiti verscheen die de weigering juist toejuichte.

Sam Altman gaf toe dat de presentatie "slordig" overkwam, en OpenAI publiceerde fragmenten uit het contract, waarin expliciete verboden stonden op massale binnenlandse surveillance, volledig autonome wapensystemen en sociale kredietsystemen. In een open brief, ondertekend door 796 medewerkers van Google en OpenAI, werd gewaarschuwd dat de Amerikaanse overheid probeerde "de bedrijven uit elkaar te drijven door angst aan te jagen dat ze allebei zouden toegeven".

In deze context krijgt de versnelde introductie van GPT-5.4 een extra strategische dimensie. De lancering van een technologisch indrukwekkend model zou een tegengeluid kunnen leveren tegen de vertrouwenscrisis en de publieke aandacht kunnen verleggen van de controversiële samenwerking met het Pentagon naar de innovatieve kracht van het bedrijf.

De economische vergelijking: tussen recordomzetten en recordverliezen

De financiële situatie van OpenAI is wellicht de meest doorslaggevende factor die de waardering van GPT-5.4 beïnvloedt. Het bedrijf bevindt zich in een paradoxale positie: nooit eerder is een technologiebedrijf zo snel gegroeid en tegelijkertijd zulke hoge verliezen geleden.

De omzet bereikte in 2025 een geannualiseerd bedrag van 20 miljard dollar, een stijging van 233 procent ten opzichte van de 6 miljard dollar van het voorgaande jaar en de 2 miljard dollar van 2023. De daadwerkelijke totale omzet voor 2025 bedroeg 13 miljard dollar, waarmee de eigen prognose van het bedrijf van 10 miljard dollar werd overtroffen, terwijl de kosten met 8 miljard dollar onder de doelstelling van 9 miljard dollar bleven. De kosten stijgen echter parallel. Interne documenten die The Information in handen heeft gekregen, voorspellen een verlies van 14 miljard dollar voor 2026, ongeveer drie keer zoveel als de eerdere schattingen voor 2025. Voor de periode van 2023 tot eind 2028 verwacht OpenAI intern cumulatieve verliezen van 44 miljard dollar, alvorens in 2029 de eerste winst van 14 miljard dollar te behalen.

De brutomarges liggen rond de 33 tot 40 procent, aanzienlijk lager dan die van traditionele softwarebedrijven, en worden beperkt door variabele computerkosten. De inferentiekosten, oftewel de kosten voor het in realtime uitvoeren van de modellen, bereikten in 2025 $8,4 miljard en zullen naar verwachting stijgen tot $14,1 miljard in 2026. Hoewel OpenAI erin is geslaagd de inferentiekosten te verlagen tot minder dan één dollar per miljoen tokens, deels door het gebruik van andere hardware, maakt de enorme schaal van het gebruik deze efficiëntiewinsten teniet.

Om deze uitgaven te financieren, sloot OpenAI eind februari 2026 de grootste private financieringsronde in de geschiedenis af: $110 miljard, aangevoerd door Amazon met $50 miljard, SoftBank en Nvidia met elk $30 miljard, tegen een waardering van $730 miljard vóór de financiering en $840 miljard ná de financiering. De datacentercapaciteit verdrievoudigde van 200 megawatt naar 1,9 gigawatt, wat overeenkomt met het elektriciteitsverbruik van ongeveer twee miljoen huishoudens. Voor de periode tot 2030 streeft OpenAI naar totale uitgaven aan computercapaciteit van ongeveer $600 miljard, een daling ten opzichte van een eerdere schatting van $1,4 biljoen, die later als te optimistisch werd bijgesteld.

Wat GPT-5.4 betekent voor de infrastructuureconomie

Een model met twee miljoen contexttokens en een extreme redeneermodus stelt aanzienlijk hogere eisen aan de computerinfrastructuur dan zijn voorgangers. Het grotere contextvenster betekent dat het model bij elke aanvraag aanzienlijk meer gegevens moet verwerken, waardoor de opslagbehoefte en de verwerkingstijd per aanvraag toenemen. De extreme redeneermodus, die volgens rapporten verwerkingstijden van meerdere uren voor individuele taken mogelijk maakt, vermenigvuldigt de rekeninspanning per aanvraag vele malen ten opzichte van de standaard inferentieoperatie.

Voor OpenAI betekent dit een verdere verergering van de toch al gespannen verhouding tussen inkomsten en infrastructuurkosten. Elk nieuw model vereist meer rekenkracht. Elke toename in rekenkracht vereist meer kapitaal. Elke kapitaalverhoging vereist een aantoonbaar pad naar winstgevendheid, dat met elke modelgeneratie verder in de toekomst verschuift. Als de inkomsten rond de 20 miljard dollar liggen en de totale kosten tussen de 25 en 28 miljard dollar, resulteert dit in een impliciet jaarlijks verlies van 5 tot 8 miljard dollar.

Het strategische antwoord op dit dilemma is een tweeledige aanpak: enerzijds investeert OpenAI fors in eigen hardware. De samenwerking met Broadcom voor de ontwikkeling van op maat gemaakte AI-acceleratoren met een capaciteit van tien gigawatt, het Stargate-datacenterproject met SoftBank's SB Energy en de overeenkomst met Amazon voor het gebruik van Trainium-chips zijn bedoeld om de kosten op de lange termijn te verlagen. Anderzijds differentieert OpenAI zijn modelaanbod steeds meer in verschillende prestatieklassen – Instant voor dagelijks gebruik, Thinking voor diepgaande redenering en Codex voor agentgebaseerd programmeren – om computerbronnen naar behoefte toe te wijzen en te voorkomen dat de volledige modelcapaciteit voor elk gebruikersverzoek moet worden gebruikt.

De introductie van een schakelaar voor een snelle modus in GPT-5.4, zoals blijkt uit de gelekte pull requests, suggereert dat OpenAI deze differentiatie ook binnen individuele modellen implementeert. Gebruikers kunnen dan kiezen tussen snellere, kosteneffectievere zoekopdrachten en meer diepgaande, rekenintensieve analyses, afhankelijk van hun behoeften, waardoor de infrastructuur efficiënter kan worden benut.

Agentgebaseerde AI: De echte paradigmaverschuiving achter de cijfers

Achter de indrukwekkende cijfers voor contextvensters en tokenlimieten schuilt een paradigmaverschuiving die wellicht crucialer is voor de economische betekenis van GPT-5.4 dan welke technische specificatie dan ook: de evolutie naar agentgebaseerde AI. Rapporten over GPT-5.4 beschrijven verbeteringen die het model dichter bij "echte agenten" brengen, die in staat zijn om autonoom taken in meerdere fasen uit te voeren.

De ontwikkelingslijn binnen de GPT-5-serie illustreert deze vooruitgang. GPT-5.2 blonk uit in afzonderlijke taken. GPT-5.3 Codex optimaliseerde autonoom programmeren en terminalgebruik en telt nu 1,5 miljoen actieve gebruikers per week. GPT-5.4 streeft ernaar bredere autonome mogelijkheden te bieden voor programmeren, onderzoek en visuele taken. Verbeterde geheugencapaciteit voor processen met meerdere stappen en lagere foutpercentages bij complexe taken worden expliciet genoemd als kenmerken.

Deze ontwikkeling heeft aanzienlijke gevolgen voor de zakelijke markt. Volgens analisten van Gartner zou tegen eind 2026 ongeveer 70 procent van de Fortune 500-bedrijven GPT 5.x-agentarchitecturen kunnen gebruiken voor hun kernprocessen, wat de traditionele leveranciers van bedrijfssoftware flink onder druk zet. Meer dan de helft van alle bedrijven onderzoekt al het gebruik van AI-agents, met geplande toepassingen zoals administratieve taken, klantenservice en contentcreatie, maar slechts 12 procent is verder gegaan dan de experimentele fase en volledig geïmplementeerd.

De investeringen van grote technologiebedrijven in de onderliggende infrastructuur weerspiegelen de verwachtingen voor deze markt. Microsoft plant kapitaaluitgaven van $85 miljard, Google $70 miljard, Meta $65 miljard en Amazon $97 miljard, wat neerkomt op bijna $320 miljard alleen al voor computerinfrastructuur. Deze bedragen worden niet besteed aan betere chatbots, maar aan de basis voor autonome workflows waarin AI-agenten taken overnemen die voorheen menselijke tussenkomst vereisten.

De kwestie van vertrouwen: veiligheid in de schaduw van de race

De versnelde releasefrequentie en de toenemende prestaties van de modellen roepen een vraag op die verder gaat dan de technische en economische aspecten: hoe zit het met de beveiliging? Demis Hassabis, de CEO van Google DeepMind, heeft publiekelijk gewaarschuwd dat de concurrentie en de druk om beter te presteren dan de concurrentie kunnen leiden tot overhaaste en gevaarlijke beslissingen naarmate de industrie steeds dichter bij bovenmenselijke AI komt.

GPT-5.3 Instant gaf in dit opzicht een gemengd beeld. Het model behaalde een reductie van 26,8 procent in het aantal afgewezen zoekopdrachten op websites in kritieke vakgebieden zoals geneeskunde, recht en financiën, en een reductie van 19,7 procent bij gebruik van uitsluitend interne kennisbanken. Tegelijkertijd toonden onafhankelijke analyses aan dat het model op sommige beveiligingsgebieden achteruitging ten opzichte van zijn voorganger, doordat het meer potentieel schadelijke inhoud doorliet. De vermindering van het aantal afgewezen zoekopdrachten, die werd gepresenteerd als een verbetering van de gebruiksvriendelijkheid, lijkt de drempel te hebben verlaagd waarop het model zoekopdrachten blokkeert.

Voor GPT-5.4 met zijn Extreme Reasoning-modus zijn deze beveiligingsproblemen nog acuter. Een model dat urenlang autonoom aan complexe problemen kan werken, moet robuuste mechanismen hebben om te voorkomen dat het tijdens deze langdurige verwerkingsfasen afwijkt van vooraf gedefinieerde beperkingen. Het versoepelen van beveiligingsmaatregelen in de strijd om marktaandeel is geen abstract risico, zoals het recente Axios-rapport aantoont. Dit rapport laat zien dat AI-bedrijven hun beveiligingsprotocollen steeds meer versoepelen om een concurrentievoordeel te behalen op het gebied van innovatie.

Vooruitzicht: het nieuwe normaal van permanente verstoring

GPT-5.4 is geen op zichzelf staand product, maar eerder een symptoom van een dynamiek in de sector die zich op verschillende vlakken op onbekend terrein begeeft. De maandelijkse release van steeds krachtigere modellen door OpenAI, in combinatie met de bijna gelijktijdige updates van Google en Anthropic, zorgt voor een voortdurende verstoring waarin elk technologisch voordeel binnen enkele weken tenietgedaan kan worden.

Voor bedrijven die AI-technologie gebruiken, betekent dit een fundamentele verschuiving in planningsprincipes. Het bouwen van applicaties op basis van één enkel model of leverancier wordt steeds riskanter. Modelonafhankelijke architecturen die naadloos schakelen tussen OpenAI, Anthropic en Google mogelijk maken, worden een noodzaak. Evaluatiecycli, die voorheen per kwartaal plaatsvonden, moeten worden verkort tot maandelijkse of zelfs tweewekelijkse cycli.

Tegelijkertijd verandert de logica achter de evaluatie van AI-modellen. De vraag is niet langer welk model de hoogste benchmarkscore behaalt, maar welk model de meest betrouwbare resultaten levert tegen de laagste kosten in een specifieke toepassing. GPT-5.4, met zijn Extreme Reasoning-modus, is wellicht de beste keuze voor baanbrekend wetenschappelijk onderzoek, terwijl voor alledaagse zakelijke toepassingen de snellere en kosteneffectievere GPT-5.3 Instant de meer pragmatische optie blijft.

Voorspellingsmarkten, die GPT-5.4 een kans van 55 procent geven op een release vóór april en 74 procent vóór juni, suggereren dat het wachten kort zal zijn. Sommige waarnemers speculeren zelfs over een releasedatum van 4 mei, volgens het Amerikaanse datumformaat 5/4, wat zou passen bij OpenAI's voorliefde voor dergelijke culturele verwijzingen. Eén ding is zeker: GPT-5.4 is geen speculatie. Het is code die in productie wordt gebruikt. De vraag is niet óf, maar wanneer en in hoeverre het de beloftes zal waarmaken die de gelekte code suggereert.

Wat overblijft is een industrie die zich in een ongekend tempo transformeert, gedreven door een wedloop om technologische suprematie die jaarlijks honderden miljarden dollars opslokt en waarvan de economische levensvatbaarheid nog moet worden bewezen. GPT-5.4 is het volgende hoofdstuk in dit verhaal, maar zeker niet het laatste.

Uw wereldwijde partner voor marketing en bedrijfsontwikkeling

☑️ Onze zakelijke voertaal is Engels of Duits

☑️ NIEUW: Correspondentie in uw moedertaal!

Konrad Wolfenstein

Mijn team en ik staan graag tot uw beschikking als uw persoonlijke adviseur.

U kunt contact met mij opnemen door hier het contactformulier in te vullen wolfenstein@xpert.digital:of door mij te bellen op +49 7348 4088 965. Mijn e-mailadres is

Ik kijk uit naar ons gezamenlijke project.

☑️ Ondersteuning van het MKB op het gebied van strategie, advies, planning en implementatie

☑️ Opstellen of herzien van de digitale strategie en digitalisering

☑️ Uitbreiding en optimalisatie van internationale verkoopprocessen

☑️ Wereldwijde en digitale B2B-handelsplatformen

☑️ Pionier in bedrijfsontwikkeling / marketing / PR / beurzen

🎯🎯🎯 Profiteer van de uitgebreide, vijfvoudige expertise van Xpert.Digital in één compleet servicepakket | Business Development, R&D, XR, PR & Optimalisatie van digitale zichtbaarheid

Profiteer van de uitgebreide, vijfvoudige expertise van Xpert.Digital in een compleet servicepakket | R&D, XR, PR & Optimalisatie van digitale zichtbaarheid - Afbeelding: Xpert.Digital

Xpert.Digital beschikt over diepgaande kennis van diverse sectoren. Hierdoor kunnen we strategieën op maat ontwikkelen die precies aansluiten op de behoeften en uitdagingen van uw specifieke marktsegment. Door continu markttrends te analyseren en ontwikkelingen in de sector te volgen, kunnen we proactief handelen en innovatieve oplossingen bieden. De combinatie van ervaring en expertise genereert toegevoegde waarde en geeft onze klanten een doorslaggevend concurrentievoordeel.

Meer informatie vindt u hier:

Profiteer van de 5 expertisegebieden van Xpert.Digital in één pakket – al vanaf €500 per maand

Een kwantumsprong voor OpenAI? De verborgen AI-gigant: hoe OpenAI Google en Anthropic wil overtreffen met GPT-5.4

Per ongeluk uitgelekt: OpenAI's nieuwe megamodel GPT-5.4 staat op het punt uitgebracht te worden

GPT-5.4: OpenAI's volgende kwantumsprong tussen Extreme Reasoning en de strijd om AI-suprematie

Anatomie van een onvrijwillige openbaring

De belofte van twee miljoen tokens en de beperkingen ervan

Extreme Reasoning: Wanneer AI meer tijd nodig heeft om na te denken

Pixelprecieze beeldanalyse: het einde van compromissen

De toon zetten in de race: OpenAI's versnelde releasefrequentie

Een nieuwe dimensie van digitale transformatie met 'Managed AI' (kunstmatige intelligentie) - Platform- en B2B-oplossing | Xpert Consulting

De AI-race wordt steeds spannender: hoe GPT-5.4 Google en Anthropic wil overschaduwen

Het concurrentielandschap: drie bedrijven, één race, geen duidelijke winnaar

Pentagon, protesten en vertrouwenscrisis

De economische vergelijking: tussen recordomzetten en recordverliezen

Wat GPT-5.4 betekent voor de infrastructuureconomie

Agentgebaseerde AI: De echte paradigmaverschuiving achter de cijfers

De kwestie van vertrouwen: veiligheid in de schaduw van de race

Vooruitzicht: het nieuwe normaal van permanente verstoring

Uw wereldwijde partner voor marketing en bedrijfsontwikkeling

☑️ Onze zakelijke voertaal is Engels of Duits

☑️ NIEUW: Correspondentie in uw moedertaal!

☑️ Ondersteuning van het MKB op het gebied van strategie, advies, planning en implementatie

☑️ Opstellen of herzien van de digitale strategie en digitalisering

☑️ Uitbreiding en optimalisatie van internationale verkoopprocessen

☑️ Wereldwijde en digitale B2B-handelsplatformen

☑️ Pionier in bedrijfsontwikkeling / marketing / PR / beurzen

🎯🎯🎯 Profiteer van de uitgebreide, vijfvoudige expertise van Xpert.Digital in één compleet servicepakket | Business Development, R&D, XR, PR & Optimalisatie van digitale zichtbaarheid

Andere onderwerpen