Website-Icon Xpert.Digital

Die Nvidia Tokenisierung der Welt: Wie Jensen Huang die Öllampen-Strategie des 21. Jahrhunderts perfektioniert

Die Tokenisierung der Welt: Wie Jensen Huang die Öllampen-Strategie des 21. Jahrhunderts perfektioniert

Die Tokenisierung der Welt: Wie Jensen Huang die Öllampen-Strategie des 21. Jahrhunderts perfektioniert – Bild: Xpert.Digital

Wie Nvidia die Tech-Welt in die absolute Abhängigkeit treibt – die große KI-Lüge: Warum Nvidias Produktivitäts-Wunder in Wahrheit reine Verschwendung ist

Milliarden für leere Versprechen? Die unbequeme Wahrheit über Nvidias Token-Fabrik

Nvidia-CEO Jensen Huang hat eine simple Gleichung aufgestellt: Wer nicht rechnet, verliert. Doch hinter der glänzenden Fassade des KI-Booms verbirgt sich ein knallhartes Geschäftsmodell, das an die skrupellosen Monopolstrategien des 19. Jahrhunderts erinnert. Mit einem beispiellosen Hardware-Monopol, dem geschlossenen Software-Ökosystem CUDA und Frontalangriffen wie dem neuen RTX-Spark-Chip zwingt der Tech-Gigant die Weltwirtschaft in eine gefährliche Abhängigkeit. Statt messbarer Produktivität kaufen Unternehmen heute vor allem eines: den schieren Verbrauch von „Tokens“. Eine tiefgehende Analyse darüber, wie Nvidia die Regeln der Wertschöpfung auf den Kopf stellt, warum Hyperscaler hunderte Milliarden investieren müssen – und weshalb diese Spirale aus Profit und Energieverschwendung uns alle teuer zu stehen kommen könnte.

NVIDIA und die Tokenisierung der Welt: Wie Jensen Huang eine neue Wirtschaftsordnung diktiert (und abkassiert)

Der Moment, in dem Teleshopping zur Unternehmensstrategie wurde

Im März 2026 bestieg Jensen Huang die Bühne der Morgan Stanley Technology, Media & Telecom Conference in San Francisco und formulierte einen Satz, der in seiner Kürze und Kühnheit seinesgleichen sucht: „Compute equals tokens, tokens equal intelligence, and intelligence equals economic output at every level, from companies to countries.“ Was sich wie eine physikalische Grundgleichung liest, ist in Wirklichkeit eines der ambitioniertesten Marketingkonstrukte der Wirtschaftsgeschichte: die Umdeutung eines Rechenzentrums in eine Druckmaschine, die Profit produziert — und zwar in erster Linie für NVIDIA.

Wenige Wochen vorher, auf der Computex 2026 in Taipei, ergänzte Huang dieses Bild um den RTX Spark, ein ARM-basiertes System-on-a-Chip für Windows-Laptops und Kompakt-Desktops. Das Narrativ war bereits bekannt: Wer nicht kauft, verliert den Anschluss. Der Verbrauch selbst sei der Beweis für wirtschaftliche Aktivität. „The more you buy, the more you make“ — ein Satz, der in seiner schönen Einfachheit die gesamte Logik eines Geschäftsmodells destilliert, das auf der strukturellen Abhängigkeit seiner Kunden basiert.

Um zu verstehen, warum diese Logik so gefährlich ist, lohnt ein Blick zurück — in die Geschichte der Öllampen.

Das Öllampen-Prinzip: Wie man Abhängigkeit verschenkt

Gegen Ende des 19. Jahrhunderts verbreitete John D. Rockefellers Standard Oil Company in amerikanischen Haushalten eine einfache, aber revolutionäre Technologie: die Petroleumlampe. Die Lampe war günstig, manchmal sogar kostenlos. Das Öl, das man zum Betrieb brauchte, war es nicht — und ohne dieses Öl war die Lampe wertlos. Standard Oil kontrollierte bis 1879 rund 90 Prozent der US-amerikanischen Raffineriekapazitäten und diktierte damit den Preis für den einzigen Brennstoff, der die verteilten Lampen am Leuchten hielt. Der Haken war nicht die Lampe selbst. Der Haken war die daraus entstehende Struktur: Hat man einmal auf Petroleum umgestellt, kehrt man nicht zurück. Man kauft weiter — bis ans Ende seiner Tage oder bis zum Urteil des Supreme Court.

NVIDIA hat dieses Prinzip in die digitale Ära übertragen und dabei auf 17 Jahre geduldiger Arbeit aufgebaut. Seit 2007 entwickelt das Unternehmen die proprietäre Programmierplattform CUDA, heute das De-facto-Betriebssystem der globalen KI-Industrie. Mit über 5 Millionen registrierten Entwicklern, rund 5.937 GitHub-Projekten allein mit CUDA-Bezug (gegenüber 187 bei AMDs Konkurrenzprodukt ROCm) und nahezu jeder relevanten KI-Bibliothek — von cuDNN über TensorRT bis hin zu den Frameworks PyTorch und TensorFlow — hat NVIDIA einen Software-Graben gezogen, der mit Kapital allein nicht zu überwinden ist. Die Lampe heißt CUDA. Das Öl heißt Compute. Und wer einmal ins Ökosystem eingestiegen ist, findet den Ausstieg verbaut.

Das zeigt nicht zuletzt die Geschichte des Open-Source-Projekts ZLUDA, das es ermöglichte, CUDA-Code unverändert auf AMD-Hardware laufen zu lassen. Als die Bedrohung real wurde, änderte NVIDIA still und ohne Anhörung die Nutzungsbedingungen der CUDA-Plattform: Translation-Layer wurden per EULA verboten. Kein Gericht, kein fairer Wettbewerb — nur eine Vertragsklausel, die eine echte Alternative im Keim erstickte.

Die Token-Fabrik: Ein neues Paradigma der Wertschöpfung

Der Begriff „AI Factory“ ist keine Metapher, er ist Programm. Jensen Huang hat auf der GTC-Konferenz im März 2026 explizit formuliert, was er darunter versteht: Rechenzentren sind keine passiven Infrastruktureinrichtungen mehr, sondern aktive Produktionsanlagen, deren Output — gemessen in Tokens pro Sekunde — direkt in Unternehmenserlöse und Bruttoinlandsprodukte übersetzt werden kann. Der Token ist die neue Barrel-Einheit des digitalen Rohstoffs.

Was zunächst nach einer plausiblen Systematisierung klingt, ist bei näherer Betrachtung eine fundamentale Verschiebung der Wertzurechnung. Traditionell misst sich wirtschaftlicher Wert am Ergebnis: Wurde ein Problem gelöst? Wurde ein Produkt gebaut? Ist ein Umsatz entstanden? In Huangs Rahmung entsteht der Wert beim Rechnen selbst — unabhängig davon, ob der Token zur Lösung eines echten Problems beiträgt oder zum teuren Leerlauf wird. Für NVIDIA und die Hyperscaler stimmt diese Rechnung, weil sie an jedem erzeugten Token verdienen. Für den Endkunden gilt das Gegenteil.

Agentic KI, also Systeme, die autonom planen, recherchieren und ausführen, kann nach Huangs eigenen Angaben eine Million Mal mehr Tokens verbrauchen als ein Standard-Prompt. Das ist nicht die Beschreibung einer Effizienzrevolution. Das ist die Beschreibung eines exponentiell wachsenden Betriebskostenpostens. Wer KI-Agenten im großen Maßstab einsetzt, kauft nicht Produktivität — er kauft Token-Verbrauch, dessen Gegenwert in echten wirtschaftlichen Resultaten sich erst noch beweisen muss.

Die Monopolmacht: Zahlen, die verstummen lassen

NVIDIAs Stellung im KI-Hardware-Markt ist keine Marktdominanz mehr im klassischen Sinne. Sie ist ein strukturelles Faktum, das selbst erfahrene Kapitalmarktbeobachter zur Vorsicht mahnt. Im vierten Quartal des Geschäftsjahres 2026 (November 2025 bis Januar 2026) erzielte NVIDIA einen Quartalsumsatz von 68,1 Milliarden US-Dollar, was einem Jahreswachstum von 73 Prozent entspricht. Das Rechenzentrumsgeschäft machte dabei 91,5 Prozent der Gesamterlöse aus, und die bereinigte operative Marge kletterte auf 67,7 Prozent.

Zum Vergleich: Softwareunternehmen, die für ihre hohen Margen bekannt sind, erreichen selten Werte über 40 Prozent. NVIDIA, formal ein Hardwareunternehmen, erwirtschaftet Margen, die selbst für Plattformkonzerne außergewöhnlich wären — ein Indiz dafür, dass der eigentliche Wettbewerbsvorteil längst im Software-Ökosystem liegt und nicht im Silizium. Einer Handelsblatt-Analyse zufolge ist CUDA das eigentliche Betriebssystem der KI-Industrie, und NVIDIAs größter Wettbewerbsvorteil liegt im Code, nicht im Chip.

Im Markt für diskrete Grafikkarten hält NVIDIA nach Daten von Jon Peddie Research per viertem Quartal 2025 einen Marktanteil von 94 Prozent, AMD kommt auf fünf Prozent, Intel auf ein Prozent. Beim KI-spezifischen GPU-Markt liegt der Anteil in vergleichbaren Größenordnungen. Im Bereich der für KI-Chips verwendeten Wafer-Produktion sicherte sich NVIDIA 2025 laut einer Morgan-Stanley-Analyse einen Anteil von 77 Prozent — gegenüber 51 Prozent im Vorjahr.

Diese Konzentration ist kein Naturgesetz, auch wenn Huang sie gerne als solches beschreibt. Sie ist das Ergebnis einer jahrelangen Strategie aus technologischem Vorsprung, gezielter Marktabschottung und dem Aufbau eines Ökosystems, in dem die Wechselkosten für Kunden so hoch sind, dass selbst massive Preisaufschläge klaglos akzeptiert werden.

Der Kapitalstrom: Wer bezahlt die Rechnung?

Die eigentliche Dimension der NVIDIA-Abhängigkeit zeigt sich nicht in den Zahlen des Unternehmens selbst, sondern in den Capex-Plänen (Investitionsausgaben) seiner wichtigsten Kunden. Die fünf größten amerikanischen Hyperscaler — Amazon, Alphabet, Microsoft, Meta und Oracle — haben für das Jahr 2026 kombinierte Investitionsausgaben von 660 bis 690 Milliarden US-Dollar angekündigt, was gegenüber dem Vorjahr nahezu einer Verdoppelung entspricht. Davon fließen rund 55 bis 60 Prozent direkt oder indirekt an NVIDIA.

Amazon allein hat für 2026 Investitionen von 200 Milliarden US-Dollar angekündigt — eine Summe, die das jährliche Bruttoinlandsprodukt Portugals übersteigt. Alphabets Capex soll von 91 auf 180 Milliarden US-Dollar ansteigen, ein Plus von 98 Prozent. Microsoft erhöht sein Rechenzentrumsbudget gegenüber dem Vorjahr um 59 Prozent. Diese Ausgaben werden längst nicht mehr nur aus freien Cashflows finanziert. Amazons freier Cashflow dürfte 2026 um 17 bis 28 Milliarden US-Dollar negativ werden, Metas freier Cashflow fällt um nahezu 90 Prozent, und Oracle schreibt voraussichtlich bis 2030 einen roten Free Cashflow.

Wer zahlt am Ende? Die Hyperscaler reichen die Kosten durch Preiserhöhungen weiter. AWS erhöhte im Januar 2026 die Preise für H200-GPU-Instanzen um 15 Prozent — eine Trendwende nach zwei Jahrzehnten sinkender Cloud-Computing-Preise. Unternehmenskunden, die KI-Dienste über die Cloud beziehen, zahlen damit unmittelbar die Rendite auf NVIDIAs Monopol.

AllianceBernstein schätzt, dass NVIDIA rund 30 Prozent der gesamten KI-Rechenzentrumsausgaben als Gewinn einbehält. Das bedeutet: Von jedem Euro, den ein europäisches Unternehmen für Cloud-KI-Dienste ausgibt, fließen netto rund 30 Cent an ein amerikanisches Unternehmen — ohne dass dafür zwingend eine Gegenleistung in Form von Problemlösung, Innovation oder gesellschaftlichem Mehrwert erbracht werden muss. Der Token wird produziert. Das reicht.

Verschwendung als Kennzahl: Die perverse Produktivitätslogik

Jensen Huang hat auf Veranstaltungen erklärt, er fände es zutiefst besorgniserregend, wenn ein gut bezahlter Softwareentwickler nicht mindestens eine Viertelmillion US-Dollar an Token-Kosten pro Jahr verursache. Diese Aussage wird in Tech-Medien oft als Beleg für Huangs Visionen zitiert, aber selten auf ihre ökonomische Substanz hin untersucht.

Eine Viertelmillion US-Dollar an Token-Kosten ist keine Produktivitätskennzahl. Es ist eine Verbrauchskennzahl. Der entscheidende Unterschied: Produktivität misst Output pro Input. Verbrauch misst nur Input. Wenn Huang den Token-Verbrauch zur Managementkennzahl erhebt, bricht er mit einer der ältesten Erkenntnisse der Betriebswirtschaft: Nicht der Einsatz von Ressourcen schafft Wert, sondern das, was dabei herauskommt.

Die Praxis gibt Huang in gewisser Weise recht — aber auf eine Weise, die Unternehmen schädigt. Bereits heute erfassen Firmen wie Zapier den Token-Verbrauch ihrer Mitarbeiter systematisch. Wer fünfmal so viele Tokens verbraucht wie der Durchschnitt, wird intern auf sein Nutzungsverhalten hin überprüft. Was als Kostencontrolling begann, droht zu einer neuen Form des Leistungsmessungswahns zu werden, bei dem Mitarbeiter lernen, sinnlose Prompts abzusetzen, um im internen Ranking nicht abzurutschen. Der Verbrauch wird zur Leistungsdemonstration, die Verschwendung zur Selbstverteidigung.

Eine aktuelle Bitkom-Umfrage unter 604 deutschen Unternehmen zeigt, dass bereits ein Drittel der KI-nutzenden Firmen von den anfallenden Kosten überrascht wurde. Bitkom-Präsident Ralf Wintergerst bestätigte, dass viele Firmen berichten, KI-Agenten benötigten mehr Betreuung durch klassische Mitarbeiter als ursprünglich angenommen. Brian Jabarian von der University of Chicago bringt es auf den Punkt: „Alle dachten, man setze einfach KI-Token ein, erhalte eine Produktivitätssteigerung und das war’s dann. Aber die Realität ist komplizierter.“

Die Produktivitätslüge und ihre methodischen Schwächen

NVIDIAs Kernargument für die Wirtschaftlichkeit seiner Plattform ist die Behauptung, KI verdreifache die Produktivität. Diese Zahl hat eine methodische Einschränkung, die in der öffentlichen Debatte kaum diskutiert wird: Sie basiert fast ausschließlich auf Beobachtungen im Bereich der Softwareentwicklung — also genau der Berufsgruppe, die von KI-Tools am stärksten profitiert, die über die technische Kompetenz zur optimalen Nutzung verfügt und die ohnehin bereits stark mit digitalen Werkzeugen arbeitet.

Das Institut für Arbeitsmarkt- und Berufsforschung (IAB) geht davon aus, dass die KI-Gesamtwirkung auf den deutschen Arbeitsmarkt zwar real, aber erheblich ungleicher verteilt ist, als Huangs Darstellung suggeriert: Rund 800.000 Jobs könnten durch KI wegfallen, gleichzeitig entstünden rund 800.000 neue — bei einem gesamtwirtschaftlichen Produktivitätszuwachs von bis zu 0,8 Prozentpunkten pro Jahr. Dieser Wert ist ökonomisch bedeutsam, aber weit entfernt von einer Verdreifachung.

Die „European Growth Study 2026“ der Strategieberatung Simon-Kucher, basierend auf 1.236 Unternehmensinterviews in 13 europäischen Ländern, kommt zu dem Ergebnis, dass 73 Prozent der Unternehmen KI derzeit in weniger als 30 Prozent ihrer Prozesse einsetzen — und spürbare Produktivitäts- oder Beschäftigungseffekte erst ab einer Durchdringung von 30 bis 50 Prozent erwarten. Die Bertelsmann Stiftung stellt in einer Arbeitsmarktanalyse auf Basis von rund 60 Millionen Stellenanzeigen fest, dass der Anteil von KI-bezogenen Stellen seit 2022 auf ohnehin niedrigem Niveau stagniert und in den Jahren 2023 und 2024 sogar leicht zurückging.

Das bedeutet nicht, dass KI keine wirtschaftliche Wirkung hat. Es bedeutet, dass die Wirkung selektiv und ungleich verteilt ist und weit langsamer als von der Industrie propagiert eintrifft — während die Kosten sofort anfallen.

 

Neue Dimension der digitalen Transformation mit der 'Managed KI' (Künstliche Intelligenz) - Plattform & B2B Lösung | Xpert Beratung

Neue Dimension der digitalen Transformation mit der 'Managed KI' (Künstliche Intelligenz) – Plattform & B2B Lösung | Xpert Beratung - Bild: Xpert.Digital

Hier erfahren Sie, wie Ihr Unternehmen maßgeschneiderte KI-Lösungen schnell, sicher und ohne hohe Einstiegshürden realisieren kann.

Eine Managed AI Platform ist Ihr Rundum-Sorglos-Paket für künstliche Intelligenz. Anstatt sich mit komplexer Technik, teurer Infrastruktur und langwierigen Entwicklungsprozessen zu befassen, erhalten Sie von einem spezialisierten Partner eine fertige, auf Ihre Bedürfnisse zugeschnittene Lösung – oft innerhalb weniger Tage.

Die zentralen Vorteile auf einen Blick:

⚡ Schnelle Umsetzung: Von der Idee zur einsatzbereiten Anwendung in Tagen, nicht Monaten. Wir liefern praxisnahe Lösungen, die sofort Mehrwert schaffen.

🔒 Maximale Datensicherheit: Ihre sensiblen Daten bleiben bei Ihnen. Wir garantieren eine sichere und konforme Verarbeitung ohne Datenweitergabe an Dritte.

💸 Kein finanzielles Risiko: Sie zahlen nur für Ergebnisse. Hohe Vorabinvestitionen in Hardware, Software oder Personal entfallen komplett.

🎯 Fokus auf Ihr Kerngeschäft: Konzentrieren Sie sich auf das, was Sie am besten können. Wir übernehmen die gesamte technische Umsetzung, den Betrieb und die Wartung Ihrer KI-Lösung.

📈 Zukunftssicher & Skalierbar: Ihre KI wächst mit Ihnen. Wir sorgen für die laufende Optimierung, Skalierbarkeit und passen die Modelle flexibel an neue Anforderungen an.

Mehr dazu hier:

 

Token-Ökonomie als Geschäftsmodell: Warum NVIDIAs Vision gefährlich für die Gesamtwirtschaft ist

Das RTX-Spark-Manöver: Den Markt zerstören und die Lösung verkaufen

Einer der interessantesten Aspekte der aktuellen NVIDIA-Strategie ist die Einführung des RTX Spark. Angekündigt am 31. Mai 2026 auf der Computex in Taipei, kombiniert der Chip einen 20-Kern-ARM-Prozessor auf Grace-Basis mit einer Blackwell-GPU mit 6.144 CUDA-Kernen und bis zu 128 GB gemeinsam genutztem LPDDR5X-Speicher. Die Leistung wird mit bis zu einem Petaflop KI-Rechenleistung angegeben. Zu den ersten Geräten gehört Microsofts Surface Laptop Ultra.

Oberflächlich betrachtet ist das eine Reaktion auf Apples M-Serie-Chips, die in den vergangenen Jahren den Premium-Laptop-Markt mit effizienten ARM-Prozessoren dominiert haben. Tiefer betrachtet ist es etwas anderes: NVIDIA hat mit der massiven Nachfrage nach KI-GPUs für Rechenzentren maßgeblich dazu beigetragen, dass Speicherchips knapper und teurer wurden, was den klassischen PC-Markt massiv belastet. Der gesamte GPU-Markt (inklusive integrierter Grafiklösungen) schrumpfte im ersten Quartal 2025 um 12 Prozent auf 68,8 Millionen Einheiten. Und jetzt kommt NVIDIA mit einem Premium-ARM-PC und erklärt den herkömmlichen Desktop-PC für überholt.

Die Struktur ist bekannt: Ein etablierter Markt wird durch externe Effekte destabilisiert. Dann erscheint ein Anbieter mit einer Lösung für das selbst mitverursachte Problem — natürlich zu Premiumpreisen. Der RTX Spark richtet sich ausdrücklich an das obere Preissegment. Exakte Preise wurden nicht kommuniziert, aber Branchenbeobachter gehen von erheblichen Aufschlägen gegenüber vergleichbaren Geräten mit Intel- oder AMD-Prozessoren aus. Wer in das neue Ökosystem einsteigt, verlässt den x86-Standard und begibt sich damit in eine ARM-Abhängigkeit, die durch das proprietäre CUDA-Ökosystem verstärkt wird. Man darf in Zukunft eigene Tokens generieren — auf Huangs Hardware, mit Huangs Software, nach Huangs Regeln.

Maschinen produzieren für Maschinen: Der Zirkelschluss einer Ökonomie

In der radikalsten Form seiner Vision beschreibt Huang eine Welt, in der KI-Agenten für andere KI-Agenten Dienste erbringen, die ihrerseits von KI-Infrastruktur abhängen, die wiederum von weiteren Agenten überwacht wird. Die wirtschaftliche Aktivität ist autark — sie braucht keinen menschlichen Endnutzen mehr, um messbar zu sein, solange die Tokens fließen.

Dieser Zirkelschluss hat eine elegante innere Logik für NVIDIA, aber eine beunruhigende für den Rest der Wirtschaft. Wenn Tokens als Proxy für wirtschaftliche Aktivität gelten, dann rechtfertigt jede erzeugte Token-Einheit weitere Investitionen in Infrastruktur, die mehr Tokens erzeugt. Das Ergebnis ist eine Spirale, in der Compute-Investitionen durch Token-Output legitimiert werden, dessen tatsächlicher wirtschaftlicher Nutzen offenbleibt. Für die Technologiewirtschaft ist dies ein Flywheel. Für die Gesamtwirtschaft könnte es sich als eine neue Variante des Crowding-out-Effekts erweisen: Kapital, das in Token-Fabriken fließt, steht nicht für produktive Investitionen in Fertigungsanlagen, Infrastruktur, Bildung oder Gesundheit zur Verfügung.

Die Hyperscaler-Zahlen machen das deutlich: Amazons Free Cashflow dürfte 2026 negativ werden, Metas fast auf null fallen. Diese Kapitalbindung ist kein Zeichen wirtschaftlicher Vernunft — sie ist das Ergebnis eines Rüstungswettlaufs, bei dem niemand aussteigen kann, ohne Marktanteile zu verlieren. Wer nicht kauft, fällt zurück. Wer kauft, subventioniert NVIDIAs Margen.

Die Umweltdimension: Der unsichtbare Dritte im Bunde

Eine ökonomische Analyse der Token-Ökonomie, die die Umweltkosten ausblendet, wäre unvollständig. Der weltweite Stromverbrauch von KI-Rechenzentren wird von 50 Milliarden Kilowattstunden im Jahr 2023 auf rund 550 Milliarden Kilowattstunden im Jahr 2030 steigen — eine Verelffachung. Damit verbunden ist ein Anstieg der Treibhausgasemissionen von Rechenzentren von 212 auf 355 Millionen Tonnen CO₂-Äquivalent, trotz des parallelen Ausbaus erneuerbarer Energien.

Das Öko-Institut stellt in einem Gutachten für Greenpeace Deutschland fest, dass Rechenzentren in den kommenden Jahren weiterhin stark auf fossile Energieträger angewiesen sein werden, weil die lokalen Stromnetze an ihre Kapazitätsgrenzen stoßen. Der IWF quantifiziert den Anteil von KI-Rechenzentren und Kryptowährungen am globalen Stromverbrauch gemeinsam auf zwei Prozent für 2023, mit einem prognostizierten Anstieg auf 3,5 Prozent bis 2027. Eine ChatGPT-Anfrage verbraucht dabei drei- bis zehnmal so viel Strom wie eine herkömmliche Google-Suche.

Diese Kosten erscheinen in keiner NVIDIA-Bilanz. Sie erscheinen auch nicht in der Preiskalkulation eines Tokens. Sie sind externalisierte Kosten — getragen von Energieverbrauchern, Klimasystemen und künftigen Generationen. In der Sprache der Ökonomie handelt es sich um negative externe Effekte in erheblichem Ausmaß, die das Geschäftsmodell der Token-Ökonomie systematisch subventionieren, ohne dass dies transparent gemacht wird.

CUDA als Standard Oil: Die Analogie und ihre Grenzen

Der historische Vergleich zwischen Rockefellers Standard Oil und NVIDIAs CUDA-Plattform hat eine reale analytische Basis, geht aber auch über sie hinaus. Standard Oil kontrollierte Pipelines und Raffinerien — physische Infrastruktur, die sich im Prinzip duplizieren ließ, wenn auch mit enormem Kapitalaufwand. Die Zerschlagung von 1911 war möglich, weil die Anlagen existierten und auf 34 Nachfolgeunternehmen aufgeteilt werden konnten.

CUDA ist schwieriger aufzuteilen. Es ist kein Rohr, das man aufschneiden kann. Es ist ein Ökosystem aus Millionen von Code-Zeilen, Bibliotheken, Dokumentationen, Entwickler-Know-how und Netzwerkeffekten, das über 17 Jahre aufgebaut wurde. Ein CUDA-Translation-Layer, der Code auf AMD-Hardware ausführbar macht, wird per Vertrag verboten. Open-Source-Alternativen wie ROCm oder OpenCL bleiben mit einem Bruchteil der Reichweite und Marktreife zurück. Das F&E-Budget, das NVIDIA mit 12,9 Milliarden US-Dollar im Geschäftsjahr 2025 in das eigene Ökosystem zurückfließen lässt, erkauft jeden neuen Leistungsvorsprung, bevor ein Konkurrent ihn aufholen kann.

Gleichzeitig ist NVIDIAs Strategie mit Open-Weight-Modellen besonders subtil: Das Unternehmen investiert 26 Milliarden US-Dollar über fünf Jahre in die Entwicklung offener KI-Modelle — Modelle, die jeder kostenlos nutzen kann. Aber NVIDIAs Nemotron-Modelle sind in NVIDIAs proprietärem 4-Bit-Format NVFP4 trainiert und entfalten ihren vollen Leistungsvorteil erst auf Blackwell-Hardware. Die Öllampe wird verschenkt, das Öl aber nur von einer einzigen Raffinerie geliefert.

Gegenkräfte und strukturelle Grenzen der Dominanz

Es wäre analytisch unredlich, NVIDIAs Position als unveränderlich darzustellen. Es gibt reale Gegenkräfte, deren Stärke allerdings oft überschätzt wird. Googles TPUs, Amazons Trainium, Metas MTIA und Microsofts Maia sind ernstzunehmende interne Alternativen, die den NVIDIA-Anteil am Hyperscaler-Capex von rund 70 Prozent im Jahr 2023 auf geschätzte 55 bis 60 Prozent im Jahr 2026 gedrückt haben. AMDs MI300- und MI400-Reihe gewinnt Marktanteile, insbesondere in bestimmten Inferenz-Workloads.

Aber dieser Rückgang von 70 auf 55 Prozent vollzieht sich bei einem gleichzeitig massiv wachsenden Gesamtmarkt. In absoluten Zahlen steigt NVIDIAs Umsatz weiter. Die Hyperscaler bauen eigene Chips, weil sie die NVIDIA-Abhängigkeit kennen und fürchten — aber sie können den Markt nur in dem Maße diversifizieren, wie CUDA-kompatible Alternativen reif genug sind, um Produktionsworkloads zu tragen. Dieser Zeitpunkt ist noch lange nicht erreicht.

DeepSeek aus China hat Anfang 2025 gezeigt, dass erhebliche Effizienzgewinne möglich sind, wenn man mit einem Bruchteil des Rechenaufwands vergleichbare Modellqualitäten erreicht. Das Hasso-Plattner-Institut zitiert die Aussage, DeepSeek erreiche dieselbe Trainingsgenauigkeit mit einem Hundertstel des Energieaufwands herkömmlicher Methoden. Sollte diese Effizienzlogik sich durchsetzen, würde die Nachfrage nach rohem Compute-Volumen strukturell sinken — was das Token-Volumen-Modell von NVIDIA unter Druck setzen würde. Huang hat diese Bedrohung erkannt und positioniert Effizienz — gemessen in Tokens pro Watt — als den neuen CEO-Level-Entscheidungsparameter. Auch hier ist die Botschaft klar: Kauft mehr, aber kauft effizientere Maschinen — von NVIDIA.

Regulierung: Kommt das Kartellrecht zu spät?

Die Frage, ob NVIDIAs Marktstellung kartellrechtliche Maßnahmen erfordert, wird in Brüssel und Washington zunehmend diskutiert. Der Vergleich mit Standard Oil ist dabei mehr als Rhetorik: Damals hatte Rockefeller mit 90 Prozent Marktanteil die amerikanische Ölindustrie kontrolliert, bevor das Urteil im Mai 1911 zur Zerschlagung in 34 Nachfolgeunternehmen führte. Die EU-Wettbewerbsbehörden haben mit dem Digital Markets Act und dem AI Act zumindest normative Rahmenbedingungen geschaffen. Eine direkte Intervention gegen NVIDIAs CUDA-Ökosystem steht jedoch noch aus.

Das konzeptionelle Problem ist bekannt: Anders als bei physischen Netzwerken wie Pipelines oder Eisenbahnlinien ist ein Software-Ökosystem nicht leicht durch regulatorische Eingriffe zu öffnen. Interoperabilitätspflichten, also die Verpflichtung, CUDA-Alternativen denselben Hardwarezugang zu ermöglichen, wären theoretisch umsetzbar — praktisch aber aufwendig und technisch komplex. Zudem müsste jede regulatorische Maßnahme schnell genug kommen, um eine Marktstruktur zu verändern, die sich täglich durch neue Modellgenerationen, neue Hardware-Architekturen und neue Lock-in-Effekte weiter verfestigt.

Bis dahin gilt: Wer in Rechenzentren investiert, wer Cloud-KI-Dienste nutzt, wer seine Entwickler auf CUDA-basierten Frameworks ausbildet, zahlt — direkt oder indirekt — NVIDIAs Monopolrendite. Das ist keine Verschwörungstheorie. Das ist die Struktur eines Marktes, in dem ein einziger Anbieter 94 Prozent des diskreten Grafikkarten-Segments, 77 Prozent der KI-Chip-Waferproduktion und nahezu alle relevanten Software-Bibliotheken der KI-Entwicklung kontrolliert.

Wenn der Verbrauch zum Selbstzweck wird

Jensen Huangs Formel — Compute ist Umsatz, Token sind Profit — ist eine der ehrlichsten Unternehmensstrategieaussagen der letzten Jahre. Ehrlich nicht in dem Sinne, dass sie zum Wohl der Kunden formuliert ist, sondern in dem Sinne, dass sie ausspricht, was viele andere verschweigen: Das Geschäftsmodell basiert nicht auf dem Wert, der am Ende eines Rechenprozesses entsteht, sondern auf dem Prozess selbst.

Das ist eine fundamentale Umkehrung der Wertschöpfungslogik. In jeder anderen Branche definiert sich der Preis durch das Ergebnis: eine gebaute Brücke, ein entwickeltes Medikament, ein verkauftes Automobil. In der Token-Ökonomie definiert sich der Preis durch den Input: die verbrauchten Rechenstunden, den fließenden Strom, die verarbeiteten Datenpakete. NVIDIA verdient, bevor irgendjemand beurteilen kann, ob sich die Investition lohnt.

Das ist kein Naturgesetz. Es ist ein Geschäftsmodell. Und wie jedes Geschäftsmodell hat es Grenzen, Schwachstellen und — mit etwas Geduld — auch Alternativen. Die Frage ist, ob Unternehmen, Regulatoren und Öffentlichkeit diese Alternativen schnell genug erkennen und fördern, bevor die Abhängigkeit so tief verwurzelt ist wie einst die Öllampe im amerikanischen Haushalt. Rockefellers Standard Oil hat von 1870 bis 1911 gebraucht, um zerschlagen zu werden. Das Flywheel dreht sich diesmal schneller.

 

Ihr globaler Marketing und Business Development Partner

☑️ Unsere Geschäftssprache ist Englisch oder Deutsch

☑️ NEU: Schriftverkehr in Ihrer Landessprache!

 

Konrad Wolfenstein

Gerne stehe ich Ihnen und mein Team als persönlicher Berater zur Verfügung.

Sie können mit mir Kontakt aufnehmen, indem Sie hier das Kontaktformular ausfüllen oder rufen Sie mich einfach unter +49 7348 4088 965 an. Meine E-Mail Adresse lautet: wolfensteinxpert.digital

Ich freue mich auf unser gemeinsames Projekt.

 

 

☑️ KMU Support in der Strategie, Beratung, Planung und Umsetzung

☑️ Erstellung oder Neuausrichtung der Digitalstrategie und Digitalisierung

☑️ Ausbau und Optimierung der internationalen Vertriebsprozesse

☑️ Globale & Digitale B2B-Handelsplattformen

☑️ Pioneer Business Development / Marketing / PR / Messen

 

🎯🎯🎯 Datengetriebener B2B-Industry-Hub als Quasi-Inhouse-Lösung

Die Quasi-Inhouse-Lösung: Wie Xpert.Digital operative Lücken in B2B-Marketing und Vertrieb schließt – Smart Content-Driven Business - Bild: Xpert.Digital

Xpert.Digital ist ein von Konrad Wolfenstein geführter, datengetriebener B2B-Industry-Hub. Das Unternehmen agiert als externe Quasi-Inhouse-Lösung für Industriepartner und schließt operative Lücken in Marketing, Content und Vertrieb – ohne zusätzlichen Ressourcenaufbau auf Kundenseite.

Mehr dazu hier:

Die mobile Version verlassen