DeepSeek V3.1 – Alarm voor OpenAI & Co: Chinese open-source AI vormt nieuwe uitdagingen voor gevestigde aanbieders

Konrad Wolfenstein

10 maanden geleden

DeepSeek V3.1 – Alarm voor OpenAI & Co.: Chinese open-source AI vormt nieuwe uitdagingen voor gevestigde aanbieders – Afbeelding: Xpert.Digital

Nieuw AI-model uit China: Dit gratis model is 27 keer goedkoper en vormt een directe concurrent voor ChatGPT

### Alarm voor OpenAI & Co.: China's nieuwe AI is net zo krachtig – maar spotgoedkoop. Wat zit erachter? ### DeepSeek V3.1: De stille AI-aanval die de techwereld op zijn kop zet ### Vergeet dure AI: Waarom dit Chinese open-source model alles verandert ### China's nieuwe super-AI: Hoe Peking druk uitoefent op het Westen met een radicale vrije strategie ### Beter en goedkoper dan de concurrentie? Wat China's nieuwe wonder-AI werkelijk kan ###

DeepSeek V3.1 zorgt (opnieuw) voor een revolutie in het AI-landschap

Chinese kunstmatige intelligentie vormt een serieuze uitdaging voor Amerikaanse techreuzen. De in Hangzhou gevestigde startup DeepSeek heeft een belangrijke doorbraak bereikt met zijn nieuwste model, V3.1, dat traditionele aannames over de ontwikkeling en financiering van AI fundamenteel ter discussie stelt. Dit open-source model behaalt de prestaties van toonaangevende propriëtaire systemen tegen een fractie van de ontwikkelingskosten en wijst de weg naar een nieuwe toekomst voor kunstmatige intelligentie.

Dit is hiermee gerelateerd:

DeepSeek: China's AI-revolutie in de schaduw van surveillance – Ernstige beschuldigingen vanuit Washington

Technische innovatie met hybride architectuur

DeepSeek V3.1 is gebaseerd op een geavanceerde Mixture of Experts-architectuur met in totaal 685 miljard parameters, waarvan 37 miljard per token worden geactiveerd. Deze technologie maakt een aanzienlijk efficiënter gebruik van resources mogelijk dan traditionele modellen, zonder dat dit ten koste gaat van de prestaties.

Het meest opvallende kenmerk van het nieuwe model is de hybride inferentiearchitectuur, die kan schakelen tussen een 'denkmodus' en een 'niet-denkmodus'. In de denkmodus ontwikkelt het systeem diepere interne redeneerprocessen en is het bij uitstek geschikt voor complexe probleemoplossing die logisch denken in meerdere stappen vereist. De niet-denkmodus daarentegen levert directe en beknopte antwoorden voor taken waarbij snelheid cruciaal is.

Een andere technische vooruitgang is het uitgebreide contextvenster van 128.000 tokens, wat overeenkomt met ongeveer 96.000 woorden of twee romans van 200 pagina's. Deze capaciteit maakt de verwerking van extreem lange documenten, het begrijpen van complete code repositories en meerstaps dialoogscenario's mogelijk.

De verdere ontwikkeling werd bereikt door een tweefasige aanpak voor contextuitbreiding. De fase met 32.000 tokens werd vertienvoudigd tot 630 miljard tokens, terwijl de fase met 128.000 tokens 3,3 keer werd uitgebreid tot 209 miljard tokens. Daarnaast maakt het model gebruik van het UE8M0 FP8-dataformaat voor optimale compatibiliteit met moderne hardwarearchitecturen.

Indrukwekkende prestatieparameters en benchmarks

DeepSeek V3.1 behaalt opmerkelijke resultaten in gestandaardiseerde tests. In de gerenommeerde Aider Coding Benchmark behaalde het model een score van 71,6 procent – een score die zich kan meten met toonaangevende modellen van OpenAI en Anthropic. Deze prestatie is bijzonder indrukwekkend gezien de aanzienlijk lagere kosten.

Bij wiskundige taken overtreft DeepSeek V3.1 zelfs gevestigde concurrenten. In de Math-500-test behaalt het model 90,2 procent, terwijl GPT-4o slechts 74,6 procent haalt. In de MMLU-Pro-test verbeterde het systeem met 5,3 punten naar 81,2, en in de GPQA-benchmark met een opmerkelijke 9,3 punten naar 68,4.

Bijzonder opmerkelijk is de verbetering in meerstaps redeneertaken, waarbij versie 3.1 43 procent beter presteert dan zijn voorganger. De programmeermogelijkheden van het model stellen het in staat om foutloze code te genereren van maximaal 700 regels lang – een prestatie die kan wedijveren met dure, propriëtaire oplossingen.

Revolutionaire kostenefficiëntie

De kostenstructuur van DeepSeek V3.1 zet alle eerdere aannames over AI-ontwikkeling op zijn kop. Waar een programmeertaak met V3.1 ongeveer één dollar kost, vragen vergelijkbare systemen bijna 70 dollar voor soortgelijke taken. Deze drastische kostenverlaging maakt geavanceerde AI-technologie toegankelijk voor kleinere bedrijven en ontwikkelaars.

Volgens het bedrijf bedroegen de ontwikkelingskosten voor het onderliggende V3-model slechts ongeveer 5,6 miljoen dollar – een fractie van de honderden miljoenen dollars die Amerikaanse bedrijven uitgeven aan vergelijkbare projecten. Deze efficiëntie werd bereikt door innovatieve trainingsmethoden en het gebruik van minder krachtige, maar ook minder dure, hardware.

De API-prijzen van DeepSeek liggen aanzienlijk lager dan die van de concurrentie. Het chatmodel kost $0,07 per miljoen invoertokens voor cachehits en $1,10 per miljoen uitvoertokens. Het redeneermodel kost $0,14 voor invoertokens en $2,19 voor uitvoertokens. Ter vergelijking: OpenAI rekent ongeveer $2 tot $2,50 per miljoen uitvoertokens, terwijl DeepSeek slechts $0,014 rekent.

Strategisch belang voor de wereldwijde AI-concurrentie

De successen van DeepSeek hebben verstrekkende gevolgen voor het wereldwijde AI-landschap. Het bedrijf laat zien dat geavanceerde AI-prestaties niet langer de enorme middelen en gepatenteerde methoden vereisen die tot nu toe kenmerkend waren voor de Amerikaanse AI-ontwikkeling. Deze ontwikkeling zet de fundamenten van de huidige bedrijfsmodellen op de proef.

De Chinese leiding hecht groot strategisch belang aan DeepSeek, zoals blijkt uit de ontmoeting tussen oprichter Liang Wenfeng en premier Li Qiang. Het bedrijf wordt gezien als een sleutelcomponent in China's ambitie om tegen 2030 wereldleider te worden op het gebied van kunstmatige intelligentie.

De open-source strategie van DeepSeek stelt andere bedrijven en onderzoekers wereldwijd in staat voort te bouwen op de door DeepSeek ontwikkelde technologie en hun eigen innovaties te ontwikkelen. Dit bevordert een gedecentraliseerde ontwikkeling van AI-technologie en vermindert de afhankelijkheid van individuele techreuzen.

Achtergrond en bedrijfsstructuur

DeepSeek werd in 2023 in Hangzhou opgericht door Liang Wenfeng en wordt volledig gefinancierd door het Chinese hedgefonds High-Flyer. Wenfeng, geboren in 1985 als zoon van een basisschoollerares, ontwikkelde tijdens zijn studie aan de Zhejiang Universiteit een interesse in de toepassing van AI in de financiële sector.

In 2016 richtte Wenfeng High-Flyer op, een hedgefonds dat machine learning gebruikt voor kwantitatieve handelsstrategieën. Tegen 2021 was het bedrijf volledig overgestapt op AI-gestuurde handelsmethoden en uitgegroeid tot een van China's toonaangevende kwantitatieve fondsen met meer dan 100 miljard RMB aan beheerd vermogen.

Nog voordat hij DeepSeek oprichtte, begon Wenfeng al met het kopen van duizenden Nvidia GPU's – aanvankelijk bespot als de excentrieke hobby van een miljardair. Deze vooruitziende investering in hardware stelde het bedrijf later in staat om concurrerende AI-modellen te ontwikkelen, ondanks de Amerikaanse exportbeperkingen.

EU/DE-gegevensbeveiliging | Integratie van een onafhankelijk en data-overkoepelend AI-platform voor alle zakelijke behoeften

Onafhankelijke AI-platformen als strategisch alternatief voor Europese bedrijven - Afbeelding: Xpert.Digital

Een gamechanger voor AI: het meest flexibele AI-platform - oplossingen op maat die kosten verlagen, uw besluitvorming verbeteren en de efficiëntie verhogen

Onafhankelijk AI-platform: integreert alle relevante bedrijfsgegevensbronnen

Snelle AI-integratie: op maat gemaakte AI-oplossingen voor bedrijven in uren of dagen, in plaats van maanden
Flexibele infrastructuur: cloudgebaseerd of hosting in uw eigen datacenter (Duitsland, Europa, vrije locatiekeuze)

Maximale gegevensbeveiliging: het gebruik ervan in advocatenkantoren is daar het onweerlegbare bewijs van
Implementatie over een breed scala aan bedrijfsgegevensbronnen
Keuze uit eigen of andere AI-modellen (DE, EU, VS, CN)

Meer informatie vindt u hier:

Onafhankelijke AI-platforms versus hyperscalers: welke oplossing is de juiste?

Chips, algoritmes, innovatie: DeepSeeks weg naar de wereldtop

Impact van Amerikaanse exportcontroles

Het succes van DeepSeek is bijzonder opmerkelijk gezien de Amerikaanse exportbeperkingen op hoogwaardige AI-chips naar China. De sancties waren bedoeld om China's mogelijkheden om geavanceerde AI-systemen te ontwikkelen te beperken, maar DeepSeek laat zien dat innovatieve softwarebenaderingen en efficiënt gebruik van middelen deze beperkingen kunnen overwinnen.

Het bedrijf gebruikte minder krachtige H800-chips, die weliswaar zijn goedgekeurd voor export naar China, maar behaalde desondanks topprestaties dankzij geoptimaliseerde algoritmes en efficiënte trainingsmethoden. Deze aanpak stelt de effectiviteit van technologische sancties ter discussie en toont alternatieve wegen voor de ontwikkeling van AI.

Experts zien de doorbraak van DeepSeek als een keerpunt dat de bestaande inschattingen van de AI-capaciteiten en het potentieel van China fundamenteel zou kunnen veranderen. De ontwikkeling suggereert dat innovaties in softwareoptimalisatie wellicht belangrijker zijn dan louter superieure hardware.

Dit is hiermee gerelateerd:

China's inhaalslag op het gebied van kunstmatige intelligentie: de DeepSeek-zaak en het strategisch gebruik van data

Open source als concurrentievoordeel

De open-source strategie van DeepSeek biedt diverse strategische voordelen. Ontwikkelaars en bedrijven wereldwijd kunnen het model lokaal uitvoeren, aanpassen en integreren in hun eigen projecten, zonder afhankelijk te zijn van clouddiensten. Dit is met name belangrijk voor datagevoelige applicaties en bedrijven die de controle over hun informatie willen behouden.

Ontwikkeling op basis van de community maakt snellere bugfixes, continue verbeteringen en een brede basis van bijdragers mogelijk. Tegelijkertijd democratiseert de open-sourcebenadering de toegang tot geavanceerde AI-technologie en bevordert het innovatie, ook in kleinere bedrijven en ontwikkelingslanden.

In tegenstelling tot propriëtaire modellen die alleen toegankelijk zijn via API's of cloudplatformen, biedt open-source AI beschikbaarheid op de lange termijn en onafhankelijkheid van individuele leveranciers. Gebruikers hoeven zich geen zorgen te maken over prijsverhogingen, toegangsbeperkingen of het stopzetten van diensten.

Technologische doorbraken en innovaties

DeepSeek V3.1 integreert diverse baanbrekende technologieën die de uitzonderlijke efficiëntie mogelijk maken. De multi-head Latent Attention-architectuur comprimeert key-value caches met behulp van latente vectoren, waardoor het geheugenverbruik en de rekenoverhead tijdens inferentie worden verminderd.

De multi-token voorspellingsmethode maakt het mogelijk dat elk token meerdere toekomstige tokens tegelijk voorspelt. Dit overkomt een belangrijk knelpunt van traditionele autoregressieve modellen en verbetert zowel de nauwkeurigheid als de inferentiesnelheid.

Het gebruik van 8-bits training vermindert de geheugenvereisten en kosten aanzienlijk zonder dat dit ten koste gaat van de nauwkeurigheid. Deze techniek werd lange tijd als problematisch beschouwd, maar DeepSeek laat zien dat, mits correct geïmplementeerd, de resultaten vergelijkbaar zijn met die van traditionele methoden.

Marktreacties en -effecten

De aankondiging van DeepSeek V3.1 leidde tot een heftige reactie op de financiële markten. Nvidia verloor meer dan 600 miljard dollar aan marktwaarde – het grootste verlies in één klap in de geschiedenis van de Amerikaanse aandelenmarkt. Ook andere bedrijven die AI-hardware produceren, zagen hun aandelenkoersen aanzienlijk dalen.

Investeerders en analisten herzien hun beoordelingen van de AI-industrie. De aanname dat enorme investeringen in hardware en eigen ontwikkeling noodzakelijke voorwaarden zijn voor geavanceerde AI, wordt door het succes van DeepSeek op de proef gesteld.

Westerse bedrijven testen DeepSeek-modellen al in hun workflows. Een prominent voorbeeld is Merck, waarvan de Chief Data Officer publiekelijk de integratie van DeepSeek demonstreerde als een van de verschillende AI-opties in interne processen.

Toekomstige ontwikkelingen en vooruitzichten

DeepSeek positioneert versie 3.1 als de eerste stap naar het 'agenttijdperk' van AI. Het model is specifiek geoptimaliseerd voor verbeterd gebruik van tools en meerstaps agenttaken. De optimalisaties na de training hebben geleid tot aanzienlijke verbeteringen in het gebruik van externe tools en complexe zoekopdrachten.

De ontwikkelingssnelheid van DeepSeek suggereert dat een V4-model mogelijk eerder wordt uitgebracht dan de volgende R2-versie van OpenAI. Deze dynamiek zou de traditionele ontwikkelingscycli in de AI-industrie kunnen versnellen en nieuwe normen stellen voor de frequentie van updates.

De successen van DeepSeek inspireren nu al andere Chinese AI-bedrijven en onderzoekers wereldwijd. Open-source modellen worden steeds vaker gezien als een volwaardig alternatief voor propriëtaire oplossingen, wat kan leiden tot een meer gediversifieerd en concurrerend AI-landschap.

Uitdagingen en kritiekpunten

Ondanks de indrukwekkende prestaties heeft DeepSeek ook kritiek gekregen. Net als andere Chinese AI-modellen is DeepSeek onderworpen aan bepaalde censuurmaatregelen, die van toepassing kunnen zijn op politiek gevoelige onderwerpen. Deze beperkingen kunnen echter vaak worden omzeild door technische aanpassingen.

De transparantie met betrekking tot trainingsdata en -methoden is beperkt. Er wordt gespeculeerd dat de training deels gebaseerd is op reacties van ChatGPT, aangezien DeepSeek zich soms voordoet als ChatGPT zelf. Deze onduidelijkheden roepen vragen op over originaliteit en mogelijke auteursrechtkwesties.

De snelle ontwikkeling en lage prijs van deepseeking-modellen roepen ook vragen op over de duurzaamheid van het bedrijfsmodel. Critici vragen zich af of de extreem lage prijzen op de lange termijn kunnen worden gehandhaafd of dat ze onderdeel zijn van een strategische marktpenetratiestrategie.

Wereldwijde implicaties voor de AI-industrie

DeepSeek V3.1 markeert een keerpunt in de wereldwijde ontwikkeling van AI. Het model bewijst dat innovatieve softwarebenaderingen en efficiënt gebruik van resources belangrijker kunnen zijn dan enorme kapitaalinvesteringen en toegang tot de nieuwste hardware. Deze bevinding zal de strategieën van alle grote AI-bedrijven beïnvloeden.

De democratisering van geavanceerde AI-technologie via open-sourcemodellen zou kunnen leiden tot een gelijkmatigere verdeling van AI-capaciteiten wereldwijd. Landen en bedrijven die voorheen werden uitgesloten door hoge kosten of technische belemmeringen, zouden toegang krijgen tot de allernieuwste technologie.

Tegelijkertijd zet het succes van DeepSeek vraagtekens bij de effectiviteit van technologische sancties en exportcontroles. Het vermogen van het bedrijf om met beperkte middelen prestaties van wereldklasse te bereiken, zou andere landen kunnen aanmoedigen om soortgelijke benaderingen te volgen en hun eigen AI-ecosystemen te ontwikkelen.

DeepSeek V3.1 is meer dan zomaar een nieuw AI-model; het symboliseert een fundamentele verschuiving in de manier waarop AI wordt ontwikkeld, gefinancierd en ingezet. De combinatie van technologische innovatie, kosteneffectieve ontwikkeling en open-source beschikbaarheid creëert nieuwe mogelijkheden en vormt een serieuze uitdaging voor gevestigde marktleiders. Toekomstige ontwikkelingen zullen uitwijzen of deze aanpak de toekomst van de AI-industrie zal bepalen.

Wij staan voor u klaar - Advies - Planning - Implementatie - Projectmanagement

☑️ Ondersteuning van het MKB op het gebied van strategie, advies, planning en implementatie

☑️ Opzetten of herzien van de AI-strategie

☑️ Pionier in bedrijfsontwikkeling

Konrad Wolfenstein

Ik sta graag tot uw beschikking als uw persoonlijke adviseur.

U kunt contact met mij opnemen door onderstaand contactformulier in te vullen of mij te bellen op +49 7348 4088 965 .

Ik kijk uit naar ons gezamenlijke project.

Schrijf me

➡️ Verzoek om videogesprek 👩👱

Xpert.Digital - Konrad Wolfenstein

Xpert.Digital is een platform voor de industrie, gericht op digitalisering, werktuigbouwkunde, logistiek/intralogistiek en fotovoltaïsche energie.

Met onze 360°-oplossing voor bedrijfsontwikkeling ondersteunen we gerenommeerde bedrijven van acquisitie tot aftersales.

Marktinformatie, social media marketing, marketingautomatisering, contentontwikkeling, PR, mailcampagnes, gepersonaliseerde social media en lead nurturing behoren tot onze digitale tools.

Meer informatie vindt u op: www.xpert.digital - www.xpert.solar - www.xpert.plus

Blijf in contact