Website-icoon Xpert.Digital

DeepSeek-R1-0528: DeepSeek-update brengt Chinees AI-model weer op hetzelfde niveau als westerse marktleiders

DeepSeek-R1-0528: DeepSeek-update brengt Chinees AI-model weer op hetzelfde niveau als westerse marktleiders

DeepSeek-R1-0528: DeepSeek-update brengt Chinees AI-model weer op hetzelfde niveau als westerse marktleiders – Afbeelding: Xpert.Digital

Open-source AI op zijn limiet: DeepSeek overschaduwt OpenAI en Google

Van 60 naar 68: DeepSeek katapulteert Chinese AI terug naar de top

De Chinese AI-startup DeepSeek bereikte een belangrijke mijlpaal met de release van DeepSeek-R1-0528 op 28 mei 2025, waarmee het wereldwijde AI-landschap opnieuw werd gedefinieerd. De update van het open-source redeneermodel laat dramatische prestatieverbeteringen zien, waardoor DeepSeek voor het eerst op gelijke voet staat met OpenAI's o3 en Google Gemini 2.5 Pro. Bijzonder opmerkelijk is dat deze topprestaties worden bereikt tegen een fractie van de kosten en met volledig open modelgewichten, wat fundamentele vragen oproept over de toekomst van propriëtaire AI-systemen. Het onafhankelijke beoordelingsplatform Artificial Analysis gaf het nieuwe model 68 punten – een sprong van 60 naar 68 punten, wat overeenkomt met het prestatieverschil tussen OpenAI o1 en o3.

Dit is hiermee gerelateerd:

De update en de bijbehorende technische verbeteringen

DeepSeek-R1-0528 vertegenwoordigt een substantiële verbetering die aanzienlijke prestatieverbeteringen oplevert door middel van algoritmische optimalisaties en een intensiever gebruik van rekenkracht na de training, zonder de onderliggende architectuur te wijzigen. De update richt zich voornamelijk op het verbeteren van de redeneermogelijkheden, waardoor volgens DeepSeek "aanzienlijk diepere denkprocessen" mogelijk worden. Een bijzonder indrukwekkend voorbeeld van deze verbetering is te zien in de AIME 2025 wiskundetoets, waar de nauwkeurigheid steeg van 70 procent naar 87,5 procent. Tegelijkertijd nam het gemiddelde aantal tokens per vraag toe van 12.000 naar 23.000 tokens, wat wijst op een intensievere verwerking.

Naast verbeteringen in de redenering introduceert de update belangrijke nieuwe functionaliteiten, waaronder JSON-uitvoer en functieaanroepen, een geoptimaliseerde gebruikersinterface en minder hallucinaties. Deze verbeteringen maken het model aanzienlijk praktischer voor ontwikkelaars en vergroten de toepassingsmogelijkheden aanzienlijk. De beschikbaarheid blijft ongewijzigd: bestaande API-gebruikers ontvangen de update automatisch, terwijl de modelgewichten beschikbaar blijven onder de open MIT-licentie op Hugging Face.

Benchmarkprestaties en prestatievergelijkingen

De benchmarkresultaten voor DeepSeek-R1-0528 laten indrukwekkende verbeteringen zien in alle evaluatiecategorieën. Bij wiskundige taken steeg de AIME-2024-score van 79,8 naar 91,4 procent, de HMMT-2025-score van 41,7 naar 79,4 procent en de CNMO-2024-score van 78,8 naar 86,9 procent. Deze resultaten positioneren het model als een van de krachtigste AI-systemen voor het oplossen van wiskundige problemen ter wereld.

DeepSeek-R1-0528 laat ook aanzienlijke vooruitgang zien in programmeerbenchmarks. LiveCodeBench verbeterde van 63,5 naar 73,3 procent, Aider-Polyglot van 53,3 naar 71,6 procent en SWE Verified van 49,2 naar 57,6 procent. De Codeforces-score steeg van 1530 naar 1930 punten, waarmee het model zich schaart onder de beste algoritmische probleemoplossers. Vergeleken met concurrerende modellen behaalt DeepSeek-R1 49,2 procent in SWE Verified, net voor OpenAI o1-1217 met 48,9 procent, terwijl het in Codeforces met 96,3 percentiel en een Elo-score van 2029 punten zeer dicht in de buurt komt van het toonaangevende model van OpenAI.

Algemene kennis- en logica-tests bevestigen de brede prestatieverbetering: GPQA-Diamond steeg van 71,5 naar 81,0 procent, Humanity's Last Exam van 8,5 naar 17,7 procent, MMLU-Pro van 84,0 naar 85,0 procent en MMLU-Redux van 92,9 naar 93,4 procent. Alleen OpenAI's SimpleQA liet een lichte daling zien van 30,1 naar 27,8 procent. Deze algehele verbeteringen tonen aan dat DeepSeek-R1-0528 niet alleen concurrerend is op gespecialiseerde gebieden, maar over het hele spectrum van cognitieve taken.

Technische architectuur en innovaties

De technische basis van DeepSeek-R1-0528 is gebaseerd op een geavanceerde MoE-architectuur (Mixture of Experts) met 37 miljard actieve parameters van de in totaal 671 miljard parameters en een contextlengte van 128.000 tokens. Het model implementeert geavanceerd reinforcement learning om zelfverificatie, reflectie in meerdere fasen en mensachtige redeneermogelijkheden te bereiken. Deze architectuur stelt het model in staat complexe redeneertaken aan te pakken door middel van iteratieve denkprocessen, wat het onderscheidt van traditionele taalmodellen.

Een bijzonder innovatief aspect is de ontwikkeling van een vereenvoudigde variant, DeepSeek-R1-0528-Qwen3-8B, die is ontstaan ​​door het denkproces van DeepSeek-R1-0528 te distilleren voor de post-training van Qwen3-8B-Base. Deze kleinere versie behaalt indrukwekkende prestaties met aanzienlijk lagere resourcevereisten en draait op GPU's met 8-12 GB VRAM. In de AIME 2024-test behaalde het model state-of-the-art prestaties onder open-source modellen, met een verbetering van 10 procent ten opzichte van Qwen3-8B en vergelijkbare prestaties als Qwen3-235B-Thinking.

De ontwikkelingsmethodologie laat zien dat DeepSeek steeds meer gebruikmaakt van nabewerking met behulp van reinforcement learning, wat leidde tot een toename van 40% in tokenverbruik tijdens de evaluatie – van 71 naar 99 miljoen tokens. Dit suggereert dat het model langere en diepere antwoorden genereert zonder dat fundamentele architectuurwijzigingen nodig zijn.

Marktpositie en concurrentiedynamiek

DeepSeek-R1-0528 profileert zich als een serieuze concurrent voor de toonaangevende propriëtaire modellen van westerse technologiebedrijven. Volgens Artificial Analysis behaalt het model een score van 68 punten, waarmee het op gelijke hoogte staat met Google's Gemini 2.5 Pro en voorloopt op modellen zoals xAI's Grok 3 mini, Meta's Llama 4 Maverick en Nvidia's Nemotron Ultra. In de categorie code behaalt DeepSeek-R1-0528 een niveau net onder dat van OpenAI's o4-mini en o3.

De release van de update heeft een aanzienlijke impact gehad op het wereldwijde AI-landschap. De eerste release van DeepSeek-R1 in januari 2025 leidde al tot een daling van technologieaandelen buiten China en zette vraagtekens bij de aanname dat het opschalen van AI enorme rekenkracht en investeringen vereist. Westerse concurrenten reageerden snel: Google introduceerde gereduceerde toegangstarieven voor Gemini, terwijl OpenAI de prijzen verlaagde en een o3 Mini-model introduceerde dat minder rekenkracht vereist.

Interessant genoeg laten tekststijlanalyses van EQBench zien dat de stijl van DeepSeek-R1 sterker beïnvloed is door Google dan door OpenAI, wat suggereert dat er mogelijk meer synthetische Gemini-uitvoer is gebruikt bij de ontwikkeling ervan. Deze observatie onderstreept de complexe invloeden en technologieoverdracht tussen verschillende AI-ontwikkelaars.

Kostenefficiëntie en beschikbaarheid

Een belangrijk concurrentievoordeel van DeepSeek-R1-0528 is de uitzonderlijke kostenefficiëntie. De prijsstructuur is aanzienlijk gunstiger dan die van OpenAI: Input-tokens kosten $0,14 per miljoen tokens voor cache-hits en $0,55 voor cache-misses, terwijl Output-tokens $2,19 per miljoen tokens kosten. Ter vergelijking: OpenAI rekent $15 voor Input-tokens en $60 voor Output-tokens per miljoen, waardoor DeepSeek-R1 90-95 procent goedkoper is.

Microsoft Azure biedt DeepSeek-R1 ook aan tegen concurrerende prijzen: de wereldwijde versie kost $0,00135 voor invoertokens en $0,0054 voor uitvoertokens per 1.000 tokens, terwijl de regionale versie iets duurder is. Deze prijsstelling maakt het model bijzonder aantrekkelijk voor bedrijven en ontwikkelaars die gebruik willen maken van hoogwaardige AI-functionaliteiten zonder de hoge kosten van propriëtaire oplossingen.

Doordat het model als open-source beschikbaar is onder de MIT-licentie, is commercieel gebruik en aanpassing zonder licentiekosten mogelijk. Ontwikkelaars kunnen het model lokaal uitvoeren of via verschillende API's gebruiken, wat flexibiliteit en controle over de implementatie biedt. Voor gebruikers met beperkte middelen is een vereenvoudigde versie met 8 miljard parameters beschikbaar, die draait op consumentenhardware met 24 GB geheugen.

Dit is hiermee gerelateerd:

China's inhaalslag op het gebied van AI: wat betekent het succes van DeepSeek?

DeepSeek-R1-0528 markeert een keerpunt in de wereldwijde ontwikkeling van AI en laat zien dat Chinese bedrijven modellen kunnen ontwikkelen die kunnen concurreren met de beste westerse systemen, ondanks Amerikaanse exportbeperkingen. De update bewijst dat aanzienlijke prestatieverbeteringen mogelijk zijn zonder fundamentele architectuurwijzigingen, mits post-trainingsoptimalisaties en reinforcement learning effectief worden toegepast. De combinatie van topprestaties, drastisch lagere kosten en open-source beschikbaarheid daagt gevestigde bedrijfsmodellen in de AI-industrie fundamenteel uit.

De reacties van westerse concurrenten op het succes van DeepSeek laten al de eerste veranderingen in de markt zien: prijsverlagingen van OpenAI en Google, en de ontwikkeling van efficiëntere modellen. Met de verwachte release van DeepSeek-R2, oorspronkelijk gepland voor mei 2025, zou deze concurrentiedruk verder kunnen toenemen. Het succesverhaal van DeepSeek-R1-0528 illustreert dat innovatie in AI niet per se enorme investeringen en computerkracht vereist, maar ook kan worden bereikt door slimme algoritmen en efficiënte ontwikkelingsmethoden.

Dit is hiermee gerelateerd:

 

Uw expert op het gebied van AI-transformatie, AI-integratie en AI-platformen

☑️ Onze zakelijke voertaal is Engels of Duits

☑️ NIEUW: Correspondentie in uw moedertaal!

 

Konrad Wolfenstein

Mijn team en ik staan ​​graag tot uw beschikking als uw persoonlijke adviseur.

U kunt contact met mij opnemen door hier het contactformulier in te vullen door mij te bellen op +49 7348 4088 965. Mijn e-mailadres is wolfenstein@xpert.digital:of

Ik kijk uit naar ons gezamenlijke project.

 

 

☑️ Ondersteuning van het MKB op het gebied van strategie, advies, planning en implementatie

☑️ Opzetten of herzien van de AI-strategie

☑️ Pionier in bedrijfsontwikkeling

Verlaat de mobiele versie