DeepSeek-R1-0528: DeepSeek-opdateringen bringer den kinesiske AI-model tilbage på niveau med vestlige brancheledere

Udgivet den: 31. maj 2025 / Opdateret den: 31. maj 2025 – Forfatter: Konrad Wolfenstein

DeepSeek-R1-0528: DeepSeek-opdatering bringer den kinesiske AI-model tilbage på niveau med vestlige brancheledere – Billede: Xpert.Digital

Open source AI på sit grænse: DeepSeek overskygger OpenAI og Google

Fra 60 til 68: DeepSeek katapulterer kinesisk kunstig intelligens tilbage til toppen

Den kinesiske AI-startup DeepSeek nåede en betydelig milepæl med udgivelsen af DeepSeek-R1-0528 den 28. maj 2025, hvilket redefinerede det globale AI-landskab. Opdateringen til open source-ræsonnementsmodellen demonstrerer dramatiske forbedringer af ydeevnen og placerer DeepSeek for første gang på niveau med OpenAIs o3 og Google Gemini 2.5 Pro. Særligt bemærkelsesværdigt er det, at denne maksimale ydeevne opnås til en brøkdel af prisen og med fuldstændig åbne modelvægte, hvilket rejser fundamentale spørgsmål om fremtiden for proprietære AI-systemer. Den uafhængige vurderingsplatform Artificial Analysis gav den nye model 68 point – et spring fra 60 til 68 point, der svarer til forskellen i ydeevne mellem OpenAI o1 og o3.

Relateret til dette:

DeepSeek og Alibaba: Et gennembrud på specialistniveau? Det kinesiske AI-fremstød inden for sundhedsvæsenet

Opdateringen og dens tekniske forbedringer

DeepSeek-R1-0528 repræsenterer en betydelig forbedring, der opnår betydelige forbedringer af ydeevnen gennem algoritmiske optimeringer og øget brug af beregningsressourcer i efteruddannelsen uden at ændre den underliggende arkitektur. Opdateringen fokuserer primært på at forbedre ræsonnementsevner, hvilket ifølge DeepSeek muliggør "væsentligt dybere tænkeprocesser". Et særligt imponerende eksempel på denne forbedring ses i AIME 2025 matematiktesten, hvor nøjagtigheden steg fra 70 procent til 87,5 procent. Samtidig steg det gennemsnitlige antal tokens pr. spørgsmål fra 12.000 til 23.000 tokens, hvilket indikerer mere intensiv behandling.

Ud over forbedringer af ræsonnement introducerer opdateringen vigtige nye funktioner, herunder JSON-output og funktionskald, en optimeret brugergrænseflade og færre hallucinationer. Disse forbedringer gør modellen betydeligt mere praktisk for udviklere og udvider dens omfang betydeligt. Tilgængeligheden forbliver uændret: Eksisterende API-brugere vil modtage opdateringen automatisk, mens modelvægtene fortsat vil være tilgængelige under den åbne MIT-licens på Hugging Face.

Benchmark-ydeevne og ydeevnesammenligninger

Benchmarkresultaterne for DeepSeek-R1-0528 viser imponerende forbedringer på tværs af alle evalueringskategorier. I matematiske opgaver steg AIME-2024-scoren fra 79,8 til 91,4 procent, HMMT-2025 fra 41,7 til 79,4 procent og CNMO-2024 fra 78,8 til 86,9 procent. Disse resultater positionerer modellen som et af de mest kraftfulde AI-systemer til matematisk problemløsning på verdensplan.

DeepSeek-R1-0528 viser også betydelige fremskridt i programmeringsbenchmarks. LiveCodeBench forbedredes fra 63,5 til 73,3 procent, Aider-Polyglot fra 53,3 til 71,6 procent, og SWE Verified fra 49,2 til 57,6 procent. Codeforces-vurderingen steg fra 1.530 til 1.930 point, hvilket placerede modellen blandt de bedste algoritmiske problemløsere. Sammenlignet med konkurrerende modeller opnår DeepSeek-R1 49,2 procent i SWE Verified, hvilket placerer den lige foran OpenAI o1-1217 med 48,9 procent, mens den i Codeforces, med 96,3 percentiler og en Elo-vurdering på 2.029 point, kommer meget tæt på OpenAIs førende model.

Generelle videns- og logiktests bekræfter den brede forbedring af ydeevnen: GPQA-Diamond steg fra 71,5 til 81,0 procent, Humanity's Last Exam fra 8,5 til 17,7 procent, MMLU-Pro fra 84,0 til 85,0 procent og MMLU-Redux fra 92,9 til 93,4 procent. Kun OpenAI's SimpleQA viste et lille fald fra 30,1 til 27,8 procent. Disse omfattende forbedringer viser, at DeepSeek-R1-0528 er konkurrencedygtig ikke kun inden for specialiserede områder, men på tværs af hele spektret af kognitive opgaver.

Teknisk arkitektur og innovationer

Det tekniske fundament for DeepSeek-R1-0528 er baseret på en sofistikeret MoE (Mixture of Experts) arkitektur med 37 milliarder aktive parametre ud af i alt 671 milliarder parametre og en kontekstlængde på 128.000 tokens. Modellen implementerer avanceret forstærkningslæring for at opnå selvverifikation, flertrinsrefleksion og menneskelignende ræsonnementsevner. Denne arkitektur gør det muligt for modellen at håndtere komplekse ræsonnementsopgaver gennem iterative tænkningsprocesser, hvilket adskiller den fra traditionelle sprogmodeller.

Et særligt innovativt aspekt er udviklingen af en destilleret variant, DeepSeek-R1-0528-Qwen3-8B, som blev skabt ved at destillere tankeprocessen bag DeepSeek-R1-0528 til post-training af Qwen3-8B-Base. Denne mindre version opnår imponerende ydeevne med betydeligt lavere ressourcekrav og kører på GPU'er med 8-12 GB VRAM. I AIME 2024-testen opnåede modellen den nyeste ydeevne blandt open source-modeller, med en forbedring på 10 procent i forhold til Qwen3-8B og sammenlignelig ydeevne med Qwen3-235B-Thinking.

Udviklingsmetoden viser, at DeepSeek i stigende grad er afhængig af eftertræning med forstærkningslæring, hvilket førte til en stigning på 40% i tokenforbruget under evalueringen – fra 71 til 99 millioner tokens. Dette tyder på, at modellen genererer længere og dybere svar uden at kræve grundlæggende arkitektoniske ændringer.

Markedsposition og konkurrencedynamik

DeepSeek-R1-0528 er ved at etablere sig som en seriøs konkurrent til de førende proprietære modeller fra vestlige teknologivirksomheder. Ifølge Artificial Analysis scorer modellen 68 point, hvilket placerer den på niveau med Googles Gemini 2.5 Pro og foran modeller som xAI's Grok 3 mini, Metas Llama 4 Maverick og Nvidias Nemotron Ultra. I kodekategorien opnår DeepSeek-R1-0528 et niveau lige under OpenAI's o4-mini og o3.

Udgivelsen af opdateringen har haft en betydelig indflydelse på det globale AI-landskab. Den første udgivelse af DeepSeek-R1 i januar 2025 førte allerede til et fald i teknologiaktier uden for Kina og udfordrede antagelsen om, at skalering af AI kræver enorm computerkraft og investeringer. Vestlige konkurrenter reagerede hurtigt: Google introducerede nedsatte adgangspriser for Gemini, mens OpenAI sænkede priserne og introducerede en o3 Mini-model, der kræver mindre computerkraft.

Interessant nok viser tekststilanalyser fra EQBench, at DeepSeek-R1's stil er stærkere påvirket af Google end af OpenAI, hvilket tyder på, at der muligvis er blevet brugt mere syntetisk Gemini-output i udviklingen. Denne observation understreger de komplekse påvirkninger og teknologioverførsler mellem forskellige AI-udviklere.

Omkostningseffektivitet og tilgængelighed

En vigtig konkurrencefordel ved DeepSeek-R1-0528 ligger i dens exceptionelle omkostningseffektivitet. Dens prisstruktur er betydeligt mere fordelagtig end OpenAIs: Input-tokens koster $0,14 pr. million tokens for cache-hits og $0,55 for cache-misses, mens output-tokens koster $2,19 pr. million tokens. Til sammenligning opkræver OpenAI o1 $15 for input-tokens og $60 for output-tokens pr. million, hvilket gør DeepSeek-R1 90-95 procent billigere.

Microsoft Azure tilbyder også DeepSeek-R1 til konkurrencedygtige priser: Den globale version koster $0,00135 for input-tokens og $0,0054 for output-tokens pr. 1.000 tokens, mens den regionale version har lidt højere priser. Denne prisfastsættelse gør modellen særligt attraktiv for virksomheder og udviklere, der ønsker at udnytte AI-funktionaliteter af høj kvalitet uden de høje omkostninger ved proprietære løsninger.

Dens tilgængelighed som en open source-model under MIT-licensen muliggør også kommerciel brug og modifikation uden licensgebyrer. Udviklere kan køre modellen lokalt eller bruge den via forskellige API'er, hvilket giver fleksibilitet og kontrol over implementeringen. For brugere med begrænsede ressourcer er en destilleret version med 8 milliarder parametre tilgængelig, som kører på forbrugerhardware med 24 GB hukommelse.

Relateret til dette:

Kinas indhentning inden for kunstig intelligens: DeepSeek-sagen og den strategiske brug af data

Kinas AI-indhentning: Hvad DeepSeeks succes betyder

DeepSeek-R1-0528 markerer et vendepunkt i den globale AI-udvikling og demonstrerer, at kinesiske virksomheder kan udvikle modeller, der konkurrerer med de bedste vestlige systemer på trods af amerikanske eksportrestriktioner. Opdateringen beviser, at betydelige forbedringer af ydeevnen er mulige uden grundlæggende arkitekturændringer, når optimeringer efter træning og reinforcement learning anvendes effektivt. Kombinationen af toppræstation, drastisk reducerede omkostninger og tilgængelighed af open source udfordrer fundamentalt etablerede forretningsmodeller i AI-branchen.

Vestlige konkurrenters reaktioner på DeepSeeks succes viser allerede indledende markedsændringer: prisreduktioner fra OpenAI og Google, samt udvikling af mere ressourceeffektive modeller. Med den forventede udgivelse af DeepSeek-R2, oprindeligt planlagt til maj 2025, kan dette konkurrencepres intensiveres yderligere. Succeshistorien om DeepSeek-R1-0528 illustrerer, at innovation inden for AI ikke nødvendigvis kræver massive investeringer og computerressourcer, men kan opnås gennem smarte algoritmer og effektive udviklingsmetoder.

Relateret til dette:

Din ekspert i AI-transformation, AI-integration og AI-platformbranchen

☑️ Vores forretningssprog er engelsk eller tysk

☑️ NYT: Korrespondance på dit modersmål!

Konrad Wolfenstein

Jeg og mit team er glade for at stå til rådighed for dig som din personlige rådgiver.

Du kan kontakte mig ved at udfylde kontaktformularen her eller blot ringe til mig på +49 89 89 674 804 ( München) . Min e-mailadresse er: [email protected]

Jeg glæder mig til vores fælles projekt.