
DeepSeek-R1-0528: l'aggiornamento di DeepSeek riporta il modello di intelligenza artificiale cinese alla pari con i leader del settore occidentale – Immagine: Xpert.Digital
L'intelligenza artificiale open source è al limite: DeepSeek mette in ombra OpenAI e Google
Da 60 a 68: DeepSeek catapulta l'intelligenza artificiale cinese di nuovo in cima
La startup cinese di intelligenza artificiale DeepSeek ha raggiunto un traguardo significativo con il rilascio di DeepSeek-R1-0528 il 28 maggio 2025, ridefinendo il panorama globale dell'intelligenza artificiale. L'aggiornamento del modello di ragionamento open source dimostra notevoli miglioramenti delle prestazioni, posizionando DeepSeek per la prima volta alla pari con o3 di OpenAI e Google Gemini 2.5 Pro. È particolarmente degno di nota il fatto che queste prestazioni di punta siano ottenute a una frazione del costo e con pesi del modello completamente aperti, sollevando interrogativi fondamentali sul futuro dei sistemi di intelligenza artificiale proprietari. La piattaforma di valutazione indipendente Artificial Analysis ha assegnato al nuovo modello 68 punti, un balzo da 60 a 68 punti che corrisponde alla differenza di prestazioni tra OpenAI o1 e o3.
Correlato a questo:
- DeepSeek e Alibaba: una svolta a livello specialistico? La spinta cinese all'intelligenza artificiale nel settore sanitario
L'aggiornamento e i suoi miglioramenti tecnici
DeepSeek-R1-0528 rappresenta un miglioramento sostanziale che consente significativi miglioramenti delle prestazioni attraverso ottimizzazioni algoritmiche e un maggiore utilizzo delle risorse computazionali in fase di post-addestramento, senza alterare l'architettura sottostante. L'aggiornamento si concentra principalmente sul miglioramento delle capacità di ragionamento, consentendo, secondo DeepSeek, "processi di pensiero significativamente più profondi". Un esempio particolarmente significativo di questo miglioramento si riscontra nel test di matematica AIME 2025, dove l'accuratezza è aumentata dal 70% all'87,5%. Contemporaneamente, il numero medio di token per domanda è aumentato da 12.000 a 23.000 token, a indicare un'elaborazione più intensiva.
Oltre ai miglioramenti del ragionamento, l'aggiornamento introduce nuove importanti funzionalità, tra cui output JSON e chiamate di funzione, un'interfaccia utente ottimizzata e una riduzione delle allucinazioni. Questi miglioramenti rendono il modello significativamente più pratico per gli sviluppatori e ne ampliano notevolmente la portata. La disponibilità rimane invariata: gli utenti API esistenti riceveranno l'aggiornamento automaticamente, mentre i pesi del modello continueranno a essere disponibili con licenza aperta MIT su Hugging Face.
Prestazioni di riferimento e confronti delle prestazioni
I risultati del benchmark per DeepSeek-R1-0528 mostrano miglioramenti notevoli in tutte le categorie di valutazione. Nei compiti matematici, il punteggio AIME-2024 è aumentato dal 79,8 al 91,4%, HMMT-2025 dal 41,7 al 79,4% e CNMO-2024 dal 78,8 all'86,9%. Questi risultati posizionano il modello come uno dei sistemi di intelligenza artificiale più potenti al mondo per la risoluzione di problemi matematici.
DeepSeek-R1-0528 mostra anche progressi significativi nei benchmark di programmazione. LiveCodeBench è migliorato dal 63,5 al 73,3%, Aider-Polyglot dal 53,3 al 71,6% e SWE Verified dal 49,2 al 57,6%. Il punteggio di Codeforces è salito da 1.530 a 1.930 punti, posizionando il modello tra i migliori risolutori algoritmici di problemi. Rispetto ai modelli concorrenti, DeepSeek-R1 raggiunge il 49,2% in SWE Verified, posizionandosi appena davanti a OpenAI o1-1217 con il 48,9%, mentre in Codeforces, con 96,3 percentili e un punteggio Elo di 2.029 punti, si avvicina molto al modello leader di OpenAI.
I test di cultura generale e logica confermano l'ampio miglioramento delle prestazioni: GPQA-Diamond è aumentato dal 71,5 all'81,0%, Humanity's Last Exam dall'8,5 al 17,7%, MMLU-Pro dall'84,0 all'85,0% e MMLU-Redux dal 92,9 al 93,4%. Solo SimpleQA di OpenAI ha mostrato un leggero calo dal 30,1 al 27,8%. Questi miglioramenti complessivi dimostrano che DeepSeek-R1-0528 è competitivo non solo in aree specialistiche, ma nell'intero spettro dei compiti cognitivi.
Architettura tecnica e innovazioni
Il fondamento tecnico di DeepSeek-R1-0528 si basa su una sofisticata architettura MoE (Mixture of Experts) con 37 miliardi di parametri attivi su un totale di 671 miliardi di parametri e una lunghezza del contesto di 128.000 token. Il modello implementa un apprendimento per rinforzo avanzato per ottenere autoverifica, riflessione multistadio e capacità di ragionamento simili a quelle umane. Questa architettura consente al modello di affrontare compiti di ragionamento complessi attraverso processi di pensiero iterativo, che lo distinguono dai modelli linguistici tradizionali.
Un aspetto particolarmente innovativo è lo sviluppo di una variante distillata, DeepSeek-R1-0528-Qwen3-8B, creata distillando il processo di pensiero di DeepSeek-R1-0528 per il post-addestramento di Qwen3-8B-Base. Questa versione più piccola raggiunge prestazioni impressionanti con requisiti di risorse significativamente inferiori e funziona su GPU con 8-12 GB di VRAM. Nel test AIME 2024, il modello ha raggiunto prestazioni all'avanguardia tra i modelli open source, con un miglioramento del 10% rispetto a Qwen3-8B e prestazioni paragonabili a Qwen3-235B-Thinking.
La metodologia di sviluppo mostra che DeepSeek si affida sempre più al post-addestramento con apprendimento per rinforzo, il che ha portato a un aumento del 40% del consumo di token durante la valutazione, da 71 a 99 milioni di token. Ciò suggerisce che il modello sta generando risposte più lunghe e approfondite senza richiedere modifiche strutturali fondamentali.
Posizione di mercato e dinamiche competitive
DeepSeek-R1-0528 si sta affermando come un serio concorrente dei principali modelli proprietari delle aziende tecnologiche occidentali. Secondo Artificial Analysis, il modello ha ottenuto 68 punti, posizionandosi alla pari con Gemini 2.5 Pro di Google e davanti a modelli come Grok 3 mini di xAI, Llama 4 Maverick di Meta e Nemotron Ultra di Nvidia. Nella categoria codice, DeepSeek-R1-0528 si posiziona appena al di sotto di o4-mini e o3 di OpenAI.
Il rilascio dell'aggiornamento ha avuto un impatto significativo sul panorama globale dell'intelligenza artificiale. Il rilascio iniziale di DeepSeek-R1 nel gennaio 2025 aveva già causato un crollo dei titoli tecnologici al di fuori della Cina e messo in discussione l'assunto secondo cui scalare l'intelligenza artificiale richiedesse un'enorme potenza di calcolo e investimenti. I concorrenti occidentali hanno risposto rapidamente: Google ha introdotto tariffe di accesso scontate per Gemini, mentre OpenAI ha abbassato i prezzi e introdotto un modello o3 Mini che richiede meno potenza di calcolo.
È interessante notare che le analisi dello stile del testo di EQBench mostrano che lo stile di DeepSeek-R1 è più fortemente influenzato da Google che da OpenAI, suggerendo che nel suo sviluppo potrebbero essere stati utilizzati più output sintetici di Gemini. Questa osservazione sottolinea la complessità delle influenze e dei trasferimenti tecnologici tra i diversi sviluppatori di intelligenza artificiale.
Efficienza dei costi e disponibilità
Un vantaggio competitivo chiave di DeepSeek-R1-0528 risiede nella sua eccezionale efficienza in termini di costi. La sua struttura tariffaria è significativamente più favorevole rispetto a quella di OpenAI: i token di input costano 0,14 dollari per milione di token per i cache hit e 0,55 dollari per i cache miss, mentre i token di output costano 2,19 dollari per milione di token. In confronto, OpenAI o1 addebita 15 dollari per i token di input e 60 dollari per i token di output per milione, rendendo DeepSeek-R1 più economico del 90-95%.
Microsoft Azure offre anche DeepSeek-R1 a prezzi competitivi: la versione globale costa 0,00135 dollari per i token di input e 0,0054 dollari per i token di output ogni 1.000 token, mentre la versione regionale ha prezzi leggermente più alti. Questo prezzo rende il modello particolarmente interessante per aziende e sviluppatori che desiderano sfruttare funzionalità di intelligenza artificiale di alta qualità senza gli elevati costi delle soluzioni proprietarie.
La sua disponibilità come modello open source con licenza MIT ne consente anche l'uso commerciale e la modifica senza costi di licenza. Gli sviluppatori possono eseguire il modello localmente o utilizzarlo tramite diverse API, offrendo flessibilità e controllo sull'implementazione. Per gli utenti con risorse limitate, è disponibile una versione ridotta da 8 miliardi di parametri, eseguibile su hardware consumer con 24 GB di memoria.
Correlato a questo:
Il recupero dell'intelligenza artificiale in Cina: cosa significa il successo di DeepSeek
DeepSeek-R1-0528 segna una svolta nello sviluppo globale dell'intelligenza artificiale, dimostrando che le aziende cinesi possono sviluppare modelli in grado di competere con i migliori sistemi occidentali nonostante le restrizioni all'esportazione imposte dagli Stati Uniti. L'aggiornamento dimostra che è possibile ottenere significativi miglioramenti delle prestazioni senza modifiche strutturali sostanziali, quando le ottimizzazioni post-addestramento e l'apprendimento per rinforzo vengono efficacemente impiegati. La combinazione di prestazioni ottimali, costi drasticamente ridotti e disponibilità open source sfida radicalmente i modelli di business consolidati nel settore dell'intelligenza artificiale.
Le reazioni dei concorrenti occidentali al successo di DeepSeek stanno già mostrando i primi cambiamenti di mercato: riduzioni di prezzo da parte di OpenAI e Google, nonché lo sviluppo di modelli più efficienti in termini di risorse. Con l'uscita prevista di DeepSeek-R2, originariamente prevista per maggio 2025, questa pressione competitiva potrebbe intensificarsi ulteriormente. Il successo di DeepSeek-R1-0528 dimostra che l'innovazione nell'intelligenza artificiale non richiede necessariamente ingenti investimenti e risorse di calcolo, ma può essere ottenuta attraverso algoritmi intelligenti e metodi di sviluppo efficienti.
Correlato a questo:
Il tuo esperto del settore della trasformazione dell'IA, dell'integrazione dell'IA e della piattaforma di IA
☑️ La nostra lingua aziendale è l'inglese o il tedesco
☑️ NOVITÀ: Corrispondenza nella tua lingua madre!
Io e il mio team saremo lieti di essere a tua disposizione come tuo consulente personale.
Puoi contattarmi compilando il modulo di contatto qui wolfenstein@xpert.digital:o semplicemente chiamandomi al numero +49 7348 4088 965. Il mio indirizzo email è
Non vedo l'ora di iniziare il nostro progetto comune.

