Icona del sito web Xpert.Digital

Cina e DeepSeek | Intelligenza artificiale: come una nuova architettura sta rivoluzionando il mercato dei chip

Cina e DeepSeek | Intelligenza artificiale: miliardi di investimenti inutili? Come una nuova architettura sta rivoluzionando il mercato dei chip

Cina e DeepSeek | Intelligenza artificiale: miliardi di investimenti inutili? Come una nuova architettura sta rivoluzionando il mercato dei chip – Immagine: Xpert.Digital

L'effetto boomerang: come le sanzioni statunitensi hanno permesso alla Cina di fare passi avanti nell'intelligenza artificiale

294.000 dollari invece di 100 milioni: la verità sulla guerra dei prezzi di DeepSeek

L'ultima novità dell'azienda cinese di intelligenza artificiale DeepSeek solleva interrogativi fondamentali sul futuro dell'intelligenza artificiale. Alla fine di dicembre 2025, l'azienda ha presentato un nuovo metodo di addestramento (chiamato Manifold-Constrained Hyper-Connections) che ha il potenziale per rimodellare l'intero settore. Mentre i giganti della tecnologia occidentale investono centinaia di miliardi di dollari in enormi data center e chip specializzati, DeepSeek sta dimostrando un percorso alternativo basato sulla sofisticatezza architettonica piuttosto che sul puro investimento di capitale. Questo sviluppo potrebbe scuotere le fondamenta economiche del settore dell'intelligenza artificiale e inaugurare una trasformazione in cui il successo o il fallimento non sono determinati dalla mera disponibilità di risorse, ma dalle competenze ingegneristiche.

L'approccio cinese non è nato da una scelta, ma da una necessità. Le restrizioni all'esportazione imposte dagli Stati Uniti hanno impedito alle aziende cinesi di accedere ai chip di intelligenza artificiale più potenti di Nvidia. Quello che inizialmente sembrava uno svantaggio strategico si è trasformato in un acceleratore per percorsi di sviluppo alternativi. DeepSeek ha dovuto raggiungere le massime prestazioni con hardware limitato, creando metodi che ora mettono in discussione la struttura dei costi dell'intero settore. Il lancio nel gennaio 2025 del modello R1, che rivaleggiava con i modelli americani di punta ma era stato sviluppato a una frazione del costo, ha sconvolto i mercati azionari e costretto gli analisti di tutto il mondo a ripensare i propri modelli di valutazione.

Correlato a questo:

Dalle iperconnessioni alla stabilità matematica

La base tecnica del nuovo metodo DeepSeek risiede nell'ulteriore sviluppo del networking nell'ambito dell'intelligenza artificiale. Le reti neurali tradizionali utilizzano le cosiddette connessioni residue, una sorta di "scorciatoia" attraverso la quale le informazioni vengono trasmesse tra i livelli della rete. Questi ponti consentono di addestrare reti più profonde impedendo ai segnali di apprendimento di svanire lungo il percorso. Le "iperconnessioni" di DeepSeek estendono questo concetto ampliando il flusso di informazioni tra i livelli e consentendo modelli più flessibili. Ciò comporta miglioramenti delle prestazioni, ma presenta uno svantaggio cruciale: la complessità aggiuntiva compromette la stabilità, poiché le informazioni non vengono più trasmesse in modo affidabile come con le connessioni classiche.

Con le scorciatoie tradizionali, le informazioni rimangono sostanzialmente invariate durante il passaggio attraverso la rete, con conseguente stabilità dell'addestramento. Le nuove iperconnessioni sacrificano questa caratteristica in favore di una maggiore capacità di apprendimento, ma ciò comporta fluttuazioni significative durante l'addestramento di modelli di grandi dimensioni. DeepSeek ha osservato negli esperimenti che i tassi di errore aumentavano inaspettatamente dopo circa 12.000 passaggi di addestramento, un chiaro segno di instabilità. I ​​segnali di controllo per il processo di apprendimento si comportavano in modo caotico, rendendo praticamente impossibile l'espansione a modelli più potenti. Allo stesso tempo, le connessioni più ampie aumentavano il traffico dati, poiché più informazioni dovevano essere spostate tra la memoria e il processore.

La soluzione di DeepSeek proietta queste complesse connessioni in uno spazio matematico controllato (un "collettore") con regole fisse. Questo trucco matematico ripristina la stabilità preservando i vantaggi di uno scambio di informazioni più ricco. Questo spazio è definito da matrici speciali in cui i valori si bilanciano per mantenere la stabilità complessiva. Sebbene questo vincolo possa sembrare tecnico, ha conseguenze pratiche di vasta portata: garantisce che i segnali non vengano persi né crescano in modo incontrollato durante il flusso attraverso la rete.

Prove pratiche con un modello di 27 miliardi di parametri ne hanno confermato l'efficacia. Sia le iperconnessioni standard che quelle stabilizzate hanno superato il modello di base, ma la versione stabilizzata ha ottenuto costantemente i risultati migliori. La stabilità dell'allenamento è migliorata notevolmente. Mentre il modello standard ha mostrato abbandoni significativi dopo 12.000 passi, l'allenamento con il nuovo metodo è proceduto senza intoppi e ha seguito da vicino il comportamento del modello di base stabile. I segnali di apprendimento sono rimasti entro i limiti di normalità durante l'intero processo, indicando una soluzione fondamentale al problema di stabilità.

I miglioramenti prestazionali hanno un prezzo, ma il costo è sorprendentemente contenuto. Il metodo aumenta lo sforzo computazionale di circa il 6,7% rispetto allo standard. Questo modesto sforzo aggiuntivo è trascurabile rispetto agli enormi miglioramenti prestazionali, rendendo il metodo una delle strategie più efficienti nella ricerca attuale. DeepSeek ha inoltre implementato rigorose ottimizzazioni dell'infrastruttura per ridurre il carico sui percorsi di trasmissione dati. Queste ottimizzazioni sono cruciali perché, con modelli di grandi dimensioni, il collo di bottiglia spesso non è la potenza di calcolo in sé, ma piuttosto la velocità di trasferimento dei dati tra memoria e processore.

Correlato a questo:

La realtà economica dietro i titoli dei giornali

Il dibattito pubblico sui costi di DeepSeek è stato irto di incomprensioni fin dall'inizio. Quando l'azienda ha presentato il suo modello R1 nel gennaio 2025, le cifre in circolazione suggerivano costi di addestramento inferiori a sei milioni di dollari per il modello base V3. Questo è stato spesso confrontato con i cento milioni di dollari stimati per GPT-4 di OpenAI, creando l'impressione che DeepSeek avesse ottenuto un vantaggio sui costi di venticinque volte. Nel settembre 2025, DeepSeek ha pubblicato un articolo sulla rivista Nature affermando che i costi di addestramento per R1 erano di soli 294.000 dollari. Questa cifra ha dominato ancora una volta la copertura mediatica e ha rafforzato la percezione di un vantaggio di costo fondamentale.

Un'analisi più attenta, tuttavia, rivela un quadro più complesso. I 294.000 dollari si riferiscono esclusivamente alla cosiddetta fase di post-addestramento, in cui un modello già intelligente viene perfezionato attraverso la pratica e il feedback. I costi totali effettivi superano i 5,87 milioni di dollari solo per il tempo di elaborazione, a cui si aggiungono investimenti hardware di circa 51 milioni di dollari. Queste cifre non includono ancora i costi per la ricerca, la preparazione dei dati, il personale e gli esperimenti falliti. Se si considerano questi fattori, i costi di sviluppo effettivi si collocano in un intervallo che, pur essendo inferiore a cifre comparabili in Occidente, non raggiunge l'entità drammatica delle cifre spesso citate.

La struttura dei costi dello sviluppo dell'IA è intrinsecamente difficile da comprendere. OpenAI non ha mai pubblicato cifre precise per GPT-4. La stima spesso citata di 100 milioni di dollari proviene da Sam Altman, che nel 2023 ha parlato di costi per l'addestramento dei modelli di base significativamente più elevati. Stime analoghe per modelli più recenti come GPT-4o suggeriscono che i costi siano diminuiti considerevolmente grazie a tecniche moderne come reti di esperti specializzati, metodi più efficienti e infrastrutture ottimizzate. Alcune analisi stimano i costi di addestramento per GPT-4o tra i 5 e i 16 milioni di dollari, il che significherebbe che la differenza di costo rispetto a DeepSeek è considerevolmente inferiore a quanto percepito pubblicamente.

Tuttavia, il risultato di DeepSeek rimane notevole. L'azienda ha addestrato il suo modello V3 con quasi 2,8 milioni di ore GPU su 2.048 chip H800 in un periodo di due mesi. L'H800 è una versione limitata dell'H100 di Nvidia per il mercato cinese, con una velocità di trasferimento dati drasticamente ridotta per conformarsi alle normative statunitensi sull'esportazione. Questi chip sono significativamente meno potenti degli originali utilizzati nei data center occidentali o dei processori Blackwell, ancora più recenti. Il fatto che DeepSeek sia riuscita a sviluppare modelli competitivi con questo hardware limitato è la vera svolta.

L'architettura "mix-of-experts" gioca un ruolo centrale. DeepSeek V3 ha un totale di 671 miliardi di parametri, ma ne attiva solo 37 miliardi per parola. Ciò significa che solo una frazione del modello lavora effettivamente su ogni query. Il modello è costituito da molti "esperti" specializzati e da un pool di conoscenze condiviso, con solo pochi specialisti selezionati per ogni fase. Questa progettazione consente di aumentare notevolmente la conoscenza del modello senza aumentare proporzionalmente i costi computazionali. Ogni esperto può specializzarsi in argomenti specifici, con conseguente miglioramento delle prestazioni e maggiore efficienza.

La sfida di questo approccio basato sugli esperti risiede nel bilanciamento del carico. Se alcuni esperti sono costantemente richiesti mentre altri rimangono inattivi, sorgono problemi di efficienza. Gli approcci tradizionali utilizzano le cosiddette "funzioni di penalità" che costringono il modello a utilizzare tutti gli esperti in egual misura. Tuttavia, questo metodo spesso porta a risultati peggiori, poiché non sempre viene selezionato l'esperto migliore. DeepSeek ha implementato un'intelligente strategia di bilanciamento del carico senza tali penalità artificiali, garantendo un utilizzo equilibrato degli esperti senza compromettere la qualità. Questa innovazione è stata fondamentale per il successo della scalabilità del modello.

L'imperativo strategico della Cina di innovare

Lo sviluppo di DeepSeek non può essere compreso separatamente dal contesto geopolitico. Nell'ottobre 2022, gli Stati Uniti hanno drasticamente inasprito i controlli sulle esportazioni di chip di intelligenza artificiale e attrezzature di produzione verso la Cina. Queste misure miravano a limitare la capacità della Cina di sviluppare sistemi di intelligenza artificiale avanzati e le relative applicazioni militari. Nvidia è stata costretta a sviluppare chip modificati specificamente per il mercato cinese. I modelli A800 e H800 sono emersi come versioni ridotte dei modelli top di gamma, con velocità ridotte quanto basta per rispettare le restrizioni all'esportazione statunitensi.

Nel 2023, gli Stati Uniti hanno nuovamente inasprito i controlli, bloccando persino queste soluzioni provvisorie. Allo stesso tempo, sono state imposte restrizioni all'esportazione di memorie ad alte prestazioni, un componente fondamentale dei moderni chip di intelligenza artificiale. Queste misure hanno costretto le aziende cinesi a sviluppare alternative o a ricorrere a hardware più datato e meno efficiente. Huawei, un tempo una potenza mondiale nel settore delle telecomunicazioni, è stata di fatto esclusa dall'accesso alla tecnologia dei chip occidentale ed è stata costretta a sviluppare soluzioni proprie. Sebbene i processori Ascend di Huawei raggiungano solo una frazione delle prestazioni per chip rispetto a Nvidia, possono compensare parzialmente questo inconveniente grazie al volume di produzione.

I dati sulla produzione illustrano la sfida. Si prevede che Huawei produrrà circa 200.000 chip AI nel 2025, mentre la Cina è riuscita a importare legalmente circa un milione di chip Nvidia modificati nello stesso periodo. Inoltre, il divario prestazionale si sta ampliando. Le analisi mostrano che i migliori chip americani sono attualmente circa cinque volte più potenti delle migliori offerte di Huawei, e si prevede che questo divario aumenterà drasticamente entro il 2027. Anche se Huawei aumentasse notevolmente la sua produzione, l'azienda non riuscirebbe comunque ad avvicinarsi alla potenza di calcolo che Nvidia offre in tutto il mondo entro il 2027.

Queste restrizioni hanno costretto gli sviluppatori cinesi a diventare radicalmente efficienti. Il fondatore di DeepSeek, Liang Wenfeng, ha riconosciuto questa esigenza fin da subito e, già nel 2021, prima dell'inasprimento dei controlli, ha acquistato diecimila GPU Nvidia A100. Questo investimento lungimirante ha dato a DeepSeek un vantaggio cruciale rispetto ai concorrenti che in seguito hanno avuto accesso solo a hardware di qualità inferiore. L'ex gestore di hedge fund ha applicato la stessa lungimiranza strategica che lo aveva portato al successo nel settore finanziario. Il suo fondo, High-Flyer, gestiva miliardi ed era tra le società finanziarie tecnologicamente più avanzate in Cina.

La fondazione di DeepSeek nel luglio 2023 è stata più di un semplice esperimento. Liang vedeva nello sviluppo dell'intelligenza artificiale generale il progetto tecnologico chiave del secolo e voleva posizionare la Cina all'avanguardia. In un'intervista, ha spiegato che le giovani startup di intelligenza artificiale erano ben posizionate per competere con le aziende consolidate perché il mercato stava attraversando una trasformazione fondamentale. Il fattore decisivo, ha sostenuto, non era seguire vecchie regole, ma piuttosto la capacità di adattarsi con flessibilità e rispondere al cambiamento.

Questa filosofia si rifletteva nell'approccio di sviluppo di DeepSeek. Fin dall'inizio, l'azienda si è concentrata sul raggiungimento dei massimi risultati con risorse limitate. Mentre aziende occidentali come OpenAI e Anthropic investivano miliardi in modelli sempre più grandi e data center di grandi dimensioni, DeepSeek ha ottimizzato architettura, formazione e applicazione per garantire l'efficienza. Il modello R1 ha dimostrato in modo impressionante questa strategia. Ha ottenuto risultati nei compiti matematici paragonabili ai migliori modelli statunitensi, ma ha richiesto un'architettura che consumava una potenza di calcolo significativamente inferiore per risposta.

 

Una nuova dimensione della trasformazione digitale con 'Managed AI' (Intelligenza Artificiale) - Piattaforma e soluzione B2B | Xpert Consulting

Una nuova dimensione della trasformazione digitale con 'Managed AI' (Intelligenza Artificiale) – Piattaforma e soluzione B2B | Xpert Consulting - Immagine: Xpert.Digital

Qui scoprirai come la tua azienda può implementare soluzioni di intelligenza artificiale personalizzate in modo rapido, sicuro e senza elevate barriere all'ingresso.

Una piattaforma di intelligenza artificiale gestita è la soluzione completa e senza pensieri per l'intelligenza artificiale. Invece di dover gestire tecnologie complesse, infrastrutture costose e lunghi processi di sviluppo, riceverai una soluzione pronta all'uso, su misura per le tue esigenze, da un partner specializzato, spesso entro pochi giorni.

I principali vantaggi in sintesi:

⚡ Implementazione rapida: dall'idea all'applicazione pronta all'uso in pochi giorni, non mesi. Forniamo soluzioni pratiche che creano un valore aggiunto immediato.

🔒 Massima sicurezza dei dati: i tuoi dati sensibili restano con te. Garantiamo un'elaborazione sicura e conforme alle normative, senza condividere i dati con terze parti.

💸 Nessun rischio finanziario: paghi solo per i risultati. Gli elevati investimenti iniziali in hardware, software o personale vengono completamente eliminati.

🎯 Concentrati sul tuo core business: concentrati su ciò che sai fare meglio. Ci occupiamo dell'intera implementazione tecnica, del funzionamento e della manutenzione della tua soluzione di intelligenza artificiale.

📈 A prova di futuro e scalabile: la tua IA cresce con te. Garantiamo ottimizzazione e scalabilità continue e adattiamo i modelli in modo flessibile alle nuove esigenze.

Maggiori informazioni qui:

 

La fine del dominio dell'intelligenza artificiale: come una startup sta ostacolando i piani di Nvidia e OpenAI

Interruzioni sistemiche e reazioni del mercato

Il lancio di DeepSeek R1 nel gennaio 2025 ha suscitato scalpore ben oltre gli ambienti tecnici. Il mercato azionario ha reagito con perdite per le aziende che avevano investito massicciamente nelle infrastrutture di intelligenza artificiale. Nvidia, il cui valore si basava in gran parte sul presupposto che la domanda per i suoi costosi chip avrebbe continuato a crescere vertiginosamente, ha perso valore nel giro di pochi giorni. Gli investitori si sono chiesti se la spesa annunciata di centinaia di miliardi di dollari fosse effettivamente necessaria, se una startup cinese poteva ottenere risultati comparabili con una frazione di tale importo.

La reazione dei giganti tecnologici cinesi è stata immediata e decisa. ByteDance, Tencent, Baidu e Alibaba hanno ridotto drasticamente i prezzi dei loro servizi di intelligenza artificiale. Il modello Doubao di ByteDance è diventato quasi il 99% più economico su base annua. Questi tagli di prezzo hanno portato a un'enorme impennata nell'utilizzo. Le query giornaliere sono balzate da 120 miliardi a oltre 500 miliardi nel giro di pochi mesi. Il mercato complessivo dei servizi di intelligenza artificiale in Cina è stato valutato a cifre relativamente basse, il che suggerisce margini estremamente bassi dato l'enorme volume di utilizzo.

Questi dati illustrano un problema: la concorrenza si sta spostando dalla qualità dell'IA all'efficienza delle infrastrutture e al prezzo. Alibaba Cloud, leader di mercato in Cina, ha tuttavia annunciato miliardi di investimenti in infrastrutture di IA. Anche ByteDance sta pianificando ingenti acquisti di chip. Tencent, che è rimasta leggermente indietro nell'approvvigionamento di chip, sta compensando questo ritardo con capacità di calcolo in leasing e l'utilizzo dell'efficiente tecnologia di DeepSeek.

Il consolidamento del mercato sta accelerando. Gli esperti prevedono che il campo dei fornitori cinesi di intelligenza artificiale si restringerà a pochi grandi attori. I vincitori saranno coloro che renderanno la loro tecnologia lo standard, combinando prestazioni e applicazioni pratiche. Questo processo rispecchia gli sviluppi in altri settori tecnologici, dove a un periodo di rapida innovazione segue un periodo di consolidamento, con la sopravvivenza solo delle aziende che possiedono la migliore combinazione di tecnologia, scala e potere di mercato.

Una tendenza simile si sta verificando in Occidente. Il predominio di OpenAI sta sensibilmente diminuendo. La quota di mercato di ChatGPT è diminuita significativamente, mentre Google Gemini ha guadagnato terreno. Questo cambiamento è più di una semplice fluttuazione statistica. Indica che il vantaggio di essere "primi sul mercato" sta diminuendo, mentre i concorrenti con piattaforme consolidate stanno recuperando terreno. Google può integrare la sua intelligenza artificiale direttamente nella Ricerca e in Android, il che rappresenta un vantaggio strutturale rispetto a un fornitore di intelligenza artificiale pura.

I prezzi riflettono questa dinamica. Anche provider occidentali come Anthropic e OpenAI hanno abbassato i prezzi e introdotto varianti di modello più efficienti. Il prezzo per milione di parole elaborate è diminuito drasticamente negli ultimi due anni. Questo sviluppo suggerisce che l'intelligenza artificiale sta diventando un prodotto di massa. Quando diversi provider offriranno una qualità simile, il prezzo diventerà il fattore decisivo, riducendo i profitti e rendendo la scalabilità ancora più importante.

Correlato a questo:

Limiti della rivoluzione del ragionamento

Parallelamente all'aumento dell'efficienza, si è verificato uno sviluppo che inizialmente sembrava la prossima grande svolta. I cosiddetti "modelli di ragionamento", che richiedono più tempo per riflettere sui problemi e affrontarne esplicitamente i passaggi, hanno ottenuto risultati spettacolari. o1 di OpenAI, R1 di DeepSeek e modelli simili hanno dimostrato capacità impressionanti in matematica e programmazione. L'idea è semplice: se si dà al modello più tempo per "pensare" e gli si consente di formulare il percorso risolutivo, le risposte dovrebbero migliorare.

Tuttavia, nel giugno 2025, Apple pubblicò uno studio che ne rivelava i limiti. I ricercatori testarono modelli all'avanguardia con enigmi logici la cui difficoltà poteva essere controllata con precisione. I risultati furono preoccupanti: i modelli mostravano comportamenti contraddittori. Il loro sforzo di elaborazione inizialmente aumentava con la complessità, ma poi a un certo punto diminuiva di nuovo, nonostante avessero avuto tempo a sufficienza, e le soluzioni diventavano errate.

Lo studio ha individuato tre fasi. Per problemi semplici, i modelli di linguaggio normale si sono rivelati spesso migliori e più economici dei modelli "pensanti". Per problemi di media difficoltà, i processi di pensiero hanno offerto chiari vantaggi. Tuttavia, per problemi altamente complessi, entrambi i tipi di modelli si sono rivelati completamente fallimentari. Non solo hanno fallito di misura, ma non sono stati in grado di trovare soluzioni anche solo lontanamente corrette.

Ciò che era particolarmente preoccupante era che persino fornire la formula risolutiva corretta non aiutava affatto. I modelli fallivano ancora a livelli di difficoltà simili. Ciò suggerisce che i problemi siano più profondi: i modelli faticano a eseguire rigorosamente i passaggi logici e a verificare il proprio ragionamento.

L'analisi dei "protocolli di pensiero" ha rivelato degli schemi ricorrenti. Per problemi semplici, i modelli trovavano la soluzione in anticipo, ma poi continuavano ad addentrarsi in dettagli superflui. Con un'elevata complessità, spesso si perdevano sulla strada sbagliata. Oltre un certo livello di difficoltà, non erano più in grado di generare approcci corretti. Spesso si fissavano su idee iniziali errate e sprecavano tempo di calcolo giustificandole invece di correggere l'errore.

Un altro studio ha avvertito che il miglioramento di questi modelli potrebbe presto ristagnare. Sebbene ottengano punteggi migliori nei test grazie all'enorme sforzo computazionale, questo li rende lenti e costosi. Le conseguenze economiche sono significative: i modelli "pensanti" costano molte volte di più da gestire rispetto alle versioni standard. Se questi modelli non riusciranno a fornire i progressi attesi e raggiungeranno i loro limiti, sorgerà la domanda se gli elevati investimenti siano giustificati. La scoperta che i modelli più semplici sono spesso più efficienti suggerisce che in futuro sarà necessario scegliere con maggiore precisione quale strumento sia più adatto a quale compito.

Correlato a questo:

Corsa alle infrastrutture e fame di energia

Nonostante software più efficienti, il consumo di risorse del settore è in aumento. Le previsioni indicano che la domanda di elettricità dei data center aumenterà drasticamente entro la fine del decennio. La quota delle applicazioni di intelligenza artificiale nel consumo di elettricità dei data center globali potrebbe raddoppiare. Per soddisfare questa domanda si stanno investendo somme gigantesche: migliaia di miliardi di dollari in tutto il mondo. Iniziative come "Stargate" di OpenAI e dei suoi partner, o programmi di investimento europei, riflettono l'enorme portata della sfida.

La distribuzione regionale sta cambiando. Mentre Asia e Nord America sono attualmente all'avanguardia, la maggior parte della nuova capacità sarà costruita negli Stati Uniti. Anche l'Europa sta pianificando massicce espansioni, che potrebbero aumentare significativamente la domanda di elettricità del continente.

Allo stesso tempo, la densità di potenza nei data center è in aumento. Poiché i chip di intelligenza artificiale generano un'enorme quantità di calore in uno spazio ridotto, il raffreddamento sta diventando una sfida sempre più grande. I sistemi di condizionamento convenzionali spesso non sono più sufficienti, motivo per cui sono necessari sofisticati sistemi di raffreddamento a liquido, che a loro volta sono costosi e complessi.

Il mercato mostra segni di surriscaldamento. L'utilizzo dei data center è in aumento, con conseguente aumento dei prezzi. Non si prevede che la situazione si attenuerà finché non saranno completati altri progetti di costruzione o non rallenterà la crescita della domanda di intelligenza artificiale. Tuttavia, se metodi efficienti come DeepSeek si diffondessero, la necessità di nuovi data center potrebbe essere inferiore al previsto. Ciò metterebbe in discussione gli ingenti investimenti previsti e porterebbe a una sovraccapacità, un rischio per chiunque abbia scommesso su una domanda di hardware in costante crescita.

Strategie nazionali e sovranità tecnologica

Lo sviluppo di DeepSeek è strettamente legato al perseguimento dell'indipendenza da parte della Cina. I piani quinquennali hanno dato priorità ai semiconduttori e l'obiettivo dell'autosufficienza viene perseguito con enorme impegno. Nuove normative stanno costringendo i produttori cinesi di chip a utilizzare più macchinari di produzione nazionale. Un fondo statale sta investendo l'equivalente di quasi 50 miliardi di dollari nell'industria locale dei chip per ridurre la dipendenza dall'Occidente.

Questa politica sta avendo effetti, in alcuni casi non quelli sperati. In precedenza, le fabbriche cinesi privilegiavano le apparecchiature statunitensi. Tuttavia, a causa delle sanzioni statunitensi, non avevano più scelta e dovevano collaborare con fornitori nazionali, il che ha accelerato il loro sviluppo. La Cina potrebbe presto controllare una quota significativa della produzione globale di chip più semplici utilizzati nelle automobili e negli elettrodomestici.

Tuttavia, il divario rimane significativo quando si tratta di intelligenza artificiale di alto livello. I chip Huawei non possono competere con quelli di Nvidia in termini di prestazioni e i volumi di produzione sono decisamente troppo bassi. Nemmeno un massiccio aumento della produzione colmerebbe il divario per anni. Poiché la domanda di potenza di calcolo cresce più rapidamente della produzione cinese, è probabile che la carenza non faccia che peggiorare.

Ciò richiede soluzioni creative. Il successo di DeepSeek si basa anche sulla tempestiva acquisizione dei chip Nvidia. Altri ricorrono a rotte di contrabbando o metodi indiretti. Il governo sta rispondendo con contromisure, come restrizioni all'esportazione di terre rare e indagini sulle aziende tecnologiche occidentali. La pressione sulle aziende cinesi affinché acquistino chip di produzione nazionale è crescente, anche se tecnicamente inferiori.

Panorama normativo e governance globale

Mentre Stati Uniti e Cina sono impegnati in una corsa tecnologica, l'UE si concentra sulla regolamentazione. L'"AI Act" è la prima legge completa al mondo sull'intelligenza artificiale. Vieta applicazioni particolarmente rischiose e stabilisce regole severe per i modelli di intelligenza artificiale più potenti. Le violazioni sono soggette a pesanti sanzioni.

L'approccio europeo cerca di stabilire standard etici senza soffocare l'innovazione. I critici temono svantaggi per le aziende europee, mentre i sostenitori vedono un vantaggio a lungo termine in termini di fiducia e sicurezza. A livello globale, tuttavia, la regolamentazione rimane un mosaico. Gli Stati Uniti si affidano a impegni volontari, mentre la Cina privilegia il controllo statale. Questa frammentazione rende difficile stabilire standard comuni.

La questione della sicurezza dell'IA sta diventando sempre più centrale. Gli esperti mettono in guardia dai rischi posti dall'intelligenza sovrumana. I tempi per raggiungere questa "intelligenza artificiale generale" (AGI) si sono accorciati. I principali sviluppatori non parlano più di decenni, ma solo di pochi anni. Resta da vedere se questa previsione sia realistica o solo una trovata pubblicitaria, ma il settore si sta preparando.

Modelli falliti e riallineamento strategico

Il ritardo del modello successore di DeepSeek, l'R2, dimostra che il successo non è garantito. Originariamente previsto per una versione precedente, ha incontrato problemi. I tentativi di addestrare il modello sui chip cinesi Huawei sono apparentemente falliti, nonostante l'assistenza degli ingegneri Huawei.

L'azienda continua quindi a utilizzare le sue azioni Nvidia per la formazione, ma deve affidarsi sempre più a Huawei per l'applicazione dei modelli: un compromesso politicamente imposto. I ritardi hanno causato un temporaneo calo dell'interesse degli utenti, poiché la concorrenza non è rimasta inattiva.

Un altro problema sono i dati. Per raggiungere il livello successivo sono necessari dati di addestramento più numerosi e di migliore qualità. Nei paesi anglofoni, questi sono facilmente reperibili online. In Cina, l'accesso a dati di alta qualità è più difficile, in parte a causa della censura e in parte perché molti contenuti non sono accessibili al pubblico. Questo, unito a un hardware di qualità inferiore, rallenta lo sviluppo. Se l'addestramento richiede più tempo e diventa più impegnativo, il vantaggio in termini di costi diminuisce.

Cambiamento strutturale nel settore dell'intelligenza artificiale

Il settore sta affrontando una trasformazione. Il vecchio motto "di più è meglio" – più dati, più chip, più soldi – sta raggiungendo i suoi limiti o sta diventando proibitivo. DeepSeek ha dimostrato che un'architettura intelligente può essere più importante della potenza pura.

Ciò ha conseguenze per gli investitori. Chi ha investito miliardi nell'hardware potrebbe trovarsi in difficoltà se un software più efficiente riducesse la domanda. Allo stesso tempo, i nuovi operatori hanno una possibilità, perché non è più necessario possedere una fortuna per partecipare.

Con prestazioni dell'IA sempre più economiche e simili, il modello in sé non è più l'unico fattore; ciò che conta è quanto bene sia integrato nei prodotti. Google e Microsoft hanno un vantaggio in questo senso perché hanno già utenti. Le startup di IA pura si trovano ad affrontare sfide maggiori. Il software open source, o disponibile gratuitamente, sta giocando un ruolo sempre più importante. Modelli come quelli di DeepSeek o Meta sono accessibili a tutti, il che accelera l'innovazione.

Allo stesso tempo, gli investitori si chiedono quando il denaro tornerà a fluire. ChatGPT ha molti utenti, ma costa una fortuna. I profitti più consistenti sono ancora lontani. Nuove professioni per esperti di intelligenza artificiale stanno emergendo sul mercato del lavoro, mentre semplici mansioni d'ufficio vengono automatizzate: una sfida sociale per la quale non esistono ancora soluzioni semplici.

Dopo l'hype sull'intelligenza artificiale: ora inizia la vera battaglia per la monetizzazione

Le innovazioni di DeepSeek segnano una svolta. Dimostrano che è possibile realizzare tecnologie di livello mondiale anche con risorse limitate. Questo sfida l'assunto secondo cui solo le aziende statunitensi più ricche possano vincere. Sposta la competizione da "Chi ha più soldi?" a "Chi ha i migliori ingegneri?".

Dal punto di vista geopolitico, è chiaro che le sanzioni possono rallentare il progresso, ma possono anche forzare l'innovazione. La Cina sta costruendo la propria industria sotto pressione. Dal punto di vista economico, siamo solo all'inizio. I prezzi stanno scendendo e i modelli stanno diventando beni di uso quotidiano. Chi vuole vincere in futuro non deve solo sviluppare una buona intelligenza artificiale, ma anche essere in grado di trarne profitto.

Permangono ostacoli tecnici. I metodi attuali stanno raggiungendo i loro limiti e non è certo se vedremo davvero un'intelligenza simile a quella umana in tempi brevi. I prossimi anni diranno se il settore supererà questi ostacoli o se l'entusiasmo si esaurirà. Forse la lezione più importante di DeepSeek non è affatto tecnica, ma strategica: c'è sempre un'altra via, se sei costretto a trovarla.

 

Il tuo partner globale per il marketing e lo sviluppo aziendale

☑️ La nostra lingua aziendale è l'inglese o il tedesco

☑️ NOVITÀ: Corrispondenza nella tua lingua madre!

 

Konrad Wolfenstein

Io e il mio team saremo lieti di essere a tua disposizione come tuo consulente personale.

Puoi contattarmi compilando il modulo di contatto qui wolfenstein@xpert.digital:o semplicemente chiamandomi al numero +49 7348 4088 965. Il mio indirizzo email è

Non vedo l'ora di iniziare il nostro progetto comune.

 

 

☑️ Supporto alle PMI in strategia, consulenza, pianificazione e implementazione

☑️ Creazione o riallineamento della strategia digitale e digitalizzazione

☑️ Espansione e ottimizzazione dei processi di vendita internazionali

☑️ Piattaforme di trading B2B globali e digitali

☑️ Sviluppo aziendale pionieristico / Marketing / PR / Fiere

 

🎯🎯🎯 Approfitta della vasta competenza di Xpert.Digital, articolata in cinque parti, in un unico pacchetto di servizi completo | BD, R&D, XR, PR e ottimizzazione della visibilità digitale

Approfitta dell'ampia e quintuplicata competenza di Xpert.Digital in un pacchetto di servizi completo | Ottimizzazione di R&S, XR, PR e visibilità digitale - Immagine: Xpert.Digital

Xpert.Digital vanta una conoscenza approfondita di diversi settori. Questo ci consente di sviluppare strategie su misura, perfettamente in linea con le esigenze e le sfide del vostro specifico segmento di mercato. Analizzando costantemente le tendenze del mercato e monitorando gli sviluppi del settore, possiamo agire in modo proattivo e offrire soluzioni innovative. La combinazione di esperienza e competenza genera valore aggiunto e offre ai nostri clienti un decisivo vantaggio competitivo.

Maggiori informazioni qui:

Lascia la versione mobile