Il re segreto dell'IA: come Qwen3.5 di Alibaba sta dando filo da torcere a OpenAI e Google

Konrad Wolfenstein

3 mesi fa

Il re segreto dell'IA: come Qwen3.5 di Alibaba sta dando filo da torcere a OpenAI e Google – Immagine: Xpert.Digital

Gratis anziché a pagamento: l'ingegnosa mossa open-source della Cina contro ChatGPT e simili.

700 milioni di download: la rivoluzione silenziosa di Qwen AI che tutti hanno ignorato

Fuori dall'ombra: come Qwen è diventata la piattaforma dominante

Per lungo tempo, OpenAI e Google sono stati considerati i dominatori indiscussi del mondo dell'IA, ma dietro le quinte si sta verificando un fondamentale cambio di paradigma. Con il rilascio della famiglia di modelli Qwen3.5, il gigante tecnologico cinese Alibaba non solo sfida il dominio dei consolidati attori occidentali, ma ridefinisce completamente le regole del gioco per l'intelligenza artificiale. Attraverso una radicale riprogettazione architetturale, Qwen3.5 risolve il problema delle risorse dei classici modelli Transformer e offre prestazioni senza precedenti con uno sforzo computazionale drasticamente ridotto. La strategia è tanto semplice quanto aggressiva: modelli open-source altamente potenti e nativamente multimodali vengono resi disponibili gratuitamente – anche le versioni compatte offrono prestazioni su hardware locale non inferiori a quelle dei giganteschi sistemi commerciali. Questa mossa è molto più di un semplice aggiornamento tecnico. È una manovra geopolitica che attacca i margini di profitto del mercato globale dell'IA e, allo stesso tempo, inaugura l'era degli agenti di IA autonomi per il mercato di massa ("IA Agentica"). Un'analisi dettagliata mostra come Alibaba abbia raggiunto questo traguardo e cosa significhino realmente questi dati di riferimento per il futuro del settore.

Correlato a questo:

L'offensiva open source della Cina nell'intelligenza artificiale: come il software libero sta distruggendo il business multimiliardario della Silicon Valley

La rivoluzione silenziosa di Alibaba: come la famiglia Qwen3.5 sta rinegoziando l'ordine mondiale dell'IA

L'attacco cinese al software open source colpisce OpenAI e Google nel loro punto più debole: la loro architettura

Quando Alibaba ha lanciato la serie di modelli Qwen3 nell'aprile 2025, la reazione del giornalismo tecnologico occidentale è stata tiepida. Indubbiamente potente, ma in definitiva solo uno dei tanti modelli in un mercato sempre più affollato: questo il verdetto. Ciò che questa valutazione distaccata trascurava era che Qwen non era più un progetto di nicchia, ma si stava avviando a diventare la piattaforma di intelligenza artificiale open source più utilizzata al mondo. Nel gennaio 2026, il team di Qwen ha annunciato 700 milioni di download su Hugging Face, raggiungendo una posizione che superava persino Llama di Meta, per molti anni il punto di riferimento indiscusso per i modelli linguistici open source. I numeri parlavano da soli: nel dicembre 2025, i download mensili di Qwen superavano il totale combinato degli otto modelli successivi più popolari, tra cui Meta, DeepSeek, OpenAI, Mistral e Nvidia.

Questa popolarità non è casuale. I dati riflettono una decisione strategica che Alibaba ha perseguito con coerenza dal 2023: rilasciare i modelli Qwen prima, più frequentemente e in più varianti rispetto ai suoi concorrenti. Ad oggi, Alibaba ha reso disponibili quasi 400 modelli della suite Qwen come open source e ha generato oltre 180.000 versioni derivate. Persino i gruppi di ricerca di alto livello si affidano a Qwen: il team guidato dalla pioniera dell'IA Fei-Fei Li ha addestrato il suo acclamato modello di inferenza s1 su Qwen con risorse relativamente modeste. DeepSeek, il laboratorio di modellazione cinese che ha suscitato scalpore a livello globale con R1 all'inizio del 2025, ha rilasciato sei modelli basati sulla community, quattro dei quali basati su Qwen.

Nell'ambito più cruciale della comunità di IA open-source, Qwen ha raggiunto una posizione che gli analisti di mercato considerano un effetto rete pressoché inattaccabile: chi sviluppa su Qwen beneficia di un vasto ecosistema di modelli derivati, ottimizzazione, perfezionamento e supporto della comunità. Chi compete con Qwen, a sua volta, si scontra con un circolo virtuoso di effetti di rete. Questa solidità strutturale costituisce il contesto in cui va valutata la serie di modelli Qwen3.5.

La scommessa architettonica: perché Qwen3.5 pensa in modo diverso dai suoi predecessori

La differenza cruciale tra la famiglia Qwen3.5 e i suoi predecessori non risiede in un semplice aumento dei parametri, bensì in un fondamentale cambio di paradigma architetturale. I classici modelli transformer – da GPT-4 a Llama fino all'originale Qwen3 – si basano sul cosiddetto meccanismo di autoattenzione, la cui complessità aumenta matematicamente con il quadrato della distanza. Ciò significa che raddoppiare la lunghezza del contesto quadruplica lo sforzo computazionale. Questo è il collo di bottiglia che rende documenti lunghi, codebase estesi o cronologie di conversazione di diverse ore così dispendiose in termini di risorse per i modelli linguistici.

Qwen non ha risolto questo problema attraverso ottimizzazioni graduali, come ha fatto DeepSeek con il suo Multi-Head Latent Attention, ma attraverso una revisione architetturale più radicale. Il nucleo della nuova architettura è la struttura Hybrid Mixture of Experts: di ogni quattro blocchi transformer, tre sono sostituiti da Gated Delta Networks, una variante di attenzione lineare basata sul lavoro teorico "Gated Delta Networks: Improving Mamba2 with Delta Rule". Solo un blocco su quattro rimane un classico livello di attenzione completa per le attività di precisione. Il risultato è una complessità computazionale che cresce solo linearmente con la lunghezza del contesto, una differenza categorica rispetto alla scalabilità quadratica dei transformer classici.

Le conseguenze di questa decisione sono significative. In pratica, la scalabilità lineare significa che, a parità di potenza di calcolo, il modello può elaborare testi considerevolmente più lunghi e produrre token più velocemente rispetto a un modello denso di intelligenza comparabile. Qwen3.5-Plus, la versione ospitata su Alibaba Cloud, supporta una finestra di contesto di un milione di token, una capacità che, solo due anni fa, era riservata esclusivamente ad approcci architetturali specializzati come l'IA costituzionale di Claude. Allo stesso tempo, l'architettura ibrida riduce drasticamente i requisiti di VRAM: mentre un classico modello denso da 400 miliardi di parametri richiede più di 800 GB di memoria GPU, Qwen3.5-397B-A17B funziona con 48-96 GB su sistemi quantizzati.

Una nuova dimensione della trasformazione digitale con 'Managed AI' (Intelligenza Artificiale) - Piattaforma e soluzione B2B | Xpert Consulting

Una nuova dimensione della trasformazione digitale con 'Managed AI' (Intelligenza Artificiale) – Piattaforma e soluzione B2B | Xpert Consulting - Immagine: Xpert.Digital

Qui scoprirai come la tua azienda può implementare soluzioni di intelligenza artificiale personalizzate in modo rapido, sicuro e senza elevate barriere all'ingresso.

Una piattaforma di intelligenza artificiale gestita è la soluzione completa e senza pensieri per l'intelligenza artificiale. Invece di dover gestire tecnologie complesse, infrastrutture costose e lunghi processi di sviluppo, riceverai una soluzione pronta all'uso, su misura per le tue esigenze, da un partner specializzato, spesso entro pochi giorni.

I principali vantaggi in sintesi:

⚡ Implementazione rapida: dall'idea all'applicazione pronta all'uso in pochi giorni, non mesi. Forniamo soluzioni pratiche che creano un valore aggiunto immediato.

🔒 Massima sicurezza dei dati: i tuoi dati sensibili restano con te. Garantiamo un'elaborazione sicura e conforme alle normative, senza condividere i dati con terze parti.

💸 Nessun rischio finanziario: paghi solo per i risultati. Gli elevati investimenti iniziali in hardware, software o personale vengono completamente eliminati.

🎯 Concentrati sul tuo core business: concentrati su ciò che sai fare meglio. Ci occupiamo dell'intera implementazione tecnica, del funzionamento e della manutenzione della tua soluzione di intelligenza artificiale.

📈 A prova di futuro e scalabile: la tua IA cresce con te. Garantiamo ottimizzazione e scalabilità continue e adattiamo i modelli in modo flessibile alle nuove esigenze.

Maggiori informazioni qui:

La soluzione di intelligenza artificiale gestita - Servizi di intelligenza artificiale industriale: la chiave per la competitività nei settori dei servizi, dell'industria e dell'ingegneria meccanica

La nuova IA cinese batte Google e OpenAI con una dimensione minima

La serie di modelli di fuochi d'artificio: da 397 miliardi a 0,8 miliardi di parametri

La strategia di rilascio della famiglia Qwen3.5 ha seguito un ritmo ben calcolato. Il modello di punta, Qwen3.5-397B-A17B, ha dato il via poco prima del Capodanno cinese: 397 miliardi di parametri totali, di cui solo 17 miliardi attivi per token. Questa architettura sparsa, basata su una combinazione di esperti, ha suscitato stupore nel primo test pratico, poiché il tasso di attivazione inferiore al cinque percento ha fatto sì che, nonostante le sue dimensioni complessive gigantesche, il modello raggiungesse la latenza di un modello significativamente più piccolo.

Poco dopo arrivarono i veri fuochi d'artificio: Qwen3.5-122B-A10B e Qwen3.5-35B-A3B come modelli SMoE per applicazioni ad alte prestazioni, e il modello denso Qwen3.5-27B come soluzione versatile per gli utenti che privilegiano un'elevata qualità single-task rispetto alla pura velocità di inferenza. Le prime valutazioni della community hanno rivelato un quadro sorprendente: il modello 27B, sebbene in termini di parametri più piccolo delle varianti SMoE, ha ottenuto risultati migliori in numerosi benchmark, a dimostrazione che il processo di addestramento più complesso per le architetture sparse non è ancora completamente ottimizzato e possiede un ulteriore potenziale.

La maggiore risonanza, tuttavia, è stata causata dal successivo rilascio dei modelli più piccoli: Qwen3.5-9B, Qwen3.5-4B, Qwen3.5-2B e Qwen3.5-0.8B. Questi modelli sono specificamente progettati per l'utilizzo su computer standard e offrono una densità di prestazioni praticamente senza precedenti nella storia dei modelli linguistici compatti. Il Qwen3.5-9B ha ottenuto un punteggio di 81,7 punti nel benchmark GPQA Diamond, che testa il ragionamento accademico di livello universitario, superando il GPT-oss-120B di OpenAI, fermo a 80,1 punti, un modello con oltre tredici volte il numero di parametri. Nel benchmark di ragionamento visivo MMMU-Pro, il modello 9B ha totalizzato 70,1 punti contro i 59,7 del Gemini 2.5 Flash-Lite. Anche il modello 4B ha suscitato scalpore: su Video-MME (con sottotitoli) ha raggiunto 83,5 punti, ben al di sopra dei 74,6 di Google.

Correlato a questo:

Corsa all'intelligenza artificiale: Alibaba svela il nuovo modello di punta e mette sotto pressione i concorrenti – Ricerca

La multimodalità come standard: la fine del suffisso VL

Un passo strategicamente significativo e simbolico nella famiglia Qwen3.5 è la rimozione dell'abbreviazione "VL" dai nomi dei modelli. In precedenza, "VL" (Vision Language) indicava i modelli in grado di elaborare le immagini, una capacità sempre considerata una funzionalità aggiuntiva. Nella generazione 3.5, tutti i modelli, senza eccezione, sono nativamente multimodali: testo, immagini e video non vengono elaborati tramite adattatori a valle, ma integrati fin dall'inizio attraverso un addestramento di fusione precoce.

Questo passo va ben oltre la semplice estetica. Segnala un riposizionamento strategico: Qwen non considera più la multimodalità una funzionalità premium per alcune varianti del modello, ma un requisito fondamentale per ogni modello linguistico moderno. L'implementazione tecnica tramite Early Fusion permette di apprendere la comprensione di immagini e linguaggio in uno spazio rappresentazionale condiviso, con il vantaggio che il modello può collegare profondamente la conoscenza visiva e quella linguistica, anziché limitarsi a combinarle superficialmente. Qwen 3.5 supporta inoltre 201 lingue e dialetti, rispetto ai 119 della generazione precedente.

Geopolitica nel codice: cosa significa l'offensiva open source della Cina per il mercato globale dell'IA

Dietro questo progresso tecnologico si cela una dimensione geopolitica spesso trascurata dai media occidentali. Nel 2025 e nel 2026, l'industria cinese dell'IA ha perseguito una strategia che potrebbe essere definita "ribassismo open source": modelli con prestazioni paragonabili a quelle dei fornitori commerciali più costosi sono stati rilasciati gratuitamente, con una licenza che ne consentiva l'utilizzo commerciale. Il risultato è una sistematica svalutazione del sovrapprezzo che OpenAI, Anthropic e Google applicano per i loro prodotti di punta.

Alibaba posiziona esplicitamente Qwen3.5 come concorrente di GPT-5.2 e Claude 4.5 Opus. Nei benchmark interni, Qwen3.5 ha superato entrambi i modelli su IFBench, un test che misura la qualità del seguire le istruzioni. Nel benchmark di ragionamento HMMT, Qwen3.5 ha superato Claude 4.5 Opus ma è rimasto indietro rispetto a GPT-5.2. Questo panorama prestazionale sfumato è caratteristico: Qwen3.5 non è innegabilmente il leader in nessuna singola categoria, ma è competitivo su tutta la linea, e tutto questo con un codice sorgente completamente open source.

La reazione del mercato a questa situazione è già evidente. Gli sviluppatori, in particolare nelle aziende con risorse limitate, si stanno rivolgendo ai derivati di Qwen perché il costo totale di proprietà dell'inferenza radicale sul proprio hardware è drasticamente inferiore ai costi delle API dei fornitori commerciali. Questo è un vantaggio cruciale per i clienti B2B che desiderano scalare le soluzioni di IA senza pagare per ogni singolo token. La pressione sui prezzi esercitata sul mercato dai modelli open-source cinesi ha già spinto OpenAI a posizionare linee di prodotti più accessibili come il GPT-5 mini, una risposta diretta alla concorrenza di Qwen.

Parametri di riferimento senza miti: cosa dicono davvero i numeri

Una valutazione seria dei benchmark di Qwen3.5 richiede un approccio critico. Alibaba ha riportato i suoi confronti prestazionali come "autodichiarati", un fatto esplicitamente evidenziato da CNBC, che rende necessaria una verifica indipendente. Inoltre, i benchmark non sono misure neutrali: i modelli possono essere pre-addestrati su dati simili a quelli dei benchmark, il che può portare all'overfitting per determinati formati di test senza tradursi in un reale aumento delle prestazioni nell'utilizzo reale. I test condotti dalla community nelle settimane successive al rilascio offrono un quadro più variegato, ma nel complesso impressionante.

I risultati sono particolarmente robusti se applicati a benchmark che richiedono un ragionamento attivo e non possono essere risolti tramite il semplice recupero di dati fattuali. Il benchmark GPQA Diamond, che propone quesiti di biologia, fisica e chimica a livello di dottorato, è considerato particolarmente resistente alle manipolazioni. Il fatto che Qwen3.5-9B superi un modello con 120 miliardi di parametri in questo caso non è, secondo le ricerche attuali, un artefatto di misurazione, bensì l'espressione dell'effetto di miglioramento dell'efficienza della nuova architettura in combinazione con dati di addestramento di qualità superiore. Qwen ha utilizzato una pipeline FP8 e un framework di apprendimento per rinforzo asincrono per l'addestramento: scelte tecniche che aumentano l'efficienza dei dati e rendono l'addestramento più stabile.

Correlato a questo:

Il modello di intelligenza artificiale Qwen 3 di Alibaba: un nuovo punto di riferimento nello sviluppo dell'intelligenza artificiale e il suo impatto sul mercato tecnologico globale

Intelligenza artificiale agentiva e la prossima fase di sviluppo della piattaforma Qwen

Alibaba presenta Qwen3.5 non come un semplice modello di chat, ma esplicitamente come l'architettura fondamentale per l'"era dell'IA agente". Questa affermazione è supportata da solide prove tecniche: l'addestramento basato sull'apprendimento per rinforzo è stato esteso a milioni di ambienti agente con distribuzioni di attività sempre più complesse, una metodologia che si concentra sull'esecuzione di attività reali e multi-fase piuttosto che sulla riproduzione statica della conoscenza. Qwen3.5-Plus offre l'utilizzo nativo degli strumenti tramite Alibaba Cloud e un sistema adattivo di utilizzo degli strumenti che consente agli agenti di accedere autonomamente ad API esterne, database e query di ricerca.

Il fatto che un modello linguistico con 17 miliardi di parametri attivi possa gestire questi compiti con una qualità competitiva rappresenta un cambiamento fondamentale nell'economia delle applicazioni di intelligenza artificiale basate su agenti. Gli approcci precedenti richiedevano modelli di grandi dimensioni e costosi come "cervello" dell'agente, aumentando significativamente i costi operativi per compiti autonomi complessi. Qwen3.5-9B, che funziona localmente su hardware con una singola GPU di fascia alta, rende i sistemi di intelligenza artificiale basati su agenti accessibili a un mercato più ampio di medie dimensioni e agli sviluppatori senza budget per il cloud. Questa dinamica di democratizzazione potrebbe accelerare significativamente il percorso di adozione degli agenti di intelligenza artificiale nelle aziende di medie dimensioni.

Consulenza - Pianificazione - Implementazione