Hemlig AI-kung: Hur Alibabas Qwen3.5 ger OpenAI och Google kamp om pengar

Konrad Wolfenstein

3 månader sedan

Hemlig AI-kung: Hur Alibabas Qwen3.5 ger OpenAI och Google kamp om pengar – Bild: Xpert.Digital

Gratis istället för premium: Kinas geniala open source-drag mot ChatGPT & Co.

700 miljoner nedladdningar: Den tysta revolutionen av Qwen AI som alla förbisedde

Ut ur skuggorna: Hur Qwen blev den dominerande plattformen

Länge ansågs OpenAI och Google vara de obestridda härskarna i AI-världen, men ett fundamentalt paradigmskifte har ägt rum bakom kulisserna. Med lanseringen av modellfamiljen Qwen3.5 utmanar den kinesiska teknikjätten Alibaba inte bara de etablerade västerländska aktörernas dominans, utan omdefinierar också helt spelreglerna för artificiell intelligens. Genom en radikal arkitektonisk omdesign löser Qwen3.5 resursproblemet hos klassiska Transformer-modeller och levererar oöverträffad prestanda med drastiskt minskad beräkningsansträngning. Strategin är lika enkel som den är aggressiv: Mycket kraftfulla, native multimodala open source-modeller görs tillgängliga kostnadsfritt – även kompakta versioner erbjuder prestanda på lokal hårdvara som inte på något sätt är sämre än gigantiska kommersiella system. Detta drag är mycket mer än bara en teknisk uppdatering. Det är en geopolitisk manöver som attackerar vinstmarginalerna på den globala AI-marknaden och samtidigt inleder en era av massmarknadsbaserade, autonoma AI-agenter ("Agentic AI"). En detaljerad analys visar hur Alibaba uppnådde denna bedrift och vad riktmärkessiffrorna verkligen betyder för branschens framtid.

Relaterat till detta:

Kinas öppen källkodsoffensiv inom artificiell intelligens: Hur fri programvara förstör Silicon Valleys mångmiljardverksamhet

Alibabas tysta revolution: Hur Qwen3.5-familjen omförhandlar AI-världsordningen

Kinas attack mot öppen källkod drabbar OpenAI och Google där det skadar mest – i deras arkitektur

När Alibaba släppte modellserien Qwen3 i april 2025 var reaktionen från västerländsk teknikjournalistik dämpad. Visserligen kraftfull, men i slutändan bara en av många modeller på en alltmer överbelastad marknad – det var domen. Vad denna opartiska bedömning förbisåg var att Qwen inte längre var ett nischprojekt, utan på väg att bli världens mest använda AI-plattform med öppen källkod. I januari 2026 rapporterade Qwen-teamet 700 miljoner nedladdningar på Hugging Face, vilket uppnådde en position som till och med överträffade Metas Llama, under många år det obestridda riktmärket för språkmodeller med öppen källkod. Siffrorna talade för sig själva: I december 2025 översteg antalet månatliga Qwen-nedladdningar den sammanlagda summan av de näst åtta mest populära modellerna – inklusive Meta, DeepSeek, OpenAI, Mistral och Nvidia.

Denna popularitet är ingen slump. Siffrorna återspeglar ett strategiskt beslut som Alibaba konsekvent har tagit sedan 2023: att släppa Qwen-modeller tidigare, oftare och i fler variationer än sina konkurrenter. Hittills har Alibaba gjort nästan 400 modeller från Qwen-sviten tillgängliga som öppen källkod och har genererat mer än 180 000 härledda versioner. Även topprankade forskningsgrupper förlitar sig på Qwen: Teamet kring AI-pionjären Fei-Fei Li tränade sin hyllade s1-inferensmodell på Qwen med jämförelsevis blygsamma resurser. DeepSeek, det kinesiska modelleringslaboratoriet som orsakade global sensation med R1 i början av 2025, har släppt sex community-baserade modeller – varav fyra är baserade på Qwen.

Inom den viktigaste mätpunkten inom AI-gemenskapen med öppen källkod hade Qwen därmed uppnått en position som marknadsforskare anser vara en nästan orubblig nätverkseffekt: De som bygger vidare på Qwen drar nytta av ett stort ekosystem av derivatmodeller, finjusteringar, optimeringar och community-stöd. De som konkurrerar mot Qwen konkurrerar samtidigt mot ett svänghjul av nätverkseffekter. Denna strukturella styrka utgör bakgrunden mot vilken Qwen3.5-modellserien måste utvärderas.

Den arkitektoniska satsningen: Varför Qwen3.5 tänker annorlunda än sina föregångare

Den avgörande skillnaden mellan Qwen3.5-familjen och dess föregångare ligger inte i en enkel ökning av parametrar, utan i ett grundläggande arkitektoniskt paradigmskifte. Klassiska transformatormodeller – från GPT-4 via Llama till den ursprungliga Qwen3 – förlitar sig på den så kallade självuppmärksamhetmekanismen, som matematiskt skalas med kvadratisk komplexitet. Detta innebär att en fördubbling av kontextlängden fyrdubblar beräkningsansträngningen. Det är detta som gör långa dokument, omfattande kodbaser eller flera timmar långa konversationshistoriker så resurskrävande för språkmodeller.

Qwen löste inte detta problem genom gradvisa optimeringar, som DeepSeek gjorde med sin Multi-Head Latent Attention, utan genom en mer radikal arkitekturöversyn. Kärnan i den nya arkitekturen är Hybrid Mixture of Experts-strukturen: Av fyra transformatorblock ersätts tre av Gated Delta Networks – en linjär uppmärksamhetsvariant baserad på det teoretiska arbetet "Gated Delta Networks: Improving Mamba2 with Delta Rule". Endast vart fjärde block förblir ett klassiskt lager med full uppmärksamhet för precisionsuppgifter. Resultatet är en beräkningskomplexitet som bara växer linjärt med kontextlängden – en kategorisk skillnad från den kvadratiska skalningen av klassiska transformatorer.

Konsekvenserna av detta beslut är betydande. I praktiken innebär linjär skalning att modellen med samma datorkraft kan bearbeta betydligt längre texter och producera tokens snabbare än en tät modell med jämförbar intelligens. Qwen3.5-Plus, den hostade versionen via Alibaba Cloud, stöder ett kontextfönster på en miljon tokens – en kapacitet som för bara två år sedan var reserverad exklusivt för specialiserade arkitekturmetoder som Claudes Constitutional AI. Samtidigt minskar hybridarkitekturen drastiskt VRAM-kraven: Medan en klassisk tät modell med 400 miljarder parametrar kräver mer än 800 GB GPU-minne, klarar Qwen3.5-397B-A17B sig med 48 till 96 GB på kvantiserade system.

En ny dimension av digital transformation med 'Managed AI' (Artificial Intelligence) - Plattform & B2B-lösning | Xpert Consulting

En ny dimension av digital transformation med 'Managed AI' (Artificial Intelligence) – Plattform & B2B-lösning | Xpert Consulting - Bild: Xpert.Digital

Här får du lära dig hur ditt företag kan implementera skräddarsydda AI-lösningar snabbt, säkert och utan höga inträdesbarriärer.

En hanterad AI-plattform är din heltäckande och bekymmersfria lösning för artificiell intelligens. Istället för att behöva hantera komplex teknik, dyr infrastruktur och långa utvecklingsprocesser får du en färdig lösning skräddarsydd efter dina behov från en specialiserad partner – ofta inom bara några dagar.

De viktigaste fördelarna i korthet:

⚡ Snabb implementering: Från idé till färdig applikation på dagar, inte månader. Vi levererar praktiska lösningar som skapar omedelbart mervärde.

🔒 Maximal datasäkerhet: Dina känsliga uppgifter stannar hos dig. Vi garanterar säker och korrekt behandling utan att dela data med tredje part.

💸 Ingen ekonomisk risk: Du betalar bara för resultat. Höga initiala investeringar i hårdvara, mjukvara eller personal elimineras helt.

🎯 Fokusera på din kärnverksamhet: Koncentrera dig på det du gör bäst. Vi tar hand om hela den tekniska implementeringen, driften och underhållet av din AI-lösning.

📈 Framtidssäkert och skalbart: Din AI växer med dig. Vi säkerställer kontinuerlig optimering och skalbarhet, och anpassar modellerna flexibelt till nya krav.

Mer information här:

Den hanterade AI-lösningen - Industriella AI-tjänster: Nyckeln till konkurrenskraft inom tjänste-, industri- och maskintekniksektorerna

Kinas nya AI slår Google och OpenAI i en bråkdel av storleken

Modellseriens fyrverkerier: Från 397 miljarder till 0,8 miljarder parametrar

Släppstrategin för Qwen3.5-familjen följde en väl uträknad rytm. Flaggskeppsmodellen, Qwen3.5-397B-A17B, drog igång strax före det kinesiska nyåret: 397 miljarder parametrar totalt, varav endast 17 miljarder är aktiva per token. Denna sparsamma expertblandningsarkitektur orsakade förvåning i det första praktiska testet, eftersom aktiveringsgraden på mindre än fem procent innebar att modellen, trots sin gigantiska totala storlek, uppnådde latensen hos en betydligt mindre modell.

Kort därefter kom det riktiga fyrverkeriet: Qwen3.5-122B-A10B och Qwen3.5-35B-A3B som SMoE-modeller för högpresterande applikationer, och den kompakta Qwen3.5-27B som en allroundmodell för användare som prioriterar hög kvalitet på enskilda uppgifter framför ren inferenshastighet. De första community-utvärderingarna avslöjade en överraskande bild: 27B-modellen, även om den var parametermässigt mindre än SMoE-varianterna, uppnådde starkare resultat i ett flertal riktmärken – en indikation på att den mer komplexa träningsprocessen för glesa arkitekturer ännu inte är helt optimerad och har ytterligare potential.

Den största uppståndelsen orsakades dock av den efterföljande lanseringen av de mindre modellerna: Qwen3.5-9B, Qwen3.5-4B, Qwen3.5-2B och Qwen3.5-0.8B. Dessa modeller är specifikt utformade för användning på vanliga datorer och levererar en prestandatäthet som är praktiskt taget oöverträffad i kompakta språkmodellers historia. Qwen3.5-9B uppnådde en poäng på 81,7 poäng i GPQA Diamond-benchmarket, som testar resonemang på forskarnivå – och överträffade OpenAI:s GPT-oss-120B med 80,1 poäng, en modell med mer än tretton gånger så många parametrar. I det visuella resonemangstestet MMMU-Pro fick 9B-modellen 70,1 poäng jämfört med Gemini 2.5 Flash-Lite med 59,7. Även 4B-modellen orsakade uppståndelse: På Video-MME (med undertexter) uppnådde den 83,5 poäng, långt före Googles 74,6.

Relaterat till detta:

AI-kapplöpning: Alibaba presenterar ny flaggskeppsmodell och sätter press på konkurrenterna – Research

Multimodalitet som standard: Slutet på VL-suffixet

Ett strategiskt betydelsefullt, symboliskt steg i Qwen3.5-familjen är borttagandet av förkortningen "VL" från modellnamnen. Tidigare betecknade "VL" (Vision Language) de modeller som kunde bearbeta bilder – en funktion som alltid behandlades som en ytterligare funktion. I 3.5-generationen är alla modeller utan undantag nativt multimodala: text, bilder och videor bearbetas inte via nedströmsadaptrar, utan integreras snarare från grunden genom tidig fusionsträning.

Detta steg är mer än bara kosmetiskt. Det signalerar en strategisk ompositionering: Qwen ser inte längre multimodalitet som en premiumfunktion för utvalda modellvarianter, utan som ett grundläggande krav för varje modern språkmodell. Den tekniska implementeringen med Early Fusion innebär att bild- och språkförståelse lärs in i ett delat representationsutrymme – med fördelen att modellen kan länka visuell och språklig kunskap djupt istället för att bara kombinera dem ytligt. Qwen 3.5 stöder också 201 språk och dialekter, jämfört med 119 i föregående generation.

Geopolitik i koden: Vad Kinas öppen källkodsoffensiv betyder för den globala AI-marknaden

Bakom dessa tekniska framsteg ligger en geopolitisk dimension som ofta förbises i västerländska medier. År 2025 och 2026 följde den kinesiska AI-industrin en strategi som skulle kunna beskrivas som "open source-underprissättning": modeller med prestanda jämförbar med de dyraste kommersiella leverantörerna släpptes gratis, med en licens som tillät kommersiell användning. Resultatet är en systematisk devalvering av den prispremie som OpenAI, Anthropic och Google tar ut för sina flaggskeppsprodukter.

Alibaba positionerar uttryckligen Qwen3.5 som en konkurrent till GPT-5.2 och Claude 4.5 Opus. I interna testtester överträffade Qwen3.5 båda modellerna på IFBench, ett test som mäter instruktionsföljningskvalitet. På HMMT-resonemanget överträffade Qwen3.5 Claude 4.5 Opus men låg efter GPT-5.2. Detta nyanserade prestandalandskap är karakteristiskt: Qwen3.5 är inte onekligen ledaren i någon enskild kategori, men den är konkurrenskraftig över hela linjen – och allt detta med fullständig öppen källkod.

Marknadens reaktion på denna situation är redan tydlig. Utvecklare, särskilt i resurskänsliga företag, vänder sig till Qwen-derivat eftersom den totala ägandekostnaden för radikal inferens på deras egen hårdvara är drastiskt lägre än API-kostnaderna för kommersiella leverantörer. Detta är en avgörande fördel för B2B-kunder som vill skala upp AI-lösningar utan att betala per token. Prispressen som utövas på marknaden av kinesiska open source-modeller har redan fått OpenAI att positionera mer prisvärda produktlinjer som GPT-5 mini – ett direkt svar på konkurrensen från Qwen.

Riktmärken utan myten: Vad siffrorna verkligen säger

En seriös utvärdering av Qwen3.5-riktmärkena kräver kritisk distans. Alibaba rapporterade sina prestandajämförelser som "självrapporterade" – ett faktum som uttryckligen noterats av CNBC, vilket kräver oberoende verifiering. Dessutom är riktmärken inte neutrala mått: modeller kan förtränas på riktmärkesliknande data, vilket leder till överanpassning för vissa testformat utan att resultera i en verklig prestandaökning vid verklig användning. De communitydrivna tester som genomfördes veckorna efter lanseringen ger en mer blandad, men överlag imponerande, bild.

Resultaten är särskilt robusta när de tillämpas på riktmärken som kräver aktivt resonemang och inte kan lösas genom enbart faktabaserad inhämtning. GPQA Diamond-riktmärket, som ställer frågor från biologi, fysik och kemi på doktorandnivå, anses vara särskilt motståndskraftigt mot manipulation. Det faktum att Qwen3.5-9B överträffar en modell med 120 miljarder parametrar här är, enligt aktuell forskning, inte en mätartefakt utan snarare ett uttryck för den effektivitetshöjande effekten av den nya arkitekturen i kombination med högre kvalitet på träningsdata. Qwen använde en FP8-pipeline och ett asynkront förstärkningsinlärningsramverk för träning – tekniska beslut som ökar dataeffektiviteten och gör träningen mer stabil.

Relaterat till detta:

Alibabas AI-modell Qwen 3: En ny riktmärke inom AI-utveckling och dess inverkan på den globala teknikmarknaden

Agentic AI och nästa steg i utvecklingen av Qwen-plattformen

Alibaba positionerar Qwen3.5 inte som bara ytterligare en chattmodell, utan uttryckligen som den grundläggande arkitekturen för "Agentic AI Era". Detta påstående stöds av betydande tekniska bevis: Reinforcement Learning-träningen har skalats till miljontals agentmiljöer med alltmer komplexa uppgiftsfördelningar – en metod som fokuserar på verklig, flerstegs uppgiftsutförande snarare än statisk kunskapsreproduktion. Qwen3.5-Plus erbjuder inbyggd verktygsanvändning via Alibaba Cloud och ett adaptivt verktygsanvändningssystem som gör det möjligt för agenter att oberoende få åtkomst till externa API:er, databaser och sökfrågor.

Att en språkmodell med 17 miljarder aktiva parametrar kan hantera dessa uppgifter med konkurrenskraftig kvalitet representerar ett fundamentalt skifte i ekonomin för agentbaserade AI-applikationer. Tidigare metoder krävde stora, dyra modeller som agentens hjärna, vilket avsevärt ökade driftskostnaderna för utökade autonoma uppgifter. Qwen3.5-9B, som körs lokalt på hårdvara med en enda avancerad GPU, gör agentbaserade AI-system tillgängliga för den bredare medelstora marknaden och utvecklare utan molnbudgetar. Denna demokratiseringsdynamik skulle avsevärt kunna påskynda implementeringen av AI-agenter i medelstora företag.

Konsulttjänster - Planering - Implementering