Salajane tehisintellekti kuningas: kuidas Alibaba Qwen3.5 annab OpenAI-le ja Google'ile konkurentsi

Konrad Wolfenstein

3 kuud tagasi

Salajane tehisintellekti kuningas: kuidas Alibaba Qwen3.5 annab OpenAI-le ja Google'ile konkurentsi – Pilt: Xpert.Digital

Tasuta premium-i asemel: Hiina geniaalne avatud lähtekoodiga samm ChatGPT & Co vastu.

700 miljonit allalaadimist: Qwen tehisintellekti vaikne revolutsioon, mille kõik kahe silma vahele jätsid

Varjust välja: kuidas Qwenist sai domineeriv platvorm

Pikka aega peeti OpenAI-d ja Google'it tehisintellekti maailma vaieldamatuteks valitsejateks, kuid kulisside taga on toimunud põhimõtteline paradigma muutus. Qwen3.5 mudeliperekonna väljaandmisega ei sea Hiina tehnoloogiahiiglane Alibaba mitte ainult väljakutset väljakujunenud lääne tegijate domineerimisele, vaid muudab täielikult ka tehisintellekti mängureegleid. Radikaalse arhitektuurilise ümberkujundamise abil lahendab Qwen3.5 klassikaliste Transformeri mudelite ressursiprobleemi ja pakub enneolematut jõudlust drastiliselt vähendatud arvutuskoormusega. Strateegia on sama lihtne kui agressiivne: ülivõimsad, natiivselt multimodaalsed avatud lähtekoodiga mudelid tehakse tasuta kättesaadavaks – isegi kompaktsed versioonid pakuvad kohalikul riistvaral jõudlust, mis ei jää mingil moel alla hiiglaslikele kommertssüsteemidele. See samm on palju enamat kui lihtsalt tehniline uuendus. See on geopoliitiline manööver, mis ründab globaalse tehisintellekti turu kasumimarginaale ja juhatab samal ajal sisse massituru autonoomsete tehisintellekti agentide ("Agentic AI") ajastu. Üksikasjalik analüüs näitab, kuidas Alibaba selle saavutuse saavutas ja mida võrdlusnäitajad tegelikult tööstuse tuleviku jaoks tähendavad.

Sellega seotud:

Hiina avatud lähtekoodiga tehisintellekti pealetung: kuidas vaba tarkvara hävitab Silicon Valley mitme miljardi dollari suurust äri

Alibaba vaikne revolutsioon: kuidas Qwen3.5 perekond läbirääkimisi pidab tehisintellekti maailmakorra üle

Hiina avatud lähtekoodiga rünnak tabab OpenAI-d ja Google'it seal, kus see kõige rohkem valutab – nende arhitektuuri

Kui Alibaba avaldas 2025. aasta aprillis Qwen3 mudeliseeria, oli lääne tehnoloogiaajakirjanduse reaktsioon vaoshoitud. Tõsi küll, võimas, kuid lõppkokkuvõttes vaid üks paljudest mudelitest üha tihedamaks muutuval turul – selline oli otsus. See erapooletu hinnang jättis tähelepanuta asjaolu, et Qwen polnud enam nišiprojekt, vaid teel maailma enimkasutatavaks avatud lähtekoodiga tehisintellekti platvormiks saamise suunas. 2026. aasta jaanuaris teatas Qweni meeskond Hugging Face'is 700 miljonist allalaadimisest, saavutades positsiooni, mis edestas isegi Meta Llamat, mis oli aastaid olnud avatud lähtekoodiga keelemudelite vaieldamatu etalon. Numbrid rääkisid enda eest: 2025. aasta detsembris ületas Qweni igakuine allalaadimiste arv kaheksa järgmise populaarseima mudeli – sealhulgas Meta, DeepSeek, OpenAI, Mistral ja Nvidia – koguarvu.

See populaarsus pole juhuslik. Need arvud peegeldavad strateegilist otsust, mida Alibaba on alates 2023. aastast järjepidevalt järginud: avaldada Qweni mudeleid varem, sagedamini ja rohkemates variatsioonides kui tema konkurendid. Praeguseks on Alibaba teinud Qweni komplektist ligi 400 mudelit avatud lähtekoodina kättesaadavaks ja on genereerinud üle 180 000 tuletatud versiooni. Isegi tipptasemel uurimisrühmad toetuvad Qwenile: tehisintellekti pioneeri Fei-Fei Li meeskond treenis oma tunnustatud s1 järeldusmudelit Qweni peal suhteliselt tagasihoidlike ressurssidega. DeepSeek, Hiina modelleerimislabor, mis tekitas 2025. aasta alguses R1-ga ülemaailmse sensatsiooni, on avaldanud kuus kogukonnapõhist mudelit, millest neli põhinevad Qwenil.

Avatud lähtekoodiga tehisintellekti kogukonna kõige olulisemas mõõdikus oli Qwen saavutanud positsiooni, mida turu-uurijad peavad peaaegu vankumatuks võrgustikuefektiks: need, kes Qwenile tuginevad, saavad kasu ulatuslikust tuletismudelite ökosüsteemist, peenhäälestusest, optimeerimisest ja kogukonna toetusest. Need, kes Qweniga konkureerivad, konkureerivad samaaegselt võrgustikuefektide hoorattaga. See struktuuriline tugevus moodustab tausta, mille suhtes tuleb Qwen3.5 mudeliseeriat hinnata.

Arhitektuuriline panus: miks Qwen3.5 mõtleb teisiti kui tema eelkäijad

Qwen3.5 perekonna ja selle eelkäijate peamine erinevus ei seisne mitte lihtsalt parameetrite suurenemises, vaid põhimõttelises arhitektuurilises paradigma muutuses. Klassikalised transformaatormudelid – GPT-4-st Llama kaudu kuni algse Qwen3-ni – tuginevad nn enesetähelepanu mehhanismile, mis matemaatiliselt skaleerub ruutkeskmise keerukusega. See tähendab, et konteksti pikkuse kahekordistamine neljakordistab arvutuslikku töömahtu. See on kitsaskoht, mis muudab pikad dokumendid, ulatuslikud koodibaasid või mitmetunnised vestluste ajalood keelemudelite jaoks nii ressursimahukaks.

Qwen ei lahendanud seda probleemi järkjärgulise optimeerimise teel, nagu DeepSeek oma Multi-Head Latent Attentioniga tegi, vaid radikaalsema arhitektuurilise uuenduskuuri kaudu. Uue arhitektuuri tuumaks on hübriidsegu ekspertide struktuur: igast neljast transformaatorplokist kolm asendatakse Gated Delta Networksiga – lineaarse tähelepanu variandiga, mis põhineb teoreetilisel teosel „Gated Delta Networks: Improving Mamba2 with Delta Rule“. Ainult iga neljas plokk jääb klassikaliseks täieliku tähelepanu kihiks täppisülesannete jaoks. Tulemuseks on arvutuslik keerukus, mis kasvab ainult lineaarselt konteksti pikkusega – kategooriline erinevus klassikaliste transformaatorite ruutskaleerimisest.

Selle otsuse tagajärjed on märkimisväärsed. Praktikas tähendab lineaarne skaleerimine seda, et sama arvutusvõimsuse juures suudab mudel töödelda oluliselt pikemaid tekste ja toota märke kiiremini kui võrreldava intelligentsusega tihe mudel. Alibaba Cloudi kaudu hostitud versioon Qwen3.5-Plus toetab miljoni märgi kontekstiakent – mahtu, mis vaid kaks aastat tagasi oli reserveeritud ainult spetsiaalsetele arhitektuurilistele lähenemisviisidele, nagu Claude'i Constitutional AI. Samal ajal vähendab hübriidarhitektuur drastiliselt videomälu nõudeid: kui klassikaline 400 miljardi parameetriga tihe mudel vajab üle 800 GB GPU-mälu, siis Qwen3.5-397B-A17B saab kvantiseeritud süsteemides hakkama 48–96 GB-ga.

Digitaalse transformatsiooni uus dimensioon hallatud tehisintellekti (AI) abil - platvormi- ja B2B-lahendus | Xpert Consulting

Digitaalse transformatsiooni uus dimensioon hallatud tehisintellekti (AI) abil – platvormi ja B2B lahendus | Xpert Consulting - pilt: Xpert.Digital

Siit saate teada, kuidas teie ettevõte saab kiiresti, turvaliselt ja ilma kõrgete sisenemisbarjäärideta rakendada kohandatud tehisintellekti lahendusi.

Hallatud tehisintellekti platvorm on teie kõikehõlmav ja muretu tehisintellekti lahendus. Keerulise tehnoloogia, kalli infrastruktuuri ja pikkade arendusprotsessidega tegelemise asemel saate spetsialiseerunud partnerilt teie vajadustele vastava valmislahenduse – sageli vaid mõne päeva jooksul.

Peamised eelised lühidalt:

⚡ Kiire teostus: Ideest kasutusvalmis rakenduseni päevade, mitte kuude jooksul. Pakume praktilisi lahendusi, mis loovad kohest lisaväärtust.

🔒 Maksimaalne andmeturve: Teie tundlikud andmed jäävad teie kätte. Garanteerime turvalise ja nõuetele vastava töötlemise ilma andmeid kolmandate osapooltega jagamata.

💸 Finantsriski pole: maksate ainult tulemuste eest. Suured esialgsed investeeringud riist- ja tarkvarasse või personali jäävad täielikult ära.

🎯 Keskendu oma põhitegevusele: Keskendu sellele, mida sa kõige paremini oskad. Meie hoolitseme sinu tehisintellekti lahenduse kogu tehnilise juurutamise, käitamise ja hoolduse eest.

📈 Tulevikukindel ja skaleeritav: teie tehisintellekt kasvab koos teiega. Tagame pideva optimeerimise ja skaleeritavuse ning kohandame mudeleid paindlikult uutele nõuetele.

Lisateavet leiate siit:

Hallatud tehisintellekti lahendus - tööstuslikud tehisintellekti teenused: konkurentsivõime võti teenuste, tööstuse ja masinaehituse sektoris

Hiina uus tehisintellekt edestab Google'it ja OpenAI-d murdosa suuruse poolest

Mudelisarja ilutulestik: 397 miljardilt 0,8 miljardile parameetrile

Qwen3.5 perekonna väljalaskestrateegia järgis hästi kalkuleeritud rütmi. Lipulaevamudel Qwen3.5-397B-A17B pani aluse vahetult enne Hiina uut aastat: kokku 397 miljardit parameetrit, millest iga žetooni kohta on aktiivsed vaid 17 miljardit. See hõre ekspertide segu arhitektuur tekitas esimeses praktilises testis hämmastust, kuna alla viie protsendiline aktiveerimismäär tähendas, et vaatamata hiiglaslikule üldmõõtmele saavutas mudel oluliselt väiksema mudeli latentsuse.

Varsti pärast seda algas tõeline ilutulestik: Qwen3.5-122B-A10B ja Qwen3.5-35B-A3B SMoE mudelitena suure jõudlusega rakenduste jaoks ning tihe Qwen3.5-27B universaalse mudelina kasutajatele, kes seavad kõrge üksikülesande kvaliteedi esikohale puhta järelduskiiruse asemel. Esimesed kogukonna hinnangud näitasid üllatavat pilti: 27B mudel, kuigi parameetrite poolest väiksem kui SMoE variandid, saavutas arvukates võrdlustestides paremaid tulemusi – see näitab, et hõredate arhitektuuride keerukam treeningprotsess pole veel täielikult optimeeritud ja sellel on edasist potentsiaali.

Suurimat elevust tekitas aga väiksemate mudelite – Qwen3.5-9B, Qwen3.5-4B, Qwen3.5-2B ja Qwen3.5-0.8B – hilisem väljalase. Need mudelid on spetsiaalselt loodud kasutamiseks standardarvutites ja pakuvad jõudlustihedust, mis on kompaktsete keelemudelite ajaloos praktiliselt enneolematu. Qwen3.5-9B saavutas GPQA Diamond võrdlusalusel, mis testib akadeemilise kraadiõppe tasemel arutlusvõimet, 81,7 punkti – edestades OpenAI GPT-oss-120B-d 80,1 punktiga, millel on üle kolmeteistkümne korra rohkem parameetreid. Visuaalse arutlusvõime võrdlusalusel MMMU-Pro sai 9B mudel 70,1 punkti, võrreldes Gemini 2.5 Flash-Lite'iga, mis sai 59,7 punkti. Ka 4B mudel tekitas elevust: Video-MME-l (subtiitritega) saavutas see 83,5 punkti, mis on kaugel Google'i 74,6 punktist.

Sellega seotud:

Tehisintellekti võidujooks: Alibaba avalikustab uue lipulaevamudeli ja avaldab konkurentidele survet – Research

Multimodaalsus standardina: VL-sufiksi lõpp

Strateegiliselt oluline ja sümboolne samm Qwen3.5 perekonnas on lühendi "VL" eemaldamine mudelinimedest. Varem tähistas "VL" (Vision Language) neid mudeleid, mis on võimelised pilte töötlema – võimekust, mida alati käsitleti lisafunktsioonina. 3.5 põlvkonnas on kõik mudelid eranditeta natiivselt multimodaalsed: teksti, pilte ja videoid ei töödelda allavoolu adapterite kaudu, vaid need integreeritakse algusest peale varajase fusioonkoolituse kaudu.

See samm on enamat kui pelgalt kosmeetiline. See annab märku strateegilisest ümberpositsioneerimisest: Qwen ei pea multimodaalsust enam valitud mudelivariantide lisafunktsiooniks, vaid iga tänapäevase keelemudeli põhinõudeks. Varajase fusiooni abil teostatud tehniline teostus tähendab, et piltide ja keele mõistmist õpitakse ühises representatsiooniruumis – selle eelisega, et mudel suudab visuaalseid ja keelelisi teadmisi sügavalt siduda, selle asemel, et neid lihtsalt pealiskaudselt kombineerida. Qwen 3.5 toetab ka 201 keelt ja dialekti, võrreldes eelmise põlvkonna 119-ga.

Geopoliitika koodis: mida Hiina avatud lähtekoodiga tarkvara pealetung tähendab ülemaailmsele tehisintellekti turule

Selle tehnoloogilise progressi taga peitub geopoliitiline mõõde, mida lääne meedias sageli tähelepanuta jäetakse. Aastatel 2025 ja 2026 järgis Hiina tehisintellekti tööstus strateegiat, mida võiks kirjeldada kui "avatud lähtekoodiga tarkvara hinna allalöömist": mudeleid, mille jõudlus oli võrreldav kõige kallimate kommertspakkujatega, avaldati tasuta litsentsiga, mis lubas ärilist kasutamist. Tulemuseks on OpenAI, Anthropicu ja Google'i lipulaevtoodete hinnalisa süstemaatiline devalveerimine.

Alibaba positsioneerib Qwen3.5 selgesõnaliselt GPT-5.2 ja Claude 4.5 Opuse konkurendina. Sisemistes võrdlustestides edestas Qwen3.5 mõlemat mudelit IFBenchis, mis on test, mis mõõdab käskude järgimise kvaliteeti. HMMT arutluskäigu võrdlustestis edestas Qwen3.5 Claude 4.5 Opust, kuid jäi maha GPT-5.2-st. See nüansirikas jõudlusmaastik on iseloomulik: Qwen3.5 ei ole vaieldamatult üheski kategoorias liider, kuid see on konkurentsivõimeline igas valdkonnas – ja seda kõike täielikult avatud lähtekoodiga.

Turu reaktsioon sellele olukorrale on juba ilmne. Arendajad, eriti ressursitundlikes ettevõtetes, pöörduvad Qweni derivaatide poole, kuna radikaalse järelduse omamise kogukulud nende enda riistvaral on oluliselt madalamad kui kommertspakkujate API-kulud. See on oluline eelis B2B-klientidele, kes soovivad tehisintellekti lahendusi skaleerida ilma žetooni eest maksmata. Hiina avatud lähtekoodiga mudelite turule avaldatav hinnasurve on juba ajendanud OpenAI-d positsioneerima taskukohasemaid tootesarju, näiteks GPT-5 mini – otsene vastus Qweni konkurentsile.

Võrdlusnäitajad ilma müüdita: mida numbrid tegelikult ütlevad

Qwen3.5 võrdlusaluste tõsine hindamine nõuab kriitilist distantsi. Alibaba teatas oma jõudlusvõrdlustest kui "enesehinnangust" – fakt, mida CNBC selgesõnaliselt märkis, mis nõuab sõltumatut kontrolli. Lisaks ei ole võrdlusalused neutraalsed mõõdikud: mudeleid saab eelnevalt treenida võrdlusaluste sarnaste andmete põhjal, mis viib teatud testivormingutele ülekohandamiseni, ilma et reaalses kasutuses oleks tegelikku jõudluse kasvu. Kogukonna juhitud testid, mis viidi läbi nädalatel pärast avaldamist, maalivad segasema, kuid üldiselt muljetavaldava pildi.

Tulemused on eriti usaldusväärsed, kui neid rakendatakse võrdlusaluste puhul, mis nõuavad aktiivset mõtlemist ja mida ei saa lahendada pelgalt faktide otsimise teel. GPQA Diamondi võrdlusalust, mis esitab doktoritasemel küsimusi bioloogiast, füüsikast ja keemiast, peetakse eriti manipuleeritavaks. Asjaolu, et Qwen3.5-9B ületab siin 120 miljardi parameetriga mudeli, ei ole praeguste uuringute kohaselt mõõtmise artefakt, vaid pigem uue arhitektuuri efektiivsust suurendava efekti väljendus koos kvaliteetsemate treeningandmetega. Qwen kasutas treeninguks FP8 torujuhet ja asünkroonset tugevdusõppe raamistikku – tehnilisi otsuseid, mis suurendavad andmete tõhusust ja muudavad treeningu stabiilsemaks.

Sellega seotud:

Alibaba Qwen 3 tehisintellekti mudel: uus etalon tehisintellekti arendamisel ja selle mõju globaalsele tehnoloogiaturule

Agentne tehisintellekt ja Qweni platvormi järgmine arenguetapp

Alibaba positsioneerib Qwen3.5 mitte lihtsalt järjekordse vestlusmudelina, vaid otseselt „agentide tehisintellekti ajastu” alusarhitektuurina. Seda väidet toetavad olulised tehnilised tõendid: tugevdusõppe koolitust on skaleeritud miljonitele agentide keskkondadele, kus ülesannete jaotus on üha keerukam – see metoodika keskendub pigem reaalsele, mitmeastmelisele ülesannete täitmisele kui staatilisele teadmiste taastootmisele. Qwen3.5-Plus pakub natiivset tööriistakasutust Alibaba Cloudi kaudu ja adaptiivset tööriistakasutussüsteemi, mis võimaldab agentidel iseseisvalt juurde pääseda välistele API-dele, andmebaasidele ja otsingupäringutele.

Asjaolu, et 17 miljardi aktiivse parameetriga keelemudel suudab neid ülesandeid konkurentsivõimelise kvaliteediga täita, kujutab endast olulist nihet agendipõhiste tehisintellekti rakenduste majanduses. Varasemad lähenemisviisid nõudsid agendi ajuna suuri ja kalleid mudeleid, mis suurendas oluliselt laiendatud autonoomsete ülesannete tegevuskulusid. Qwen3.5-9B, mis töötab lokaalselt riistvaral ühe tipptasemel GPU-ga, muudab agendipõhised tehisintellekti süsteemid kättesaadavaks laiemale keskmise suurusega ettevõtetele ja arendajatele ilma pilveteenuste eelarveta. See demokratiseerimise dünaamika võib oluliselt kiirendada tehisintellekti agentide kasutuselevõttu keskmise suurusega ettevõtetes.

Nõustamine - Planeerimine - Rakendamine