Titkos MI Király: Hogyan az Alibaba Qwen3.5-je miatt az OpenAI és a Google is versenybe szállhat egymással?

Konrad Wolfenstein

3 hónappal ezelőtt

Titkos MI Király: Hogyan az Alibaba Qwen3.5-je miatt az OpenAI és a Google is versenybe szállhat egymással?

Titkos MI-király: Hogyan az Alibaba Qwen3.5-je versenyre sodorja az OpenAI-t és a Google-t – Kép: Xpert.Digital

Ingyenes a prémium helyett: Kína ötletes nyílt forráskódú lépése a ChatGPT és társai ellen.

700 millió letöltés: A Qwen mesterséges intelligencia csendes forradalma, amelyet mindenki figyelmen kívül hagyott

Az árnyékból: Hogyan vált a Qwen domináns platformmá

Hosszú ideig az OpenAI-t és a Google-t tartották a mesterséges intelligencia világának vitathatatlan urainak, de a színfalak mögött alapvető paradigmaváltás zajlik. A Qwen3.5 modellcsalád megjelenésével a kínai technológiai óriás, az Alibaba nemcsak a nyugati szereplők dominanciáját kérdőjelezi meg, hanem teljesen újraértelmezi a mesterséges intelligencia játékszabályait is. Egy radikális architektúra-átalakítás révén a Qwen3.5 megoldja a klasszikus Transformer modellek erőforrás-problémáját, és drasztikusan csökkentett számítási erőfeszítéssel páratlan teljesítményt nyújt. A stratégia olyan egyszerű, mint amilyen agresszív: nagy teljesítményű, natívan multimodális, nyílt forráskódú modelleket tesznek ingyenesen elérhetővé – még a kompakt verziók is olyan teljesítményt nyújtanak a helyi hardvereken, amely semmivel sem marad el a gigantikus kereskedelmi rendszerektől. Ez a lépés sokkal több, mint egy egyszerű technikai frissítés. Ez egy geopolitikai manőver, amely a globális MI-piac profitmarzsát támadja, és egyidejűleg bevezeti a tömegpiaci, autonóm MI-ügynökök ("Agentic AI") korszakát. Egy részletes elemzés bemutatja, hogyan érte el az Alibaba ezt a teljesítményt, és mit jelentenek valójában a benchmark adatok az iparág jövője szempontjából.

Ehhez kapcsolódóan:

Kína nyílt forráskódú offenzívája a mesterséges intelligencia területén: Hogyan teszi tönkre a szabad szoftver a Szilícium-völgy több milliárd dolláros üzletét?

Az Alibaba csendes forradalma: Hogyan tárgyalja újra a Qwen3.5 család a mesterséges intelligencia világrendjét?

Kína nyílt forráskódú támadása az OpenAI-t és a Google-t ott sújtja, ahol a legjobban fáj – az architektúrájukban

Amikor az Alibaba 2025 áprilisában kiadta a Qwen3 modellsorozatot, a nyugati technológiai újságírás reakciója visszafogott volt. Kétségtelenül erőteljes, de végső soron csak egy a sok modell közül egy egyre zsúfoltabb piacon – ez volt az ítélet. Amit ez a szenvtelen értékelés figyelmen kívül hagyott, az az volt, hogy a Qwen már nem résprojekt, hanem úton van afelé, hogy a világ legszélesebb körben használt nyílt forráskódú MI-platformjává váljon. 2026 januárjában a Qwen csapata 700 millió letöltésről számolt be a Hugging Face-en, ezzel olyan pozíciót elérve, amely még a Meta Llamáját is meghaladta, amely évekig a nyílt forráskódú nyelvi modellek vitathatatlan mércéje volt. A számok magukért beszéltek: 2025 decemberében a havi Qwen-letöltések száma meghaladta a következő nyolc legnépszerűbb modell – köztük a Meta, a DeepSeek, az OpenAI, a Mistral és az Nvidia – együttes letöltéseit.

Ez a népszerűség nem véletlen. A számok egy olyan stratégiai döntést tükröznek, amelyet az Alibaba 2023 óta következetesen követett: a Qwen modelleket korábban, gyakrabban és több variációban kiadni, mint versenytársai. A mai napig az Alibaba közel 400 modellt tett elérhetővé a Qwen csomagból nyílt forráskódúként, és több mint 180 000 származtatott verziót generált. Még a legkiválóbb kutatócsoportok is a Qwenre támaszkodnak: A mesterséges intelligencia úttörője, Fei-Fei Li körüli csapat viszonylag szerény erőforrásokkal képezte ki elismert s1 következtetési modelljét a Qwen-en. A DeepSeek, a kínai modellező laboratórium, amely 2025 elején globális szenzációt okozott az R1-gyel, hat közösségalapú modellt adott ki – amelyek közül négy a Qwen-en alapul.

A nyílt forráskódú mesterséges intelligencia közösség legfontosabb mérőszámában a Qwen így olyan pozíciót ért el, amelyet a piackutatók szinte megingathatatlan hálózati hatásnak tekintenek: Azok, akik a Qwen-re építenek, a származtatott modellek, a finomhangolás, az optimalizálás és a közösségi támogatás hatalmas ökoszisztémájából profitálnak. Azok, akik a Qwen-nel versenyeznek, egyidejűleg a hálózati hatások lendületével is versenyeznek. Ez a strukturális erősség alkotja azt a hátteret, amelyhez képest a Qwen3.5 modellsorozatot értékelni kell.

Az építészeti tét: Miért gondolkodik másképp a Qwen3.5, mint elődei?

A Qwen3.5 család és elődei közötti döntő különbség nem a paraméterek egyszerű növelésében rejlik, hanem egy alapvető architekturális paradigmaváltásban. A klasszikus transzformátor modellek – a GPT-4-től a Llamán át az eredeti Qwen3-ig – az úgynevezett önfigyelem mechanizmusára támaszkodnak, amely matematikailag kvadratikus komplexitással skálázódik. Ez azt jelenti, hogy a kontextus hosszának megduplázása négyszeresére növeli a számítási erőfeszítést. Ez az a szűk keresztmetszet, ami miatt a hosszú dokumentumok, a kiterjedt kódbázisok vagy a többórás beszélgetési előzmények olyan erőforrás-igényesek a nyelvi modellek számára.

A Qwen nem fokozatos optimalizálással oldotta meg ezt a problémát, ahogy azt a DeepSeek tette a Multi-Head Latent Attentionnel, hanem egy radikálisabb architektúrai átalakítással. Az új architektúra magja a Hybrid Mixture of Experts struktúra: Minden négy transzformátor blokkból hármat Gated Delta Networks vált fel – egy lineáris figyelmi változat, amely a „Gated Delta Networks: Improvement Mamba2 with Delta Rule” című elméleti munkán alapul. Csak minden negyedik blokk marad klasszikus teljes figyelmi réteg a precíziós feladatokhoz. Az eredmény olyan számítási komplexitás, amely csak lineárisan növekszik a kontextus hosszával – ez kategorikus különbség a klasszikus transzformátorok kvadratikus skálázásához képest.

Ennek a döntésnek jelentős következményei vannak. A gyakorlatban a lineáris skálázás azt jelenti, hogy azonos számítási teljesítmény mellett a modell lényegesen hosszabb szövegeket képes feldolgozni és tokeneket gyorsabban előállítani, mint egy hasonló intelligenciájú sűrű modell. A Qwen3.5-Plus, az Alibaba Cloudon keresztül hosztolt verzió, egymillió token kontextuális ablakot támogat – ezt a kapacitást mindössze két évvel ezelőtt kizárólag olyan speciális építészeti megközelítéseknek tartották fenn, mint Claude Constitutional AI-ja. Ugyanakkor a hibrid architektúra drasztikusan csökkenti a VRAM-igényt: Míg egy klasszikus, 400 milliárd paraméteres sűrű modell több mint 800 GB GPU-memóriát igényel, a Qwen3.5-397B-A17B 48-96 GB-tal is elboldogul kvantált rendszereken.

A digitális átalakulás új dimenziója a „menedzselt MI” (mesterséges intelligencia) segítségével - Platform és B2B megoldás | Xpert Consulting

A digitális átalakulás új dimenziója a „menedzselt MI” (mesterséges intelligencia) segítségével – Platform és B2B megoldás | Xpert Consulting - Kép: Xpert.Digital

Itt megtudhatja, hogyan valósíthat meg vállalata testreszabott mesterséges intelligencia megoldásokat gyorsan, biztonságosan és magas belépési korlátok nélkül.

Egy menedzselt MI platform az Ön átfogó, gondtalan megoldása a mesterséges intelligencia területén. Ahelyett, hogy komplex technológiával, drága infrastruktúrával és hosszadalmas fejlesztési folyamatokkal kellene bajlódnia, egy specializált partnertől kap egy az Ön igényeire szabott, kész megoldást – gyakran mindössze néhány napon belül.

A legfontosabb előnyök egy pillantásra:

⚡ Gyors megvalósítás: Az ötlettől a használatra kész alkalmazásig napok, nem hónapok alatt. Gyakorlati megoldásokat szállítunk, amelyek azonnal hozzáadott értéket teremtenek.

🔒 Maximális adatbiztonság: Érzékeny adatai Önnél maradnak. Garantáljuk a biztonságos és megfelelő feldolgozást anélkül, hogy megosztanánk az adatokat harmadik felekkel.

💸 Nincs pénzügyi kockázat: Csak az eredményekért fizet. A hardverbe, szoftverbe vagy személyzetbe történő magas előzetes beruházások teljesen elmaradnak.

🎯 Koncentrálj a fő üzleti tevékenységedre: Koncentrálj arra, amiben a legjobb vagy. Mi gondoskodunk a mesterséges intelligencia megoldásod teljes technikai megvalósításáról, üzemeltetéséről és karbantartásáról.

📈 Jövőálló és skálázható: A mesterséges intelligencia veled együtt növekszik. Folyamatos optimalizálást és skálázhatóságot biztosítunk, és rugalmasan igazítjuk a modelleket az új követelményekhez.

További információ itt:

A menedzselt MI-megoldás - Ipari MI-szolgáltatások: A versenyképesség kulcsa a szolgáltatási, ipari és gépészeti szektorokban

Kína új mesterséges intelligenciája töredéknyi méretben veri a Google-t és az OpenAI-t

A modellsorozat tűzijátéka: 397 milliárdtól 0,8 milliárd paraméterig

A Qwen3.5 család kiadási stratégiája egy jól kiszámított ritmust követett. A zászlóshajó modell, a Qwen3.5-397B-A17B, röviddel a kínai újév előtt indította el a programot: összesen 397 milliárd paraméterrel, amelyek közül tokenenként mindössze 17 milliárd aktív. Ez a ritka, szakértőkből álló architektúra az első gyakorlati teszten meglepetést okozott, mivel az öt százaléknál kisebb aktiválási arány azt jelentette, hogy a modell a hatalmas mérete ellenére egy lényegesen kisebb modell késleltetését érte el.

Röviddel ezután jött az igazi tűzijáték: a Qwen3.5-122B-A10B és a Qwen3.5-35B-A3B SMoE modellekként nagy teljesítményű alkalmazásokhoz, valamint a sűrű Qwen3.5-27B, mint univerzális modell azoknak a felhasználóknak, akik a magas egyfeladatos minőséget helyezik előtérbe a puszta következtetési sebességgel szemben. Az első közösségi értékelések meglepő képet tártak fel: a 27B modell, bár paramétereit tekintve kisebb, mint az SMoE variánsok, számos benchmarkban erősebb eredményeket ért el – ami arra utal, hogy a ritka architektúrák összetettebb betanítási folyamata még nincs teljesen optimalizálva, és további potenciállal rendelkezik.

A legnagyobb feltűnést azonban a kisebb modellek későbbi megjelenése váltotta ki: Qwen3.5-9B, Qwen3.5-4B, Qwen3.5-2B és Qwen3.5-0.8B. Ezeket a modelleket kifejezetten standard számítógépeken való használatra tervezték, és olyan teljesítménysűrűséget biztosítanak, amely gyakorlatilag példátlan a kompakt nyelvi modellek történetében. A Qwen3.5-9B 81,7 pontot ért el a GPQA Diamond benchmarkban, amely az akadémiai posztgraduális gondolkodást méri – meghaladva az OpenAI GPT-oss-120B modelljét 80,1 ponttal, amely több mint tizenháromszoros paraméterrel rendelkezik. Az MMMU-Pro vizuális gondolkodási benchmarkban a 9B modell 70,1 pontot ért el, míg a Gemini 2.5 Flash-Lite 59,7 pontot ért el. A 4B modell szintén feltűnést keltett: a Video-MME-n (feliratokkal) 83,5 pontot ért el, ami messze meghaladja a Google 74,6 pontját.

Ehhez kapcsolódóan:

MI-verseny: Az Alibaba bemutatta új zászlóshajó modelljét és nyomást gyakorol a versenytársakra – Kutatás

Multimodalitás, mint standard: A VL utótag vége

A Qwen3.5 család stratégiailag jelentős, szimbolikus lépése a "VL" rövidítés eltávolítása a modellnevekből. Korábban a "VL" (Vision Language) azokat a modelleket jelölte, amelyek képesek képek feldolgozására – ezt a képességet mindig további funkcióként kezelték. A 3.5 generációban minden modell kivétel nélkül natívan multimodális: a szöveget, a képeket és a videókat nem downstream adapterek dolgozzák fel, hanem a kezdeti fúziós betanításon keresztül integrálják a rendszert a nulláról.

Ez a lépés több mint pusztán kozmetikai jellegű. Stratégiai újrapozícionálást jelez: a Qwen a multimodalitást már nem egyes modellváltozatok prémium funkciójának tekinti, hanem minden modern nyelvi modell alapvető követelményének. Az Early Fusion használatával megvalósított technikai megvalósítás azt jelenti, hogy a kép- és nyelvi megértés egy közös reprezentációs térben történik – azzal az előnnyel, hogy a modell mélyen összekapcsolhatja a vizuális és nyelvi ismereteket, ahelyett, hogy csupán felületesen kombinálná őket. A Qwen 3.5 201 nyelvet és dialektust is támogat, szemben az előző generáció 119-cel.

Geopolitika a kódban: Mit jelent Kína nyílt forráskódú offenzívája a globális mesterséges intelligencia piac számára?

E technológiai fejlődés mögött egy geopolitikai dimenzió húzódik meg, amelyet a nyugati média gyakran figyelmen kívül hagy. 2025-ben és 2026-ban a kínai mesterséges intelligenciaipar egy olyan stratégiát követett, amelyet „nyílt forráskódú alákínálásként” lehetne leírni: a legdrágább kereskedelmi szolgáltatókéhoz hasonló teljesítményű modelleket ingyenesen bocsátották ki, egy olyan licenccel, amely lehetővé tette a kereskedelmi felhasználást. Ennek eredményeként szisztematikusan leértékelődött az OpenAI, az Anthropic és a Google által a zászlóshajó termékeikért felszámított árprémium.

Az Alibaba kifejezetten a GPT-5.2 és a Claude 4.5 Opus versenytársaként pozicionálja a Qwen3.5-öt. Belső benchmarkokban a Qwen3.5 mindkét modellt felülmúlta az IFBench-en, egy olyan teszten, amely az utasításkövetés minőségét méri. A HMMT logikai benchmarkon a Qwen3.5 felülmúlta a Claude 4.5 Opus-t, de lemaradt a GPT-5.2-től. Ez az árnyalt teljesítményteszt jellemző: a Qwen3.5 tagadhatatlanul nem vezető egyetlen kategóriában sem, de minden tekintetben versenyképes – és mindezt teljesen nyílt forráskódú szoftverrel.

A piac reakciója erre a helyzetre már nyilvánvaló. A fejlesztők, különösen az erőforrás-érzékeny vállalatoknál, a Qwen-származékok felé fordulnak, mivel a radikális következtetés teljes birtoklási költsége saját hardverükön drasztikusan alacsonyabb, mint a kereskedelmi szolgáltatók API-költségei. Ez döntő előnyt jelent a B2B ügyfelek számára, akik tokenenkénti fizetés nélkül szeretnék skálázni a mesterséges intelligencia megoldásokat. A kínai nyílt forráskódú modellek által a piacon gyakorolt árnyomás már arra késztette az OpenAI-t, hogy megfizethetőbb termékcsaládokat, például a GPT-5 mini-t pozicionáljon – ez közvetlen válasz a Qwen versenyére.

Mítoszmentes referenciaértékek: Mit mondanak valójában a számok?

A Qwen3.5 benchmarkok komoly értékeléséhez kritikus távolságtartás szükséges. Az Alibaba a teljesítmény-összehasonlításait „önbevalláson alapulóként” jelentette – ezt a CNBC kifejezetten megjegyezte, ami független ellenőrzést tesz szükségessé. Továbbá a benchmarkok nem semleges mérőszámok: a modellek előre betaníthatók benchmark-szerű adatokon, ami bizonyos tesztformátumok túlillesztéséhez vezethet anélkül, hogy valódi teljesítménynövekedést eredményezne a valós használatban. A megjelenést követő hetekben végzett, közösség által vezérelt tesztek vegyesebb, de összességében lenyűgöző képet festenek.

Az eredmények különösen robusztusak, ha olyan benchmarkokra alkalmazzák őket, amelyek aktív gondolkodást igényelnek, és nem oldhatók meg pusztán tényszerű visszakereséssel. A GPQA Diamond benchmark, amely doktori szintű biológiai, fizikai és kémiai kérdéseket vet fel, különösen ellenállónak tekinthető a manipulációval szemben. Az a tény, hogy a Qwen3.5-9B itt felülmúl egy 120 milliárd paraméteres modellt, a jelenlegi kutatások szerint nem mérési műtermék, hanem az új architektúra hatékonyságnövelő hatásának kifejeződése a jobb minőségű betanítási adatokkal kombinálva. A Qwen egy FP8 folyamatot és egy aszinkron megerősítéses tanulási keretrendszert alkalmazott a betanításhoz – olyan technikai döntések, amelyek növelik az adathatékonyságot és stabilabbá teszik a betanítást.

Ehhez kapcsolódóan:

Az Alibaba Qwen 3 mesterséges intelligencia modellje: Új mércét jelent a mesterséges intelligencia fejlesztésében, és annak hatása a globális technológiai piacra

Az ügynökségi mesterséges intelligencia és a Qwen platform fejlesztésének következő szakasza

Az Alibaba a Qwen3.5-öt nem csupán egy újabb csevegési modellként, hanem kifejezetten az „ügynöki mesterséges intelligencia korszak” alapvető architektúrájaként pozicionálja. Ezt az állítást jelentős technikai bizonyítékok támasztják alá: A megerősítéses tanuláson alapuló képzést több millió ügynökkörnyezetre skálázták, egyre összetettebb feladatelosztással – ez a módszertan a valós, többlépcsős feladatvégrehajtásra összpontosít, nem pedig a statikus tudásreprodukcióra. A Qwen3.5-Plus natív eszközhasználatot kínál az Alibaba Cloudon keresztül, valamint egy adaptív eszközhasználati rendszert, amely lehetővé teszi az ügynökök számára, hogy függetlenül hozzáférjenek külső API-khoz, adatbázisokhoz és keresési lekérdezésekhez.

Az a tény, hogy egy 17 milliárd aktív paraméterrel rendelkező nyelvi modell versenyképes minőségben képes kezelni ezeket a feladatokat, alapvető változást jelent az ágensalapú MI-alkalmazások gazdaságosságában. A korábbi megközelítések nagy, drága modelleket igényeltek az ágens agyaként, ami jelentősen megnövelte a kiterjesztett autonóm feladatok üzemeltetési költségeit. A Qwen3.5-9B, amely lokálisan, hardveren fut egyetlen csúcskategóriás GPU-val, elérhetővé teszi az ágensalapú MI-rendszereket a szélesebb középvállalatok és a felhőalapú költségvetés nélküli fejlesztők számára. Ez a demokratizálódási dinamika jelentősen felgyorsíthatja az MI-ágensek elterjedését a középvállalatoknál.

Tanácsadás - Tervezés - Megvalósítás