Tajný král umělé inteligence: Jak Qwen3.5 od Alibaby konkuruje OpenAI a Googlu

Konrad Wolfenstein

Před 3 měsíci

Tajný král umělé inteligence: Jak Qwen3.5 od Alibaby konkuruje OpenAI a Googlu – Obrázek: Xpert.Digital

Zdarma místo prémiového: Důmyslný čínský open-source krok proti ChatGPT a dalším.

700 milionů stažení: Tichá revoluce umělé inteligence Qwen, kterou všichni přehlédli

Ze stínů: Jak se Qwen stala dominantní platformou

OpenAI a Google byly dlouho považovány za nesporné vládce světa umělé inteligence, ale v zákulisí dochází k zásadnímu posunu paradigmatu. S uvedením modelové řady Qwen3.5 čínský technologický gigant Alibaba nejen zpochybňuje dominanci zavedených západních hráčů, ale také kompletně předefinovává pravidla hry pro umělou inteligenci. Prostřednictvím radikální architektonické změny Qwen3.5 řeší problém se zdroji klasických modelů Transformer a poskytuje bezprecedentní výkon s drasticky sníženou výpočetní náročností. Strategie je jednoduchá a agresivní: Vysoce výkonné, nativně multimodální open-source modely jsou k dispozici zdarma – i kompaktní verze nabízejí výkon na lokálním hardwaru, který v žádném případě není horší než gigantické komerční systémy. Tento krok je mnohem víc než jen technická aktualizace. Jde o geopolitický manévr, který útočí na ziskové marže globálního trhu s umělou inteligencí a zároveň zahajuje éru masově prodávaných autonomních agentů umělé inteligence („Agentic AI“). Podrobná analýza ukazuje, jak Alibaba tohoto výkonu dosáhla a co benchmarková čísla skutečně znamenají pro budoucnost odvětví.

Souvisí s tím:

Čínská ofenziva open-source v oblasti umělé inteligence: Jak svobodný software ničí multimiliardový byznys Silicon Valley

Tichá revoluce Alibaby: Jak rodina Qwen3.5 znovu vyjednává o světovém řádu umělé inteligence

Čínský útok na open source zasáhl OpenAI a Google tam, kde to bolí nejvíce – v jejich architektuře

Když Alibaba v dubnu 2025 uvedla na trh modelovou řadu Qwen3, reakce západní technologické žurnalistiky byly tlumené. Nepochybně výkonné, ale v konečném důsledku jen jeden z mnoha modelů na stále přeplněnějším trhu – takový byl verdikt. Co toto nezaujaté hodnocení přehlédlo, bylo, že Qwen již nebyl specializovaným projektem, ale spíše na cestě stát se nejpoužívanější open-source platformou umělé inteligence na světě. V lednu 2026 tým Qwen oznámil 700 milionů stažení Hugging Face, čímž dosáhl pozice, která dokonce překonala Meta Llama, po mnoho let nesporný standard pro open-source jazykové modely. Čísla mluvila sama za sebe: V prosinci 2025 měsíční stažení Qwen překročila součet dalších osmi nejpopulárnějších modelů – včetně Meta, DeepSeek, OpenAI, Mistral a Nvidia.

Tato popularita není náhodná. Čísla odrážejí strategické rozhodnutí, které Alibaba důsledně sleduje od roku 2023: vydávat modely Qwen dříve, častěji a ve více variantách než její konkurenti. Alibaba k dnešnímu dni zpřístupnila téměř 400 modelů ze sady Qwen jako open source a vygenerovala více než 180 000 odvozených verzí. Na Qwen se spoléhají i špičkové výzkumné skupiny: Tým kolem průkopníka umělé inteligence Fei-Fei Liho natrénoval svůj uznávaný inferenční model s1 na Qwen s poměrně skromnými zdroji. DeepSeek, čínská modelovací laboratoř, která způsobila globální senzaci s R1 na začátku roku 2025, vydala šest komunitních modelů – z nichž čtyři jsou založeny na Qwen.

V nejdůležitější metrice komunity open-source umělé inteligence tak Qwen dosáhl pozice, kterou výzkumníci trhu považují za téměř neotřesitelný síťový efekt: Ti, kdo staví na Qwen, těží z rozsáhlého ekosystému odvozených modelů, jemného doladění, optimalizací a podpory komunity. Ti, kdo konkurují Qwen, zároveň soupeří s setrvačníkem síťových efektů. Tato strukturální síla tvoří pozadí, na kterém musí být modelová řada Qwen3.5 hodnocena.

Architektonická sázka: Proč Qwen3.5 uvažuje jinak než jeho předchůdci

Zásadní rozdíl mezi rodinou Qwen3.5 a jejími předchůdci nespočívá v jednoduchém zvýšení parametrů, ale v zásadním architektonickém posunu paradigmatu. Klasické transformační modely – od GPT-4 přes Llama až po původní Qwen3 – se spoléhají na tzv. mechanismus sebepozornosti, který se matematicky škáluje s kvadratickou složitostí. To znamená, že zdvojnásobení délky kontextu čtyřnásobně zvyšuje výpočetní úsilí. Toto je úzké hrdlo, které způsobuje, že dlouhé dokumenty, rozsáhlé kódové základny nebo několikahodinové historie konverzací jsou pro jazykové modely tak náročné na zdroje.

Společnost Qwen tento problém nevyřešila postupnými optimalizacemi, jako to udělala společnost DeepSeek se svou technologií Multi-Head Latent Attention, ale radikálnější architektonickou revizí. Jádrem nové architektury je struktura Hybrid Mixture of Experts: Z každých čtyř bloků transformátoru jsou tři nahrazeny sítěmi Gated Delta Networks – variantou lineární pozornosti založenou na teoretické práci „Gated Delta Networks: Improving Mamba2 with Delta Rule“. Pouze každý čtvrtý blok zůstává klasickou vrstvou plné pozornosti pro přesné úlohy. Výsledkem je výpočetní složitost, která roste pouze lineárně s délkou kontextu – což je kategorický rozdíl od kvadratického škálování klasických transformátorů.

Důsledky tohoto rozhodnutí jsou významné. V praxi lineární škálování znamená, že se stejným výpočetním výkonem dokáže model zpracovávat podstatně delší texty a produkovat tokeny rychleji než hustý model se srovnatelnou inteligencí. Qwen3.5-Plus, hostovaná verze přes Alibaba Cloud, podporuje kontextové okno jednoho milionu tokenů – kapacitu, která byla ještě před dvěma lety vyhrazena výhradně pro specializované architektonické přístupy, jako je Claudeova ústavní umělá inteligence. Hybridní architektura zároveň drasticky snižuje požadavky na VRAM: Zatímco klasický model s hustotou 400 miliard parametrů vyžaduje více než 800 GB paměti GPU, Qwen3.5-397B-A17B si na kvantovaných systémech poradí s 48 až 96 GB.

Nový rozměr digitální transformace s „řízenou AI“ (umělou inteligencí) – platforma a řešení B2B | Xpert Consulting

Nový rozměr digitální transformace s „řízenou AI“ (umělou inteligencí) – platforma a řešení B2B | Xpert Consulting - Obrázek: Xpert.Digital

Zde se dozvíte, jak může vaše společnost rychle, bezpečně a bez vysokých vstupních bariér implementovat řešení umělé inteligence na míru.

Spravovaná platforma umělé inteligence je vaším komplexním a bezstarostným řešením pro umělou inteligenci. Místo řešení složitých technologií, drahé infrastruktury a zdlouhavých vývojových procesů získáte hotové řešení šité na míru vašim potřebám od specializovaného partnera – často během několika dní.

Klíčové výhody na první pohled:

⚡ Rychlá implementace: Od nápadu k aplikaci připravené k použití během několika dnů, nikoli měsíců. Dodáváme praktická řešení, která vytvářejí okamžitou přidanou hodnotu.

🔒 Maximální zabezpečení dat: Vaše citlivá data zůstanou u vás. Garantujeme bezpečné a kompatibilní zpracování bez sdílení dat s třetími stranami.

💸 Žádné finanční riziko: Platíte pouze za výsledky. Vysoké počáteční investice do hardwaru, softwaru nebo personálu jsou zcela eliminovány.

🎯 Zaměřte se na své hlavní podnikání: Soustřeďte se na to, co děláte nejlépe. Postaráme se o kompletní technickou implementaci, provoz a údržbu vašeho řešení s umělou inteligencí.

📈 Připraveno na budoucnost a škálovatelné: Vaše umělá inteligence roste s vámi. Zajišťujeme neustálou optimalizaci a škálovatelnost a flexibilně přizpůsobujeme modely novým požadavkům.

Více informací zde:

Řešení spravované umělé inteligence – Průmyslové služby umělé inteligence: Klíč ke konkurenceschopnosti v odvětvích služeb, průmyslu a strojírenství

Nová čínská umělá inteligence poráží Google a OpenAI jen o zlomek velikosti

Ohňostroj modelové řady: Z 397 miliard na 0,8 miliardy parametrů

Strategie vydávání produktů rodiny Qwen3.5 se řídila dobře promyšleným rytmem. Vlajkový model Qwen3.5-397B-A17B se rozjel krátce před čínským Novým rokem: celkem 397 miliard parametrů, z nichž na jeden token je aktivních pouze 17 miliard. Tato architektura s nízkým počtem expertů způsobila v prvním praktickém testu úžas, protože míra aktivace nižší než pět procent znamenala, že i přes svou gigantickou celkovou velikost dosáhl model latence výrazně menšího modelu.

Krátce poté přišel skutečný ohňostroj: Qwen3.5-122B-A10B a Qwen3.5-35B-A3B jako modely SMoE pro vysoce výkonné aplikace a hustý Qwen3.5-27B jako univerzální řešení pro uživatele, kteří upřednostňují vysokou kvalitu jednotlivých úloh před rychlostí čisté inference. První hodnocení komunitou odhalila překvapivý obrázek: Model 27B, ačkoli byl parametricky menší než varianty SMoE, dosáhl v řadě benchmarků lepších výsledků – což naznačuje, že složitější trénovací proces pro řídké architektury ještě není plně optimalizován a má další potenciál.

Největší rozruch však způsobilo následné uvedení menších modelů: Qwen3.5-9B, Qwen3.5-4B, Qwen3.5-2B a Qwen3.5-0.8B. Tyto modely jsou speciálně navrženy pro použití na standardních počítačích a poskytují výkonnostní hustotu, která je v historii kompaktních jazykových modelů prakticky bezprecedentní. Qwen3.5-9B dosáhl v benchmarku GPQA Diamond, který testuje akademické uvažování na úrovni absolventů, skóre 81,7 bodů – překonal tak OpenAI GPT-oss-120B s 80,1 body, model s více než třináctinásobným počtem parametrů. V benchmarku vizuálního uvažování MMMU-Pro dosáhl model 9B 70,1 bodů ve srovnání s Gemini 2.5 Flash-Lite s 59,7. Model 4B také způsobil rozruch: V testu Video-MME (s titulky) dosáhl 83,5 bodů, což je daleko za 74,6 bodů od Googlu.

Souvisí s tím:

Závod v oblasti umělé inteligence: Alibaba představuje nový vlajkový model a vyvíjí tlak na konkurenci – Výzkum

Multimodalita jako standard: Konec přípony VL

Strategicky významným a symbolickým krokem v rodině Qwen3.5 je odstranění zkratky „VL“ z názvů modelů. Dříve „VL“ (Vision Language) označovalo modely schopné zpracovávat obrazy – tato schopnost byla vždy považována za doplňkovou funkci. V generaci 3.5 jsou všechny modely bez výjimky nativně multimodální: text, obrázky a videa nejsou zpracovávány pomocí downstream adaptérů, ale jsou integrovány od základu prostřednictvím raného fúzního trénování.

Tento krok je více než jen kosmetický. Signalizuje strategické přemístění: Qwen již nepovažuje multimodalitu za prémiovou funkci pro vybrané varianty modelu, ale za základní požadavek pro každý moderní jazykový model. Technická implementace s využitím Early Fusion znamená, že porozumění obrazu a jazyku se učí ve sdíleném reprezentačním prostoru – s výhodou, že model dokáže hluboce propojit vizuální a lingvistické znalosti, místo aby je pouze povrchně kombinoval. Qwen 3.5 také podporuje 201 jazyků a dialektů, oproti 119 v předchozí generaci.

Geopolitika v kódu: Co čínská ofenzíva v oblasti open source znamená pro globální trh s umělou inteligencí

Za tímto technologickým pokrokem se skrývá geopolitický rozměr, který je v západních médiích často přehlížen. V letech 2025 a 2026 čínský průmysl umělé inteligence sledoval strategii, kterou by se dala popsat jako „podkopávání open-source“: modely s výkonem srovnatelným s nejdražšími komerčními poskytovateli byly vydávány zdarma s licencí, která umožňovala komerční využití. Výsledkem je systematické znehodnocování cenové prémie, kterou si OpenAI, Anthropic a Google účtují za své vlajkové produkty.

Alibaba výslovně uvádí Qwen3.5 jako konkurenta GPT-5.2 a Claude 4.5 Opus. V interních benchmarkech Qwen3.5 překonal oba modely v IFBench, testu, který měří kvalitu sledování instrukcí. V benchmarku HMMT pro uvažování Qwen3.5 překonal Claude 4.5 Opus, ale zaostával za GPT-5.2. Tato rozdílná výkonnostní krajina je charakteristická: Qwen3.5 není nepopiratelně lídrem v žádné jednotlivé kategorii, ale je konkurenceschopný napříč všemi oblastmi – a to vše s kompletním open source.

Reakce trhu na tuto situaci je již patrná. Vývojáři, zejména ve společnostech citlivých na zdroje, se obracejí k derivátům Qwen, protože celkové náklady na vlastnictví radikální inference na jejich vlastním hardwaru jsou drasticky nižší než náklady na API komerčních poskytovatelů. To je klíčová výhoda pro zákazníky B2B, kteří chtějí škálovat řešení umělé inteligence bez placení za token. Cenový tlak, který na trh vyvíjejí čínské open-source modely, již přiměl OpenAI k uvedení na trh dostupnějších produktových řad, jako je GPT-5 mini – což je přímá reakce na konkurenci ze strany Qwen.

Benchmarky bez mýtů: Co čísla skutečně říkají

Seriózní vyhodnocení benchmarků Qwen3.5 vyžaduje kritický odstup. Společnost Alibaba uvedla, že svá srovnání výkonu byla „hodnocena sama“ – což je skutečnost, kterou CNBC výslovně zmínila a která vyžaduje nezávislé ověření. Benchmarky navíc nejsou neutrálními měřítky: modely lze předtrénovat na datech podobných benchmarkům, což vede k přeučení pro určité testovací formáty, aniž by to vedlo ke skutečnému zvýšení výkonu v reálném provozu. Testy řízené komunitou provedené v týdnech po vydání vykreslují smíšenější, ale celkově působivý obraz.

Výsledky jsou obzvláště robustní, pokud jsou aplikovány na benchmarky, které vyžadují aktivní uvažování a nelze je vyřešit pouhým vyhledáváním faktů. Benchmark GPQA Diamond, který klade otázky z biologie, fyziky a chemie na doktorské úrovni, je považován za obzvláště odolný vůči manipulaci. Skutečnost, že Qwen3.5-9B zde překonává model se 120 miliardami parametrů, není podle současného výzkumu artefaktem měření, ale spíše vyjádřením efektivity, kterou má nová architektura v kombinaci s kvalitnějšími trénovacími daty. Qwen pro trénování použil pipeline FP8 a framework pro asynchronní učení s posilováním – technická rozhodnutí, která zvyšují efektivitu dat a stabilizují trénování.

Souvisí s tím:

Model umělé inteligence Qwen 3 od Alibaby: Nový standard ve vývoji umělé inteligence a její dopad na globální technologický trh

Agentická umělá inteligence a další fáze vývoje platformy Qwen

Alibaba nepozicionuje Qwen3.5 jen jako další model chatu, ale explicitně jako základní architekturu pro „éru agentní umělé inteligence“. Toto tvrzení je podpořeno značnými technickými důkazy: Trénink s posilovacím učením byl škálován na miliony agentských prostředí se stále složitějším rozdělením úkolů – metodologie, která se zaměřuje na skutečné, vícestupňové provádění úkolů spíše než na statickou reprodukci znalostí. Qwen3.5-Plus nabízí nativní využití nástrojů prostřednictvím Alibaba Cloud a adaptivní systém využití nástrojů, který umožňuje agentům nezávisle přistupovat k externím API, databázím a vyhledávacím dotazům.

Skutečnost, že jazykový model se 17 miliardami aktivních parametrů dokáže tyto úkoly zvládnout s konkurenceschopnou kvalitou, představuje zásadní posun v ekonomice aplikací umělé inteligence založených na agentech. Předchozí přístupy vyžadovaly jako mozek agenta velké a drahé modely, což výrazně zvyšovalo provozní náklady na rozsáhlé autonomní úkoly. Qwen3.5-9B, který běží lokálně na hardwaru s jednou špičkovou GPU, zpřístupňuje systémy umělé inteligence založené na agentech širšímu středně velkému trhu a vývojářům bez cloudových rozpočtů. Tato dynamika demokratizace by mohla výrazně urychlit trajektorii zavádění agentů umělé inteligence ve středně velkých společnostech.

Poradenství - Plánování - Implementace