Таємний король штучного інтелекту: як Qwen3.5 від Alibaba конкурує з OpenAI та Google

Konrad Wolfenstein

5 місяців тому

Таємний король штучного інтелекту: Як Qwen3.5 від Alibaba конкурує з OpenAI та Google – Зображення: Xpert.Digital

Безкоштовно замість преміум-програм: геніальний крок Китаю з відкритим кодом проти ChatGPT та інших.

700 мільйонів завантажень: Тиха революція штучного інтелекту Qwen, яку всі проігнорували

З тіні: Як Qwen стала домінуючою платформою

Протягом тривалого часу OpenAI та Google вважалися беззаперечними правителями світу штучного інтелекту, але за лаштунками відбувається фундаментальна зміна парадигми. З випуском сімейства моделей Qwen3.5 китайський технологічний гігант Alibaba не лише кидає виклик домінуванню усталених західних гравців, але й повністю переосмислює правила гри для штучного інтелекту. Завдяки радикальному редизайну архітектури Qwen3.5 вирішує проблему ресурсів класичних моделей Transformer та забезпечує безпрецедентну продуктивність зі значно меншими обчислювальними зусиллями. Стратегія така ж проста, як і агресивна: високопотужні, нативно мультимодальні моделі з відкритим кодом надаються безкоштовно – навіть компактні версії пропонують продуктивність на локальному обладнанні, яка нічим не поступається гігантським комерційним системам. Цей крок набагато більше, ніж просто технічне оновлення. Це геополітичний маневр, який атакує норми прибутку світового ринку штучного інтелекту та одночасно сповіщає про настання ери масових автономних агентів штучного інтелекту («Агентський ШІ»). Детальний аналіз показує, як Alibaba досягла цього подвигу та що насправді означають показники бенчмарків для майбутнього галузі.

Пов'язано з цим:

Китайський наступ на відкрите програмне забезпечення у сфері штучного інтелекту: як вільне програмне забезпечення руйнує багатомільярдний бізнес Кремнієвої долини

Тиха революція Alibaba: Як сімейство Qwen3.5 переглядає світовий порядок, пов'язаний зі штучним інтелектом

Атака Китаю на відкрите програмне забезпечення вдаряє по OpenAI та Google там, де це найбільше болить – по їхній архітектурі

Коли Alibaba випустила серію моделей Qwen3 у квітні 2025 року, реакція західної технологічної журналістики була стриманою. Звичайно, потужна, але зрештою лише одна з багатьох моделей на дедалі більш насиченому ринку – таким був вердикт. Ця неупереджена оцінка пропустила той факт, що Qwen вже не був нішевим проектом, а на шляху до того, щоб стати найпоширенішою у світі платформою штучного інтелекту з відкритим кодом. У січні 2026 року команда Qwen повідомила про 700 мільйонів завантажень Hugging Face, досягнувши позиції, яка навіть перевершила Meta Llama, яка протягом багатьох років була беззаперечним еталоном для моделей з відкритим кодом. Цифри говорили самі за себе: у грудні 2025 року щомісячні завантаження Qwen перевищили сукупну кількість наступних восьми найпопулярніших моделей, включаючи Meta, DeepSeek, OpenAI, Mistral та Nvidia.

Така популярність не випадкова. Ці цифри відображають стратегічне рішення, якого Alibaba послідовно дотримується з 2023 року: випускати моделі Qwen раніше, частіше та в більшій кількості варіацій, ніж її конкуренти. На сьогоднішній день Alibaba зробила майже 400 моделей з набору Qwen доступними з відкритим вихідним кодом та створила понад 180 000 похідних версій. Навіть провідні дослідницькі групи покладаються на Qwen: команда навколо піонера штучного інтелекту Фей-Фей Лі навчила свою відому модель логічного висновку s1 на Qwen з порівняно скромними ресурсами. DeepSeek, китайська лабораторія моделювання, яка викликала світову сенсацію з R1 на початку 2025 року, випустила шість моделей на базі спільноти, чотири з яких базуються на Qwen.

У найважливішому показнику спільноти штучного інтелекту з відкритим кодом Qwen досяг позиції, яку дослідники ринку вважають майже непохитним мережевим ефектом: ті, хто будує на Qwen, отримують вигоду від величезної екосистеми похідних моделей, тонкого налаштування, оптимізації та підтримки спільноти. Ті, хто конкурує з Qwen, одночасно конкурують з маховиком мережевих ефектів. Ця структурна міцність формує фон, на якому необхідно оцінювати серію моделей Qwen3.5.

Архітектурна ставка: Чому Qwen3.5 мислить інакше, ніж його попередники

Ключова відмінність між сімейством Qwen3.5 та його попередниками полягає не в простому збільшенні параметрів, а в фундаментальній зміні архітектурної парадигми. Класичні моделі-трансформери – від GPT-4 через Llama до оригінального Qwen3 – спираються на так званий механізм самоуважності, який математично масштабується з квадратичною складністю. Це означає, що подвоєння довжини контексту збільшує обчислювальні зусилля в чотири рази. Це вузьке місце, яке робить довгі документи, великі кодові бази або багатогодинні історії розмов такими ресурсоємними для мовних моделей.

Qwen не вирішила цю проблему за допомогою поступової оптимізації, як це зробив DeepSeek зі своєю багатоголовою прихованою увагою, а за допомогою більш радикальної архітектурної переробки. Основою нової архітектури є гібридна структура суміші експертів: з кожних чотирьох блоків трансформатора три замінюються на закриті дельта-мережі – варіант лінійної уваги, заснований на теоретичній роботі "Закриті дельта-мережі: покращення Mamba2 за допомогою дельта-правила". Лише кожен четвертий блок залишається класичним шаром повної уваги для прецизійних завдань. Результатом є обчислювальна складність, яка лінійно зростає з довжиною контексту – категорична відмінність від квадратичного масштабування класичних трансформаторів.

Наслідки цього рішення є значними. На практиці лінійне масштабування означає, що з тією ж обчислювальною потужністю модель може обробляти значно довші тексти та створювати токени швидше, ніж щільна модель з порівнянним інтелектом. Qwen3.5-Plus, розміщена версія через Alibaba Cloud, підтримує контекстне вікно в один мільйон токенів — ємність, яка лише два роки тому була зарезервована виключно для спеціалізованих архітектурних підходів, таких як Конституційний ШІ Клода. Водночас гібридна архітектура різко знижує вимоги до відеопам'яті: у той час як класична щільна модель з 400 мільярдами параметрів вимагає понад 800 ГБ пам'яті графічного процесора, Qwen3.5-397B-A17B обробляє від 48 до 96 ГБ на квантованих системах.

Новий вимір цифрової трансформації з «керованим ШІ» (штучним інтелектом) – платформа та рішення B2B | Xpert Consulting

Новий вимір цифрової трансформації з «керованим ШІ» (штучним інтелектом) – платформа та рішення B2B | Xpert Consulting - Зображення: Xpert.Digital

Тут ви дізнаєтеся, як ваша компанія може швидко, безпечно та без високих бар'єрів входу впроваджувати індивідуальні рішення на основі штучного інтелекту.

Керована платформа штучного інтелекту — це ваше комплексне та безтурботне рішення для штучного інтелекту. Замість того, щоб мати справу зі складними технологіями, дорогою інфраструктурою та тривалими процесами розробки, ви отримуєте готове рішення, адаптоване до ваших потреб, від спеціалізованого партнера — часто всього за кілька днів.

Основні переваги з першого погляду:

⚡ Швидке впровадження: від ідеї до готового до використання застосунку за лічені дні, а не місяці. Ми пропонуємо практичні рішення, які створюють негайну додану цінність.

🔒 Максимальна безпека даних: Ваші конфіденційні дані залишаються з вами. Ми гарантуємо безпечну та відповідність вимогам обробку без передачі даних третім особам.

💸 Без фінансових ризиків: Ви платите лише за результат. Повністю виключаються значні початкові інвестиції в обладнання, програмне забезпечення чи персонал.

🎯 Зосередьтеся на своєму основному бізнесі: Зосередьтеся на тому, що ви робите найкраще. Ми подбаємо про повне технічне впровадження, експлуатацію та обслуговування вашого рішення на базі штучного інтелекту.

📈 Орієнтований на майбутнє та масштабований: Ваш ШІ зростає разом з вами. Ми забезпечуємо постійну оптимізацію та масштабованість, а також гнучко адаптуємо моделі до нових вимог.

Більше інформації тут:

Кероване рішення на основі штучного інтелекту – промислові послуги зі штучним інтелектом: ключ до конкурентоспроможності в секторах послуг, промисловості та машинобудування

Новий штучний інтелект Китаю перевершує Google та OpenAI за розміром лише частку

Феєрверк модельного ряду: від 397 мільярдів до 0,8 мільярда параметрів

Стратегія випуску сімейства Qwen3.5 дотримувалася добре прорахованого ритму. Флагманська модель Qwen3.5-397B-A17B розпочала свою діяльність незадовго до Китайського Нового року: 397 мільярдів загальних параметрів, з яких лише 17 мільярдів активні на токен. Така розріджена архітектура змішаного аналізу експертів викликала подив у першому практичному тестуванні, оскільки коефіцієнт активації менше п'яти відсотків означав, що, незважаючи на свій гігантський загальний розмір, модель досягла затримки значно меншої моделі.

Невдовзі після цього настав справжній феєрверк: Qwen3.5-122B-A10B та Qwen3.5-35B-A3B як моделі SMoE для високопродуктивних застосувань, а також щільна Qwen3.5-27B як універсальна модель для користувачів, які надають пріоритет високій якості виконання окремих завдань над чистою швидкістю логічного висновку. Перші оцінки спільноти показали дивовижну картину: модель 27B, хоча за параметрами менша за варіанти SMoE, досягла кращих результатів у численних бенчмарках – свідчення того, що складніший процес навчання для розріджених архітектур ще не повністю оптимізований і має подальший потенціал.

Однак найбільший ажіотаж викликав подальший випуск менших моделей: Qwen3.5-9B, Qwen3.5-4B, Qwen3.5-2B та Qwen3.5-0.8B. Ці моделі спеціально розроблені для використання на стандартних комп'ютерах і забезпечують щільність продуктивності, яка практично не має аналогів в історії компактних мовних моделей. Qwen3.5-9B досягла 81,7 бала в бенчмарку GPQA Diamond, який перевіряє академічне мислення на рівні випускників, перевершивши OpenAI GPT-oss-120B з 80,1 балами, модель з більш ніж тринадцятикратною кількістю параметрів. У бенчмарку візуального мислення MMMU-Pro модель 9B набрала 70,1 бала порівняно з Gemini 2.5 Flash-Lite з 59,7. Модель 4B також викликала ажіотаж: у Video-MME (з субтитрами) вона досягла 83,5 бала, що значно випереджає 74,6 бала у Google.

Пов'язано з цим:

Гонка ШІ: Alibaba представляє нову флагманську модель і тисне на конкурентів – Дослідження

Мультимодальність як стандарт: кінець суфікса VL

Стратегічно важливим, символічним кроком у сімействі Qwen3.5 є видалення абревіатури "VL" з назв моделей. Раніше "VL" (Vision Language) позначало моделі, здатні обробляти зображення – ця можливість завжди розглядалася як додаткова функція. У поколінні 3.5 усі моделі без винятку є власно мультимодальними: текст, зображення та відео не обробляються через адаптери нижче за течією, а інтегруються з нуля шляхом раннього навчання злиття.

Цей крок більше, ніж просто косметичний. Він сигналізує про стратегічне перепозиціонування: Qwen більше не розглядає мультимодальність як преміальну функцію для окремих варіантів моделі, а як базову вимогу для кожної сучасної мовної моделі. Технічна реалізація з використанням Early Fusion означає, що розуміння зображень та мови засвоюється у спільному репрезентативному просторі – з перевагою, що модель може глибоко пов’язувати візуальні та лінгвістичні знання, а не просто поверхово їх поєднувати. Qwen 3.5 також підтримує 201 мову та діалект, порівняно зі 119 у попередньому поколінні.

Геополітика в коді: що означає наступ Китаю на відкрите програмне забезпечення для світового ринку штучного інтелекту

За цим технологічним прогресом криється геополітичний вимір, який часто ігнорується в західних ЗМІ. У 2025 та 2026 роках китайська індустрія штучного інтелекту дотримувалася стратегії, яку можна охарактеризувати як «підривання відкритого коду»: моделі з продуктивністю, порівнянною з найдорожчими комерційними постачальниками, випускалися безкоштовно з ліцензією, яка дозволяла комерційне використання. Результатом є систематичне зниження цінової премії, яку OpenAI, Anthropic та Google стягують за свої флагманські продукти.

Alibaba явно позиціонує Qwen3.5 як конкурента GPT-5.2 та Claude 4.5 Opus. У внутрішніх бенчмарках Qwen3.5 перевершив обидві моделі в IFBench, тесті, який вимірює якість виконання інструкцій. У бенчмарку HMMT reasoning Qwen3.5 перевершив Claude 4.5 Opus, але відстав від GPT-5.2. Цей нюансований ландшафт продуктивності є характерним: Qwen3.5 не є безперечним лідером в жодній окремій категорії, але він є конкурентоспроможним за всіма напрямками — і все це з повністю відкритим вихідним кодом.

Реакція ринку на цю ситуацію вже очевидна. Розробники, особливо в компаніях, чутливих до ресурсів, звертаються до похідних Qwen, оскільки загальна вартість володіння радикальним виводом на їхньому власному обладнанні значно нижча, ніж вартість API комерційних постачальників. Це вирішальна перевага для клієнтів B2B, які хочуть масштабувати рішення штучного інтелекту, не платячи за токен. Ціновий тиск, який чинять на ринок китайські моделі з відкритим кодом, вже спонукав OpenAI позиціонувати більш доступні лінійки продуктів, такі як GPT-5 mini – пряма відповідь на конкуренцію з боку Qwen.

Бенчмарки без міфів: що насправді говорять цифри

Серйозна оцінка бенчмарків Qwen3.5 вимагає критичної дистанції. Alibaba повідомила про свої порівняння продуктивності як про "самостійні звіти" – факт, чітко зазначений CNBC, що вимагає незалежної перевірки. Крім того, бенчмарки не є нейтральними показниками: моделі можна попередньо навчити на даних, подібних до бенчмарків, що призводить до перенавчання для певних форматів тестування без будь-якого покращення продуктивності в реальному світі. Тести, проведені спільнотою протягом тижнів після випуску, малюють більш неоднозначну, але загалом вражаючу картину.

Результати особливо надійні, коли вони застосовуються до бенчмарків, які вимагають активного мислення та не можуть бути розв'язані шляхом простого фактичного пошуку. Бенчмарк GPQA Diamond, який ставить питання з біології, фізики та хімії на докторському рівні, вважається особливо стійким до маніпуляцій. Той факт, що Qwen3.5-9B перевершує тут модель зі 120 мільярдами параметрів, згідно з поточними дослідженнями, не є артефактом вимірювання, а радше вираженням ефекту підвищення ефективності нової архітектури в поєднанні з навчальними даними вищої якості. Qwen використовував конвеєр FP8 та асинхронну систему навчання з підкріпленням для навчання — технічні рішення, які підвищують ефективність даних та роблять навчання стабільнішим.

Пов'язано з цим:

Модель штучного інтелекту Qwen 3 від Alibaba: новий стандарт у розробці штучного інтелекту та його вплив на світовий ринок технологій

Агентний ШІ та наступний етап розвитку платформи Qwen

Alibaba позиціонує Qwen3.5 не просто як чергову модель чату, а явно як фундаментальну архітектуру «ери агентського ШІ». Це твердження підтверджується суттєвими технічними доказами: навчання з підкріпленням було масштабовано для мільйонів агентських середовищ зі все більш складним розподілом завдань — методологія, яка зосереджена на реальному, багатоетапному виконанні завдань, а не на статичному відтворенні знань. Qwen3.5-Plus пропонує використання власних інструментів через Alibaba Cloud та адаптивну систему використання інструментів, яка дозволяє агентам незалежно отримувати доступ до зовнішніх API, баз даних та пошукових запитів.

Той факт, що мовна модель із 17 мільярдами активних параметрів може обробляти ці завдання з конкурентною якістю, являє собою фундаментальний зсув в економіці агентних застосунків штучного інтелекту. Попередні підходи вимагали великих, дорогих моделей як мозку агента, що значно збільшувало експлуатаційні витрати на розширені автономні завдання. Qwen3.5-9B, який працює локально на обладнанні з одним високопродуктивним графічним процесором, робить агентні системи штучного інтелекту доступними для ширшого середнього ринку та розробників без хмарних бюджетів. Ця динаміка демократизації може значно пришвидшити траєкторію впровадження агентів штучного інтелекту в середніх компаніях.

Консалтинг - Планування - Впровадження