Секретный король ИИ: как Qwen3.5 от Alibaba составляет конкуренцию OpenAI и Google

Konrad Wolfenstein

5 месяцев назад

Секретный король ИИ: как Qwen3.5 от Alibaba составляет конкуренцию OpenAI и Google – Изображение: Xpert.Digital

Бесплатно вместо платного: гениальный шаг Китая в борьбе с ChatGPT и подобными сервисами на основе открытого исходного кода.

700 миллионов загрузок: тихая революция Qwen AI, которую все упустили из виду

Выход из тени: как Qwen стала доминирующей платформой

Долгое время OpenAI и Google считались бесспорными лидерами в мире ИИ, но за кулисами происходил фундаментальный сдвиг парадигмы. С выпуском семейства моделей Qwen3.5 китайский технологический гигант Alibaba не только бросает вызов доминированию западных игроков, но и полностью переопределяет правила игры в области искусственного интеллекта. Благодаря радикальной архитектурной переработке, Qwen3.5 решает проблему нехватки ресурсов классических моделей Transformer и обеспечивает беспрецедентную производительность при значительно сниженных вычислительных затратах. Стратегия проста и агрессивна: мощные, изначально многомодальные модели с открытым исходным кодом предоставляются бесплатно — даже компактные версии обеспечивают производительность на локальном оборудовании, ничем не уступающую гигантским коммерческим системам. Этот шаг — гораздо больше, чем просто техническое обновление. Это геополитический маневр, который атакует прибыльность мирового рынка ИИ и одновременно открывает эру массового рынка автономных агентов ИИ («Agentic AI»). Подробный анализ показывает, как Alibaba добилась этого успеха и что на самом деле означают эти показатели для будущего отрасли.

В связи с этим:

Китайское наступление на рынок открытого программного обеспечения в сфере искусственного интеллекта: как свободное ПО разрушает многомиллиардный бизнес Кремниевой долины

Тихая революция Alibaba: как семейство Qwen3.5 пересматривает мировой порядок в сфере искусственного интеллекта

Атака Китая на платформы с открытым исходным кодом наносит удар по OpenAI и Google там, где это наиболее болезненно — в их архитектуре

Когда Alibaba выпустила серию моделей Qwen3 в апреле 2025 года, реакция западной технологической журналистики была сдержанной. Безусловно, мощная, но в конечном итоге всего лишь одна из многих моделей на всё более переполненном рынке – таков был вердикт. Однако эта беспристрастная оценка упустила из виду тот факт, что Qwen перестала быть нишевым проектом и находится на пути к тому, чтобы стать самой широко используемой в мире платформой искусственного интеллекта с открытым исходным кодом. В январе 2026 года команда Qwen сообщила о 700 миллионах загрузок на Hugging Face, достигнув позиции, которая даже превзошла Llama от Meta, много лет считавшуюся бесспорным эталоном для моделей обработки естественного языка с открытым исходным кодом. Цифры говорили сами за себя: в декабре 2025 года ежемесячное количество загрузок Qwen превысило суммарное количество загрузок следующих восьми самых популярных моделей – включая Meta, DeepSeek, OpenAI, Mistral и Nvidia.

Такая популярность не случайна. Эти цифры отражают стратегическое решение, которое Alibaba последовательно принимает с 2023 года: выпускать модели Qwen раньше, чаще и в большем количестве вариантов, чем конкуренты. На сегодняшний день Alibaba предоставила в открытый доступ почти 400 моделей из пакета Qwen и сгенерировала более 180 000 производных версий. Даже ведущие исследовательские группы полагаются на Qwen: команда пионера в области ИИ Фэй-Фэй Ли обучила свою известную модель вывода s1 на Qwen, используя сравнительно скромные ресурсы. DeepSeek, китайская лаборатория моделирования, которая произвела фурор с R1 в начале 2025 года, выпустила шесть моделей, созданных сообществом, четыре из которых основаны на Qwen.

По важнейшему показателю сообщества разработчиков ИИ с открытым исходным кодом, Qwen заняла позицию, которую исследователи рынка считают практически непоколебимым сетевым эффектом: те, кто разрабатывает приложения на основе Qwen, получают выгоду от обширной экосистемы производных моделей, тонкой настройки, оптимизации и поддержки сообщества. Те, кто конкурирует с Qwen, одновременно соревнуются с целым рядом сетевых эффектов. Эта структурная сила формирует основу, на которой необходимо оценивать серию моделей Qwen3.5.

Архитектурная ставка: почему Qwen3.5 мыслит иначе, чем его предшественники

Ключевое отличие семейства Qwen3.5 от его предшественников заключается не в простом увеличении количества параметров, а в фундаментальном изменении архитектурной парадигмы. Классические модели трансформеров — от GPT-4 и Llama до оригинального Qwen3 — основаны на так называемом механизме самовнимания, сложность которого математически масштабируется с квадратичной зависимостью. Это означает, что удвоение длины контекста учетверяет вычислительные затраты. Именно это является узким местом, из-за которого длинные документы, обширные кодовые базы или многочасовые истории разговоров требуют значительных ресурсов для языковых моделей.

Qwen решила эту проблему не путем поэтапной оптимизации, как это сделала DeepSeek со своим многоголовочным механизмом скрытого внимания, а путем более радикальной архитектурной переработки. В основе новой архитектуры лежит гибридная структура, сочетающая в себе элементы экспертов: из каждых четырех блоков трансформеров три заменяются вентилируемыми дельта-сетями — линейным вариантом механизма внимания, основанным на теоретической работе «Вентилируемые дельта-сети: улучшение Mamba2 с помощью правила дельта». Только каждый четвертый блок остается классическим слоем полного внимания для задач точного распознавания. В результате вычислительная сложность растет линейно с длиной контекста — это принципиальное отличие от квадратичного масштабирования классических трансформеров.

Последствия этого решения значительны. На практике линейное масштабирование означает, что при той же вычислительной мощности модель может обрабатывать значительно более длинные тексты и создавать токены быстрее, чем плотная модель сопоставимого уровня интеллекта. Qwen3.5-Plus, версия, размещенная в Alibaba Cloud, поддерживает контекстное окно в один миллион токенов — емкость, которая всего два года назад была зарезервирована исключительно для специализированных архитектурных подходов, таких как конституционный ИИ Клода. В то же время гибридная архитектура значительно снижает требования к видеопамяти: в то время как классическая плотная модель с 400 миллиардами параметров требует более 800 ГБ памяти графического процессора, Qwen3.5-397B-A17B справляется с 48–96 ГБ на квантованных системах.

Новое измерение цифровой трансформации с помощью «управляемого ИИ» (искусственного интеллекта) — платформа и B2B-решение | Xpert Consulting

Новое измерение цифровой трансформации с помощью «управляемого ИИ» (искусственного интеллекта) – платформа и B2B-решение | Xpert Consulting - Изображение: Xpert.Digital

Здесь вы узнаете, как ваша компания может быстро, безопасно и без высоких барьеров для входа внедрить индивидуальные решения на основе искусственного интеллекта.

Управляемая платформа искусственного интеллекта — это комплексное и беззаботное решение для вашего бизнеса в сфере искусственного интеллекта. Вместо того чтобы возиться со сложными технологиями, дорогостоящей инфраструктурой и длительными процессами разработки, вы получаете готовое решение, адаптированное под ваши потребности, от специализированного партнера — зачастую всего за несколько дней.

Основные преимущества с первого взгляда:

⚡ Быстрая реализация: от идеи до готового к использованию приложения за считанные дни, а не месяцы. Мы предлагаем практические решения, которые создают немедленную добавленную стоимость.

🔒 Максимальная безопасность данных: Ваши конфиденциальные данные остаются с вами. Мы гарантируем безопасную и соответствующую законодательству обработку данных без их передачи третьим лицам.

💸 Отсутствие финансового риска: вы платите только за результат. Полностью исключаются высокие первоначальные инвестиции в оборудование, программное обеспечение или персонал.

🎯 Сосредоточьтесь на своем основном бизнесе: сконцентрируйтесь на том, что у вас получается лучше всего. Мы берем на себя всю техническую реализацию, эксплуатацию и обслуживание вашего решения на основе ИИ.

📈 Перспективность и масштабируемость: ваш ИИ растет вместе с вами. Мы обеспечиваем непрерывную оптимизацию и масштабируемость, а также гибко адаптируем модели к новым требованиям.

Более подробная информация здесь:

Управляемые решения в области ИИ — Промышленные услуги ИИ: ключ к конкурентоспособности в секторах услуг, промышленности и машиностроения

Новый китайский ИИ превосходит Google и OpenAI по масштабу, но значительно уступает им

Фейерверк в серии моделей: от 397 миллиардов до 0,8 миллиарда параметров

Стратегия выпуска семейства Qwen3.5 следовала тщательно продуманному ритму. Флагманская модель, Qwen3.5-397B-A17B, запустила проект незадолго до китайского Нового года: 397 миллиардов параметров, из которых только 17 миллиардов активны на токен. Эта разреженная архитектура, сочетающая в себе множество экспертов, вызвала удивление в первом практическом тестировании, поскольку коэффициент активации менее пяти процентов означал, что, несмотря на гигантский общий размер, модель достигла задержки, сравнимой со значительно меньшей моделью.

Вскоре после этого последовал настоящий фейерверк: модели Qwen3.5-122B-A10B и Qwen3.5-35B-A3B в качестве моделей SMoE для высокопроизводительных приложений, а также плотная модель Qwen3.5-27B в качестве универсального варианта для пользователей, которые отдают приоритет высокому качеству выполнения отдельных задач, а не скорости вывода. Первые оценки сообщества выявили удивительную картину: модель 27B, хотя и имела меньший размер по параметрам, чем варианты SMoE, показала более высокие результаты во многих бенчмарках — это указывает на то, что более сложный процесс обучения для разреженных архитектур еще не полностью оптимизирован и обладает дальнейшим потенциалом.

Однако наибольший ажиотаж вызвал последующий выпуск более компактных моделей: Qwen3.5-9B, Qwen3.5-4B, Qwen3.5-2B и Qwen3.5-0.8B. Эти модели специально разработаны для использования на стандартных компьютерах и обеспечивают практически беспрецедентную в истории компактных языковых моделей плотность производительности. Qwen3.5-9B набрала 81,7 балла в бенчмарке GPQA Diamond, который проверяет логическое мышление на уровне аспирантуры, превзойдя модель OpenAI GPT-oss-120B с 80,1 баллами, у которой более чем в тринадцать раз больше параметров. В бенчмарке визуального логического мышления MMMU-Pro модель 9B набрала 70,1 балла по сравнению с Gemini 2.5 Flash-Lite, набравшей 59,7 балла. Модель 4B также вызвала ажиотаж: в тесте Video-MME (с субтитрами) она набрала 83,5 балла, что значительно опередило результат Google в 74,6 балла.

В связи с этим:

Гонка ИИ: Alibaba представляет новую флагманскую модель и оказывает давление на конкурентов – Исследование

Мультимодальность как стандарт: конец суффикса VL

Стратегически значимым, символическим шагом в семействе Qwen3.5 является удаление аббревиатуры «VL» из названий моделей. Ранее «VL» (Vision Language) обозначало модели, способные обрабатывать изображения — возможность, всегда рассматриваемая как дополнительная функция. В поколении 3.5 все модели без исключения изначально являются мультимодальными: текст, изображения и видео не обрабатываются через адаптеры, а интегрируются с нуля посредством обучения на ранних этапах.

Этот шаг — не просто косметический. Он сигнализирует о стратегическом перепозиционировании: Qwen больше не рассматривает мультимодальность как премиальную функцию для отдельных вариантов модели, а как базовое требование для каждой современной языковой модели. Техническая реализация с использованием Early Fusion означает, что понимание изображений и языка изучается в общем репрезентативном пространстве — с тем преимуществом, что модель может глубоко связывать визуальные и лингвистические знания, а не просто поверхностно их комбинировать. Qwen 3.5 также поддерживает 201 язык и диалект, по сравнению со 119 в предыдущем поколении.

Геополитика в коде: что означает наступление Китая на открытый исходный код для мирового рынка ИИ

За этим технологическим прогрессом скрывается геополитический аспект, который часто упускается из виду в западных СМИ. В 2025 и 2026 годах китайская индустрия ИИ проводила стратегию, которую можно описать как «подрыв позиций за счет открытого исходного кода»: модели с производительностью, сопоставимой с самыми дорогими коммерческими поставщиками, выпускались бесплатно с лицензией, разрешающей коммерческое использование. Результатом стало систематическое обесценивание ценовой надбавки, которую OpenAI, Anthropic и Google взимают за свои флагманские продукты.

Alibaba позиционирует Qwen3.5 как конкурента GPT-5.2 и Claude 4.5 Opus. Во внутренних тестах Qwen3.5 превзошла обе модели в IFBench, тесте, измеряющем качество выполнения инструкций. В тесте HMMT на логическое мышление Qwen3.5 превзошла Claude 4.5 Opus, но отстала от GPT-5.2. Такая неоднозначная картина производительности характерна: Qwen3.5 не является бесспорным лидером ни в одной отдельной категории, но она конкурентоспособна по всем параметрам — и всё это при полностью открытом исходном коде.

Реакция рынка на эту ситуацию уже очевидна. Разработчики, особенно в компаниях с ограниченными ресурсами, обращаются к производным от Qwen, поскольку общая стоимость владения решениями для радикального вывода на собственном оборудовании значительно ниже, чем стоимость API у коммерческих поставщиков. Это решающее преимущество для B2B-клиентов, которые хотят масштабировать решения на основе ИИ, не платя за каждый токен. Ценовое давление, оказываемое на рынок китайскими моделями с открытым исходным кодом, уже побудило OpenAI вывести на рынок более доступные линейки продуктов, такие как GPT-5 mini – прямой ответ на конкуренцию со стороны Qwen.

Сравнительные показатели без мифов: что на самом деле говорят цифры

Серьезная оценка результатов тестов Qwen3.5 требует критической дистанции. Alibaba представила свои сравнения производительности как «самостоятельно предоставленные» — факт, прямо отмеченный CNBC, что требует независимой проверки. Кроме того, тесты не являются нейтральными показателями: модели могут быть предварительно обучены на данных, аналогичных тестам, что приводит к переобучению для определенных форматов тестирования без какого-либо реального улучшения производительности. Тесты, проведенные сообществом в течение нескольких недель после релиза, рисуют более неоднозначную, но в целом впечатляющую картину.

Результаты особенно устойчивы при применении к задачам, требующим активного логического мышления и не поддающимся простому извлечению фактов. Задача GPQA Diamond, содержащая вопросы из биологии, физики и химии на уровне докторской диссертации, считается особенно устойчивой к манипуляциям. Тот факт, что Qwen3.5-9B превосходит модель со 120 миллиардами параметров, согласно текущим исследованиям, является не артефактом измерения, а скорее выражением эффекта повышения эффективности новой архитектуры в сочетании с более качественными обучающими данными. Qwen использовала конвейер FP8 и асинхронную структуру обучения с подкреплением для обучения — технические решения, которые повышают эффективность данных и делают обучение более стабильным.

В связи с этим:

Модель искусственного интеллекта Qwen 3 от Alibaba: новый эталон в разработке ИИ и ее влияние на мировой рынок технологий

Агентный ИИ и следующий этап развития платформы Qwen

Alibaba позиционирует Qwen3.5 не просто как еще одну модель чата, а как фундаментальную архитектуру для «эры агентного ИИ». Это утверждение подкрепляется существенными техническими доказательствами: обучение с подкреплением масштабировано до миллионов агентских сред с постоянно усложняющимся распределением задач — методология, которая фокусируется на реальном многоэтапном выполнении задач, а не на статическом воспроизведении знаний. Qwen3.5-Plus предлагает использование собственных инструментов через Alibaba Cloud и адаптивную систему использования инструментов, которая позволяет агентам самостоятельно получать доступ к внешним API, базам данных и поисковым запросам.

Тот факт, что языковая модель с 17 миллиардами активных параметров может справляться с этими задачами на конкурентоспособном уровне, представляет собой фундаментальный сдвиг в экономике приложений искусственного интеллекта на основе агентов. Предыдущие подходы требовали больших и дорогостоящих моделей в качестве «мозга» агента, что значительно увеличивало эксплуатационные расходы для выполнения длительных автономных задач. Qwen3.5-9B, работающий локально на оборудовании с одним высокопроизводительным графическим процессором, делает системы искусственного интеллекта на основе агентов доступными для более широкого круга компаний среднего размера и разработчиков, не имеющих бюджета на облачные вычисления. Эта динамика демократизации может значительно ускорить внедрение агентов ИИ в компаниях среднего размера.

Консалтинг - Планирование - Внедрение