⭐️ Искусственный интеллект (ИИ) - Блог, тематический раздел и центр контента по ИИ ⭐️ Китай ⭐️ XPaper

Available in 27 languages 📢

Модель Kimi K2 AI от Moonshot AI: новый флагманский проект с открытым исходным кодом из Китая – еще одна важная веха для открытых систем искусственного интеллекта

Опубликовано: 13 июля 2025 г. / Обновлено: 13 июля 2025 г. – Автор: Konrad Wolfenstein

Модель ИИ Kimi K2: новый флагманский проект с открытым исходным кодом из Китая – еще одна важная веха для открытых систем ИИ – Изображение: Xpert.Digital

Модель Kimi K2, насчитывающая триллион параметров, открывает путь к суверенному развитию искусственного интеллекта в Европе

Еще одна революция в сфере открытого исходного кода: Kimi K2 внедряет ИИ мирового класса в европейские центры обработки данных

Kimi K2 выводит открытую экосистему ИИ на новый уровень. Ее модель, основанная на сочетании экспертов и имеющая триллион параметров, обеспечивает результаты в реалистичных задачах программирования, математики и тестирования агентов, сопоставимые с результатами проприетарных решений — при значительно меньших затратах и с полностью раскрытыми весовыми коэффициентами. Это открывает возможности для разработчиков и компаний в Германии по самостоятельному размещению высокопроизводительных сервисов ИИ, их интеграции в существующие процессы и разработке новых продуктов.

Подходит для:

Искусственный интеллект с открытым исходным кодом из Китая – как DeepSeek погружает мир технологий в хаос – меньше графических процессоров, больше мощности ИИ

Почему Kimi K2 — это больше, чем просто следующая большая модель искусственного интеллекта

В то время как западные лаборатории, такие как OpenAI и Anthropic, скрывают свои лучшие модели за платными API, Moonshot AI использует другой подход: все веса общедоступны под модифицированной лицензией MIT. Это не только обеспечивает научную воспроизводимость, но и позволяет малым и средним предприятиям создавать собственные кластеры для вывода результатов или использовать Kimi K2 в периферийных сценариях. Запуск совпадает с периодом, когда Китай утверждает себя в качестве лидера в движении LLM с открытым исходным кодом; DeepSeek V3 считался эталоном до июня, а теперь Kimi K2 снова поднимает планку.

Архитектура и методы обучения

Рекордное разнообразие экспертов

Kimi K2 построена на инновационной экспертной системе с 384 экспертами, при этом на каждый токен активны только восемь экспертов и один глобальный «общий эксперт». Такая архитектура позволяет механизму вывода одновременно загружать в память всего 32 миллиарда параметров, что значительно снижает нагрузку на графический процессор. В то время как плотная модель с 70 миллиардами параметров, работающая с полной точностью, уже требует двух графических процессоров H100, Kimi K2 обеспечивает сопоставимое или даже лучшее качество, при этом задействуя лишь треть мощности тех же графических процессоров.

По сравнению с другими моделями, эффективность Kimi K2 очевидна: имея в общей сложности 1 триллион параметров, она превосходит DeepSeek V3-Base с 671 миллиардом параметров и уступает оценочному значению GPT-4.1, у которого примерно 1,8 триллиона параметров. Кроме того, Kimi K2 использует всего 32 миллиарда параметров на токен, по сравнению с 37 миллиардами у DeepSeek V3-Base. Экспертная система Kimi K2 использует 384 эксперта, из которых восемь выбраны, в то время как DeepSeek V3-Base использует 240 экспертов, также с восемью выбранными. Все три модели поддерживают длину контекста в 128 000 токенов.

Это событие показывает, что Moonshot впервые выпускает общедоступную модель с одним триллионом параметров, оставаясь при этом ниже лимита в 40 миллиардов параметров на токен, что представляет собой значительный шаг вперед в повышении эффективности больших языковых моделей.

MuonClip – стабилизация нового масштаба

Обучение сверхмощных трансформеров MoE часто страдает от взрывного роста логов внимания. Поэтому Moonshot объединяет эффективный с точки зрения токенов оптимизатор Muon с последующим процессом масштабирования «qk-clip», который нормализует матрицы запросов и ключей после каждого шага. По данным Moonshot, за 15,5 триллионов обучающих токенов не было зафиксировано ни одного скачка потерь. В результате получилась чрезвычайно плавная кривая обучения и модель, которая остается стабильной с момента ее первоначального выпуска.

база данных

Обладая объемом данных в 15,5 триллионов токенов, Kimi K2 достигает уровня моделей класса GPT-4. В дополнение к классическому веб-тексту и коду, в предварительное обучение были включены смоделированные вызовы инструментов и диалоги рабочих процессов для определения компетентности агента. В отличие от DeepSeek R1, компетентность агента, таким образом, основана не столько на цепочке мыслей, сколько на сценариях обучения, в которых модели приходилось координировать работу нескольких API.

Подробный анализ результатов бенчмарков

Результаты сравнительных тестов показывают детальное сравнение трех моделей ИИ в различных областях задач. В программировании Kimi K2-Instr. достигает показателя успешности 65,8% в тесте SWE-bench Verified Test, в то время как DeepSeek V3 набирает 38,8%, а GPT-4.1 — 54,6%. В LiveCodeBench v6 Kimi K2-Instr. лидирует с 53,7%, за ним следуют DeepSeek V3 с 49,2% и GPT-4.1 с 44,7%. В тесте на сопряжение инструментов Tau2 Retail, в среднем с четырьмя попытками, GPT-4.1 показывает наилучшие результаты — 74,8%, немного опережая Kimi K2-Instr. с 70,6% и DeepSeek V3 с 69,1%. В категории математики MATH-500, с точным совпадением, Kimi K2-Instr. доминирует. С результатом 97,4% за ним следовали DeepSeek V3 с 94,0% и GPT-4.1 с 92,4%. В тесте на общие знания MMLU без ограничения по времени GPT-4.1 показал лучший результат — 90,4%, за ним с небольшим отрывом следовал Kimi K2-Instr. с 89,5%, а DeepSeek V3 оказался последним с 81,2%.

Интерпретация результатов

В реалистичных сценариях программирования Kimi K2 явно превосходит все предыдущие модели с открытым исходным кодом и опережает GPT-4.1 по результатам проверки SWE-bench Verified.
Математические и символические способности практически безупречны; в этом отношении модель превосходит даже проприетарные системы.
С точки зрения чистого знания об окружающем мире, GPT-4.1 по-прежнему немного опережает конкурентов, но разрыв стал меньше, чем когда-либо прежде.

Навыки агента в повседневной жизни

Многие студенты магистратуры хорошо объясняют материал, но не предпринимают никаких действий. Кими К2 постоянно обучали самостоятельному выполнению задач, включая вызов инструментов, выполнение кода и работу с файлами.

Пример 1: Планирование деловой поездки

Модель разбивает запрос («Забронировать авиабилет, отель и столик на троих в Берлине») на 17 вызовов API: календарь, агрегатор авиабилетов, API поездов, OpenTable, корпоративная электронная почта, Google Sheets — без ручной обработки запросов.

Пример 2: Анализ данных

Импортируется CSV-файл, содержащий 50 000 записей данных о заработной плате, проводится статистический анализ, строится график, и результат сохраняется в виде интерактивной HTML-страницы. Весь процесс происходит за один ход в чате.

Почему это важно?

Производительность: ответ модели представляет собой не просто текст, а исполняемое действие.
Устойчивость к ошибкам: Благодаря обучению с подкреплением на основе рабочих процессов, Kimi K2 учится интерпретировать сообщения об ошибках и исправлять их самостоятельно.
Затраты: Автоматизированный агент позволяет избежать передачи информации от человека к человеку и снижает контекстные издержки, поскольку требуется меньшее количество обращений к системе.

Лицензирование, затраты и операционные последствия

Лицензия

На весовые коэффициенты распространяется лицензия, аналогичная лицензии MIT. Moonshot требует отображения видимого уведомления «Kimi K2» в пользовательском интерфейсе только для продуктов с более чем 100 миллионами активных пользователей в месяц или ежемесячным доходом более 20 миллионов долларов. Для большинства немецких компаний это неактуально.

Цены на API и самостоятельное размещение

Цены на API и самостоятельный хостинг значительно различаются у разных провайдеров. В то время как API Moonshot взимает 0,15 доллара за миллион входных токенов и 2,50 доллара за миллион выходных токенов, API DeepSeek стоит 0,27 доллара за вход и 1,10 доллара за выход. API GPT-4 значительно дороже, в среднем 10 долларов за вход и 30 долларов за выход.

Особо следует отметить экономическую эффективность, предлагаемую технологией MoE: стоимость облачных услуг стала чрезвычайно конкурентоспособной. Практический пример иллюстрирует это: разработчик платит всего около 0,005 доллара за чат с 2000 токенами в Kimi K2, в то время как тот же чат стоит четыре доллара в GPT-4.

Аппаратный профиль для внутренней эксплуатации

Полная модель (FP16): не менее 8 × H100 80 ГБ или 4 × B200.
4-битное квантование: стабильная работа на 2 × H100 или 2 × Apple M3 Ultra 512 ГБ.
Механизмы вывода: vLLM, SGLang и TensorRT-LLM изначально поддерживают Kimi K2.

Практическое применение в Европе

Индустрия 4.0: Автоматизированные графики технического обслуживания, диагностика неисправностей и заказы запасных частей могут быть смоделированы как поток агентов.
Малые и средние предприятия (МСП): Локальные чат-боты отвечают на запросы поставщиков и клиентов в режиме реального времени, не отправляя данные на серверы в США.
Здравоохранение: Клиники используют Kimi K2 для кодирования медицинских писем, расчета случаев DRG и координации приемов — все это на территории клиники.
Исследования и преподавание: Университеты размещают эту модель в кластерах высокопроизводительных вычислений, чтобы дать студентам возможность проводить бесплатные эксперименты с использованием передовых моделей LLM.
Власти: Государственные учреждения получают выгоду от использования весовых коэффициентов с открытым исходным кодом, поскольку правила защиты данных затрудняют использование проприетарных облачных моделей.

Передовые методы для повышения эффективности работы

Для эффективной работы систем искусственного интеллекта разработано несколько передовых методов. Для чат-помощников параметр «температура» следует устанавливать в диапазоне от 0,2 до 0,3 для обеспечения корректных ответов, а максимальное значение p должно быть не более 0,8. Для генерации кода крайне важно четко определить системную подсказку, например, с инструкцией «Вы — точный помощник на Python», и реализовать надежные тесты. Для вызовов инструментов необходимо строго задать JSON-схему, чтобы модель корректно форматировала вызовы функций. Конвейеры RAG лучше всего работают с размером блока не более 800 токенов и переранжированием с помощью кросс-кодировщика, такого как bge-RERANK-L, перед извлечением. Для обеспечения безопасности необходимо выполнять исходящие команды в изолированной среде, например, в виртуальной машине Firecracker, чтобы минимизировать риски внедрения кода.

Подходит для:

Экономика искусственного интеллекта как экономическая сила: анализ глобальной трансформации, прогнозы и геополитические приоритеты

Проблемы и ограничения

Отпечаток памяти

Несмотря на то, что активны только 32 параметра B, маршрутизатор должен поддерживать все экспертные веса. Поэтому чисто вычислительный вывод с помощью ЦП нереалистичен.

Зависимость инструмента

Неправильно определенные инструменты приводят к бесконечным циклам; надежная обработка ошибок крайне важна.

Галлюцинации

Используя совершенно неизвестные API, модель может создавать фиктивные функции. Необходим строгий валидатор.

Лицензионное положение

В условиях значительного роста числа пользователей вопрос брендинга может стать предметом обсуждения.

Этика и экспортный контроль

Такая открытость также способствует появлению потенциально злонамеренных приложений; ответственность за системы фильтрации несут компании.

Открытый исходный код как двигатель инноваций

Действия Moonshot AI демонстрируют, что открытые модели не только отстают от проприетарных альтернатив, но и уже доминируют в определенных областях. В Китае формируется экосистема университетов, стартапов и облачных провайдеров, ускоряющая развитие за счет совместных исследований и агрессивной ценовой политики.

Это дает Европе двойное преимущество:

Технологический доступ без привязки к конкретному поставщику и в рамках европейского суверенитета над данными.
Давление на коммерческих поставщиков с точки зрения затрат позволяет предположить, что в среднесрочной перспективе можно ожидать справедливых цен на аналогичные услуги.

В долгосрочной перспективе мы можем ожидать появления новых моделей существования (MoE) стоимостью в триллионы долларов, возможно, даже мультимодальных. Если Moonshot будет следовать этой тенденции, могут быть представлены улучшения в области зрения или звука. В этот момент конкуренция за лучшего «открытого агента» станет центральным двигателем экономики искусственного интеллекта.

Больше никаких дорогостоящих API-интерфейсов-«черных ящиков»: Kimi K2 демократизирует разработку ИИ

Kimi K2 знаменует собой поворотный момент: он объединяет максимальную производительность, гибкость и открытые веса в одном пакете. Для разработчиков, исследователей и компаний в Европе это означает подлинную свободу выбора: вместо того, чтобы полагаться на дорогостоящие API-интерфейсы типа «черный ящик», они могут использовать, настраивать и интегрировать доступную высокопроизводительную основу ИИ в свои собственные продукты. Те, кто получит ранний опыт работы с агентными рабочими процессами и инфраструктурами MoE, создадут устойчивое конкурентное преимущество на европейском рынке.

Подходит для:

Ваш глобальный партнер по маркетингу и развитию бизнеса

☑️ Наш деловой язык — английский или немецкий.

☑️ НОВИНКА: Переписка на вашем национальном языке!

Konrad Wolfenstein

Я был бы рад служить вам и моей команде в качестве личного консультанта.

Вы можете связаться со мной, заполнив контактную форму или просто позвоните мне по телефону +49 89 89 674 804 (Мюнхен) . Мой адрес электронной почты: wolfenstein ∂ xpert.digital

Я с нетерпением жду нашего совместного проекта.