
Компания Meta выпустила новую серию моделей ИИ: Llama 4 Scout, Maverick и Behemoth – Изображение: Xpert.Digital
Llama 4: Новое поколение открытых систем искусственного интеллекта от Meta.
Llama 4 раскрыта: ключ Meta к следующей эре искусственного интеллекта
5 апреля 2025 года компания Meta представила последнее поколение своих моделей искусственного интеллекта — Llama 4. Эти новые модели представляют собой значительный шаг вперед в разработке открытых систем ИИ и обладают рядом революционных возможностей, которые существенно повышают их производительность и эффективность. Серия Llama 4 включает в себя несколько моделей, две из которых уже доступны публично, а самая мощная модель все еще находится на стадии обучения.
Подходит для:
Семейство моделей Llama 4
Компания Meta разработала три различные модели серии Llama 4, каждая из которых оптимизирована для разных сценариев использования:
Лама 4 Скаут
Llama 4 Scout — это компактная модель с впечатляющими техническими характеристиками:
- 17 миллиардов активных параметров с участием 16 экспертов (всего 109 миллиардов параметров)
- Может работать на одном графическом процессоре NVIDIA H100 с квантованием Int4.
- Она отличается невероятно большим контекстным окном в 10 миллионов токенов, что делает её одной из первых открытых моделей с такими возможностями.
По данным Meta, Scout превосходит другие модели своего класса, такие как Gemini 3, Gemini 2.0 Flash-Lite и Mistral 3.1. Он особенно хорошо подходит для таких задач, как составление кратких обзоров длинных документов, персонализация контента на основе пользовательских данных и извлечение сложных выводов из больших объемов информации.
Лама 4 Маверик
Llama 4 Maverick — более мощная из двух доступных моделей:
- 17 миллиардов активных параметров, 128 экспертов (всего 400 миллиардов параметров)
- Экспериментальная версия чата достигла рейтинга 1417 ELO на LMArena.
- По данным Meta, в многочисленных тестах она превосходит такие модели, как GPT-4o и Gemini 2.0 Flash.
Эта модель особенно подходит для приложений общего назначения и чата, таких как приложения для творческого письма, и демонстрирует результаты, сопоставимые с DeepSeek v3 в задачах логического мышления и программирования, но с вдвое меньшим количеством параметров.
Лама 4 Бегемот
Llama 4 Behemoth — самая мощная модель в Meta, но она пока недоступна для публичного доступа:
- 288 миллиардов активных параметров, управляемых 16 экспертами (всего почти 2 триллиона параметров).
- По данным Meta, он превосходит GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro в нескольких тестах STEM.
- Служит "учебным образцом" для более компактных моделей Llama 4.
В настоящее время Бегемот находится на стадии обучения и будет выпущен позже.
Технические инновации
В модельном ряду Llama 4 представлен ряд значительных технических инноваций, повышающих его производительность и эффективность:
Архитектура смешанного экспертного подхода (MoE)
Одним из важнейших нововведений в Llama 4 является архитектура «смешанных экспертов» (Mixture of Experts, MoE), в которой для каждого токена активируется только подмножество параметров модели:
- Это значительно снижает вычислительные затраты и задержку, сохраняя при этом высокую производительность.
- В Llama 4 Maverick каждый токен обрабатывается общим экспертом и одним из 128 маршрутизируемых экспертов.
- Такая архитектура позволяет увеличить общее количество параметров модели без увеличения затрат на вывод результатов.
Встроенная мультимодальность с ранним слиянием
Llama 4 — первая открытая модель с нативной мультимодальностью, реализованная посредством Early Fusion:
- Текстовые и графические токены интегрированы в единую архитектуру модели.
- Это позволяет проводить совместное предварительное обучение с использованием больших объемов текстовых, графических и видеоданных.
- В отличие от Llama 3.2, которая использовала отдельные параметры для текста и изображений, Llama 4 распознает оба типа изображений с помощью одних и тех же параметров.
Чрезвычайно длинное контекстное окно
Особенно впечатляет чрезвычайно длинное контекстное окно игры Llama 4 Scout:
- Имея 10 миллионов токенов, она значительно превосходит большинство доступных моделей.
- Это позволяет обрабатывать очень длинные документы, целые кодовые базы или продолжительные диалоги.
- Это становится возможным благодаря архитектуре iRoPE (чередование слоев внимания).
Новые методы обучения
Мета использовала несколько инновационных методов для обучения Ламы 4:
- MetaP: Метод для надежной настройки критически важных гиперпараметров модели.
- Точность FP8: использование 8-битных чисел с плавающей запятой для эффективного обучения.
- Совместная дистилляция: использование Llama 4 Behemoth в качестве учебной модели для более мелких моделей.
- Полностью асинхронное онлайн-обучение с усилением эффекта: новая инфраструктура для крупномасштабного обучения.
Доступность и интеграция
Модели Llama 4 доступны на различных платформах и сервисах:
Загрузки и облачные провайдеры
- Модели Scout и Maverick можно скачать напрямую с сайта Meta или через Hugging Face.
- Они также доступны через различные облачные платформы:
- Cloudflare Workers AI
- Azure AI Foundry и Azure Databricks
- Vertex AI от Google Cloud
- В ближайшие дни к ним присоединятся и другие партнеры.
Интеграция в метапродукты
Компания Meta уже обновила своих ИИ-помощников до версии Llama 4 на различных платформах:
- WhatsApp, Messenger и Instagram Direct доступны в 40 разных странах.
- Веб-сайт Meta.AI
- Однако в настоящее время мультимодальные функции доступны только англоговорящим пользователям в США.
Подходит для:
Лицензирование и споры
Хотя Meta Llama 4 описывается как «программа с открытым исходным кодом», в лицензии содержатся некоторые ограничения, вызвавшие споры:
Ограничения лицензии
Лицензия сообщества Llama 4 содержит ряд ограничений:
- Компаниям с более чем 700 миллионами активных пользователей в месяц требуется специальная лицензия от Meta.
- Пользователям и компаниям из ЕС, по всей видимости, запрещено использовать или распространять эти модели, предположительно из-за нормативных требований.
- Существуют требования к наименованию и указанию авторства производных моделей.
Дискуссия об «открытом исходном коде»
Ведутся споры о том, следует ли Llama 4 называть «программой с открытым исходным кодом»:
- В 2023 году организация Open Source Initiative определила, что ограничения, содержащиеся в лицензии Llama, выводят её «за пределы категории „открытого исходного кода“».
- Критики утверждают, что это скорее модель «открытого исходного кода» или «открытых весов», чем истинное программное обеспечение с открытым исходным кодом.
- Ограничения на лицензирование могут создать проблемы для малых предприятий, не имеющих собственных юридических отделов.
Планы на будущее
Мета уже поделился некоторыми подробностями своих планов на будущее, касающихся Llama 4 и последующих игр:
LlamaCon и другие объявления
- Компания Meta проведет свою первую конференцию LlamaCon 29 апреля 2025 года, где будут объявлены дополнительные подробности о ее моделях искусственного интеллекта и планах по развитию продуктов.
- Компания также планирует выпустить специальное приложение для своего мета-чат-бота во втором квартале.
Расширение языковых навыков
- Компания Meta работает над улучшением языковых навыков Llama 4, чтобы обеспечить более естественное общение.
- Цель состоит в том, чтобы обеспечить более плавный двусторонний диалог, в котором пользователи могут прерывать работу модели искусственного интеллекта.
- Крис Кокс, директор по продуктам компании Meta, описал готовящуюся к выпуску Llama 4 как «омни-модель», которая позволяет использовать родной язык вместо перевода речи в текст.
Агентный ИИ и расширенные возможности
- Марк Цукерберг объявил, что Llama 4 будет обладать «агентными возможностями», которые позволят реализовать новые сценарии использования.
- Компания Meta ставит перед собой цель разработать модели искусственного интеллекта, способные «выполнять обобщенные действия, естественно общаться с людьми и решать сложные задачи».
- Компания рассматривает возможность введения платных подписок на своего ИИ-помощника для задач, связанных с работой агентов, таких как бронирование или создание видеороликов.
Почему Llama 4 — поворотный момент в мире искусственного интеллекта
Выпуск Llama 4 представляет собой важный шаг в стратегии Meta по превращению в лидера в высококонкурентной области генеративного ИИ. Внедрение архитектуры Mixture of Experts, нативной мультимодальности и впечатляюще длительного контекстного окна демонстрирует, что открытые модели могут конкурировать с проприетарными моделями крупных технологических компаний.
Несмотря на споры вокруг лицензирования и вопрос о том, действительно ли Llama 4 следует называть «открытым исходным кодом», технические достижения представляют собой значительную веху. Способность моделей обрабатывать как текст, так и изображения открывает новые возможности для разработчиков и бизнеса.
Учитывая, что Llama 4 Behemoth всё ещё находится в разработке, а планы по расширению языковых и агентских возможностей уже объявлены, очевидно, что Meta продолжит наращивать инвестиции в ИИ. В ближайшие месяцы станет ясно, как эти новые модели изменят ландшафт ИИ и действительно ли они, как предсказывал Марк Цукерберг, помогут открытым моделям ИИ стать ведущей силой в области искусственного интеллекта.
Подходит для:
Ваш глобальный партнер по маркетингу и развитию бизнеса
☑️ Наш деловой язык — английский или немецкий.
☑️ НОВИНКА: Переписка на вашем национальном языке!
Я был бы рад служить вам и моей команде в качестве личного консультанта.
Вы можете связаться со мной, заполнив контактную форму или просто позвоните мне по телефону +49 89 89 674 804 (Мюнхен) . Мой адрес электронной почты: wolfenstein ∂ xpert.digital
Я с нетерпением жду нашего совместного проекта.

