
Компания Meta выпустила новую серию моделей ИИ: Llama 4 Scout, Maverick и Behemoth – Изображение: Xpert.Digital
Llama 4: Новое поколение открытых систем искусственного интеллекта от Meta
Llama 4 раскрыта: ключ Meta к следующей эре искусственного интеллекта
5 апреля 2025 года компания Meta представила последнее поколение своих моделей искусственного интеллекта — Llama 4. Эти новые модели представляют собой значительный шаг вперед в разработке открытых систем ИИ и обладают рядом революционных возможностей, которые существенно повышают их производительность и эффективность. Серия Llama 4 включает в себя несколько моделей, две из которых уже доступны публично, а самая мощная модель все еще находится на стадии обучения.
В связи с этим:
Семейство моделей Llama 4
Компания Meta разработала три различные модели серии Llama 4, каждая из которых оптимизирована для разных сценариев использования:
Лама 4 Скаут
Llama 4 Scout — это компактная модель с впечатляющими техническими характеристиками:
- 17 миллиардов активных параметров с участием 16 экспертов (всего 109 миллиардов параметров)
- Может работать на одном графическом процессоре NVIDIA H100 с квантованием Int4
- Она отличается невероятно большим контекстным окном в 10 миллионов токенов, что делает её одной из первых открытых моделей с такими возможностями
По данным Meta, Scout превосходит другие модели своего класса, такие как Gemini 3, Gemini 2.0 Flash-Lite и Mistral 3.1. Он особенно хорошо подходит для таких задач, как составление кратких обзоров длинных документов, персонализация контента на основе пользовательских данных и извлечение сложных выводов из больших объемов информации.
Лама 4 Маверик
Llama 4 Maverick — более мощная из двух доступных моделей:
- 17 миллиардов активных параметров, 128 экспертов (всего 400 миллиардов параметров)
- Экспериментальная версия чата достигла рейтинга 1417 ELO на LMArena
- По данным Meta, в многочисленных тестах она превосходит такие модели, как GPT-4o и Gemini 2.0 Flash
Эта модель особенно подходит для приложений общего назначения и чата, таких как приложения для творческого письма, и демонстрирует результаты, сопоставимые с DeepSeek v3 в задачах логического мышления и программирования, но с вдвое меньшим количеством параметров.
Лама 4 Бегемот
Llama 4 Behemoth — самая мощная модель в Meta, но она пока недоступна для публичного доступа:
- 288 миллиардов активных параметров, управляемых 16 экспертами (всего почти 2 триллиона параметров)
- По данным Meta, он превосходит GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro в нескольких тестах STEM
- Служит "учебным образцом" для более компактных моделей Llama 4
В настоящее время Бегемот находится на стадии обучения и будет выпущен позже.
Технические инновации
В модельном ряду Llama 4 представлен ряд значительных технических инноваций, повышающих его производительность и эффективность:
Архитектура смешанного экспертного подхода (MoE)
Одним из важнейших нововведений в Llama 4 является архитектура «смешанных экспертов» (Mixture of Experts, MoE), в которой для каждого токена активируется только подмножество параметров модели:
- Это значительно снижает вычислительные затраты и задержку, сохраняя при этом высокую производительность
- В Llama 4 Maverick каждый токен обрабатывается общим экспертом и одним из 128 маршрутизируемых экспертов
- Такая архитектура позволяет увеличить общее количество параметров модели без увеличения затрат на вывод результатов
Встроенная мультимодальность с ранним слиянием
Llama 4 — первая открытая модель с нативной мультимодальностью, реализованная посредством Early Fusion:
- Текстовые и графические токены интегрированы в единую архитектуру модели
- Это позволяет проводить совместное предварительное обучение с использованием больших объемов текстовых, графических и видеоданных
- В отличие от Llama 3.2, которая использовала отдельные параметры для текста и изображений, Llama 4 распознает оба типа изображений с помощью одних и тех же параметров
Чрезвычайно длинное контекстное окно
Особенно впечатляет чрезвычайно длинное контекстное окно игры Llama 4 Scout:
- Имея 10 миллионов токенов, она значительно превосходит большинство доступных моделей
- Это позволяет обрабатывать очень длинные документы, целые кодовые базы или продолжительные диалоги
- Это становится возможным благодаря архитектуре iRoPE (чередование слоев внимания)
Новые методы обучения
Мета использовала несколько инновационных методов для обучения Ламы 4:
- MetaP: Метод для надежной настройки критически важных гиперпараметров модели
- Точность FP8: использование 8-битных чисел с плавающей запятой для эффективного обучения
- Совместная дистилляция: использование Llama 4 Behemoth в качестве учебной модели для более мелких моделей
- Полностью асинхронное онлайн-обучение с усилением эффекта: новая инфраструктура для крупномасштабного обучения
Доступность и интеграция
Модели Llama 4 доступны на различных платформах и сервисах:
Загрузки и облачные провайдеры
- Модели Scout и Maverick можно скачать напрямую с сайта Meta или через Hugging Face
- Они также доступны через различные облачные платформы:
- Cloudflare Workers AI
- Azure AI Foundry и Azure Databricks
- Vertex AI от Google Cloud
- В ближайшие дни к ним присоединятся и другие партнеры
Интеграция в метапродукты
Компания Meta уже обновила своих ИИ-помощников до версии Llama 4 на различных платформах:
- WhatsApp, Messenger и Instagram Direct доступны в 40 разных странах
- Веб-сайт Meta.AI
- Однако в настоящее время мультимодальные функции доступны только англоговорящим пользователям в США
В связи с этим:
- В Германии появился Meta AI! WhatsApp, Instagram и Facebook получают поддержку ИИ — с важными отличиями от американской версии
Лицензирование и споры
Хотя Meta Llama 4 описывается как «программа с открытым исходным кодом», в лицензии содержатся некоторые ограничения, вызвавшие споры:
Ограничения лицензии
Лицензия сообщества Llama 4 содержит ряд ограничений:
- Компаниям с более чем 700 миллионами активных пользователей в месяц требуется специальная лицензия от Meta
- Пользователям и компаниям из ЕС, по всей видимости, запрещено использовать или распространять эти модели, предположительно из-за нормативных требований
- Существуют требования к наименованию и указанию авторства производных моделей
Дискуссия об «открытом исходном коде»
Ведутся споры о том, следует ли Llama 4 называть «программой с открытым исходным кодом»:
- В 2023 году организация Open Source Initiative определила, что ограничения, содержащиеся в лицензии Llama, выводят её «за пределы категории „открытого исходного кода“»
- Критики утверждают, что это скорее модель «открытого исходного кода» или «открытых весов», чем истинное программное обеспечение с открытым исходным кодом
- Ограничения на лицензирование могут создать проблемы для малых предприятий, не имеющих собственных юридических отделов
Планы на будущее
Мета уже поделился некоторыми подробностями своих планов на будущее, касающихся Llama 4 и последующих игр:
LlamaCon и другие объявления
- Компания Meta проведет свою первую конференцию LlamaCon 29 апреля 2025 года, где будут объявлены дополнительные подробности о ее моделях искусственного интеллекта и планах по развитию продуктов
- Компания также планирует выпустить специальное приложение для своего мета-чат-бота во втором квартале
Расширение языковых навыков
- Компания Meta работает над улучшением языковых навыков Llama 4, чтобы обеспечить более естественное общение
- Цель состоит в том, чтобы обеспечить более плавный двусторонний диалог, в котором пользователи могут прерывать работу модели искусственного интеллекта
- Крис Кокс, директор по продуктам компании Meta, описал готовящуюся к выпуску Llama 4 как «омни-модель», которая позволяет использовать родной язык вместо перевода речи в текст
Агентный ИИ и расширенные возможности
- Марк Цукерберг объявил, что Llama 4 будет обладать «агентными возможностями», которые позволят реализовать новые сценарии использования
- Компания Meta ставит перед собой цель разработать модели искусственного интеллекта, способные «выполнять обобщенные действия, естественно общаться с людьми и решать сложные задачи»
- Компания рассматривает возможность введения платных подписок на своего ИИ-помощника для задач, связанных с работой агентов, таких как бронирование или создание видеороликов
Почему Llama 4 — поворотный момент в мире искусственного интеллекта
Выпуск Llama 4 представляет собой важный шаг в стратегии Meta по превращению в лидера в высококонкурентной области генеративного ИИ. Внедрение архитектуры Mixture of Experts, нативной мультимодальности и впечатляюще длительного контекстного окна демонстрирует, что открытые модели могут конкурировать с проприетарными моделями крупных технологических компаний.
Несмотря на споры вокруг лицензирования и вопрос о том, действительно ли Llama 4 следует называть «открытым исходным кодом», технические достижения представляют собой значительную веху. Способность моделей обрабатывать как текст, так и изображения открывает новые возможности для разработчиков и бизнеса.
Учитывая, что Llama 4 Behemoth всё ещё находится в разработке, а планы по расширению языковых и агентских возможностей уже объявлены, очевидно, что Meta продолжит наращивать инвестиции в ИИ. В ближайшие месяцы станет ясно, как эти новые модели изменят ландшафт ИИ и действительно ли они, как предсказывал Марк Цукерберг, помогут открытым моделям ИИ стать ведущей силой в области искусственного интеллекта.
В связи с этим:
Ваш глобальный партнер по маркетингу и развитию бизнеса
☑️ Язык ведения нашего бизнеса — английский или немецкий
☑️ НОВИНКА: Переписка на вашем родном языке!
Я и моя команда будем рады быть вашими личными консультантами.
Вы можете связаться со мной, заполнив контактную форму здесь wolfenstein@xpert.digital:или просто позвонив по номеру +49 7348 4088 965. Мой адрес электронной почты
Я с нетерпением жду начала нашего совместного проекта.

