Компания Meta выпустила новые серии моделей ИИ: Llama 4 Scout, Maverick и Behemoth.

Konrad Wolfenstein

1 год назад

Компания Meta выпустила новую серию моделей ИИ: Llama 4 Scout, Maverick и Behemoth – Изображение: Xpert.Digital

Llama 4: Новое поколение открытых систем искусственного интеллекта от Meta

Llama 4 раскрыта: ключ Meta к следующей эре искусственного интеллекта

5 апреля 2025 года компания Meta представила последнее поколение своих моделей искусственного интеллекта — Llama 4. Эти новые модели представляют собой значительный шаг вперед в разработке открытых систем ИИ и обладают рядом революционных возможностей, которые существенно повышают их производительность и эффективность. Серия Llama 4 включает в себя несколько моделей, две из которых уже доступны публично, а самая мощная модель все еще находится на стадии обучения.

В связи с этим:

Простым языком объяснения моделей ИИ: поймите основы ИИ, языковых моделей и логического мышления

Семейство моделей Llama 4

Компания Meta разработала три различные модели серии Llama 4, каждая из которых оптимизирована для разных сценариев использования:

Лама 4 Скаут

Llama 4 Scout — это компактная модель с впечатляющими техническими характеристиками:

17 миллиардов активных параметров с участием 16 экспертов (всего 109 миллиардов параметров)
Может работать на одном графическом процессоре NVIDIA H100 с квантованием Int4
Она отличается невероятно большим контекстным окном в 10 миллионов токенов, что делает её одной из первых открытых моделей с такими возможностями

По данным Meta, Scout превосходит другие модели своего класса, такие как Gemini 3, Gemini 2.0 Flash-Lite и Mistral 3.1. Он особенно хорошо подходит для таких задач, как составление кратких обзоров длинных документов, персонализация контента на основе пользовательских данных и извлечение сложных выводов из больших объемов информации.

Лама 4 Маверик

Llama 4 Maverick — более мощная из двух доступных моделей:

17 миллиардов активных параметров, 128 экспертов (всего 400 миллиардов параметров)
Экспериментальная версия чата достигла рейтинга 1417 ELO на LMArena
По данным Meta, в многочисленных тестах она превосходит такие модели, как GPT-4o и Gemini 2.0 Flash

Эта модель особенно подходит для приложений общего назначения и чата, таких как приложения для творческого письма, и демонстрирует результаты, сопоставимые с DeepSeek v3 в задачах логического мышления и программирования, но с вдвое меньшим количеством параметров.

Лама 4 Бегемот

Llama 4 Behemoth — самая мощная модель в Meta, но она пока недоступна для публичного доступа:

288 миллиардов активных параметров, управляемых 16 экспертами (всего почти 2 триллиона параметров)
По данным Meta, он превосходит GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro в нескольких тестах STEM
Служит "учебным образцом" для более компактных моделей Llama 4

В настоящее время Бегемот находится на стадии обучения и будет выпущен позже.

Технические инновации

В модельном ряду Llama 4 представлен ряд значительных технических инноваций, повышающих его производительность и эффективность:

Архитектура смешанного экспертного подхода (MoE)

Одним из важнейших нововведений в Llama 4 является архитектура «смешанных экспертов» (Mixture of Experts, MoE), в которой для каждого токена активируется только подмножество параметров модели:

Это значительно снижает вычислительные затраты и задержку, сохраняя при этом высокую производительность
В Llama 4 Maverick каждый токен обрабатывается общим экспертом и одним из 128 маршрутизируемых экспертов
Такая архитектура позволяет увеличить общее количество параметров модели без увеличения затрат на вывод результатов

Встроенная мультимодальность с ранним слиянием

Llama 4 — первая открытая модель с нативной мультимодальностью, реализованная посредством Early Fusion:

Текстовые и графические токены интегрированы в единую архитектуру модели
Это позволяет проводить совместное предварительное обучение с использованием больших объемов текстовых, графических и видеоданных
В отличие от Llama 3.2, которая использовала отдельные параметры для текста и изображений, Llama 4 распознает оба типа изображений с помощью одних и тех же параметров

Чрезвычайно длинное контекстное окно

Особенно впечатляет чрезвычайно длинное контекстное окно игры Llama 4 Scout:

Имея 10 миллионов токенов, она значительно превосходит большинство доступных моделей
Это позволяет обрабатывать очень длинные документы, целые кодовые базы или продолжительные диалоги
Это становится возможным благодаря архитектуре iRoPE (чередование слоев внимания)

Новые методы обучения

Мета использовала несколько инновационных методов для обучения Ламы 4:

MetaP: Метод для надежной настройки критически важных гиперпараметров модели
Точность FP8: использование 8-битных чисел с плавающей запятой для эффективного обучения
Совместная дистилляция: использование Llama 4 Behemoth в качестве учебной модели для более мелких моделей
Полностью асинхронное онлайн-обучение с усилением эффекта: новая инфраструктура для крупномасштабного обучения

Доступность и интеграция

Модели Llama 4 доступны на различных платформах и сервисах:

Загрузки и облачные провайдеры

Модели Scout и Maverick можно скачать напрямую с сайта Meta или через Hugging Face
Они также доступны через различные облачные платформы:
- Cloudflare Workers AI
- Azure AI Foundry и Azure Databricks
- Vertex AI от Google Cloud
- В ближайшие дни к ним присоединятся и другие партнеры

Интеграция в метапродукты

Компания Meta уже обновила своих ИИ-помощников до версии Llama 4 на различных платформах:

WhatsApp, Messenger и Instagram Direct доступны в 40 разных странах
Веб-сайт Meta.AI
Однако в настоящее время мультимодальные функции доступны только англоговорящим пользователям в США

В связи с этим:

В Германии появился Meta AI! WhatsApp, Instagram и Facebook получают поддержку ИИ — с важными отличиями от американской версии

Лицензирование и споры

Хотя Meta Llama 4 описывается как «программа с открытым исходным кодом», в лицензии содержатся некоторые ограничения, вызвавшие споры:

Ограничения лицензии

Лицензия сообщества Llama 4 содержит ряд ограничений:

Компаниям с более чем 700 миллионами активных пользователей в месяц требуется специальная лицензия от Meta
Пользователям и компаниям из ЕС, по всей видимости, запрещено использовать или распространять эти модели, предположительно из-за нормативных требований
Существуют требования к наименованию и указанию авторства производных моделей

Дискуссия об «открытом исходном коде»

Ведутся споры о том, следует ли Llama 4 называть «программой с открытым исходным кодом»:

В 2023 году организация Open Source Initiative определила, что ограничения, содержащиеся в лицензии Llama, выводят её «за пределы категории „открытого исходного кода“»
Критики утверждают, что это скорее модель «открытого исходного кода» или «открытых весов», чем истинное программное обеспечение с открытым исходным кодом
Ограничения на лицензирование могут создать проблемы для малых предприятий, не имеющих собственных юридических отделов

Планы на будущее

Мета уже поделился некоторыми подробностями своих планов на будущее, касающихся Llama 4 и последующих игр:

LlamaCon и другие объявления

Компания Meta проведет свою первую конференцию LlamaCon 29 апреля 2025 года, где будут объявлены дополнительные подробности о ее моделях искусственного интеллекта и планах по развитию продуктов
Компания также планирует выпустить специальное приложение для своего мета-чат-бота во втором квартале

Расширение языковых навыков

Компания Meta работает над улучшением языковых навыков Llama 4, чтобы обеспечить более естественное общение
Цель состоит в том, чтобы обеспечить более плавный двусторонний диалог, в котором пользователи могут прерывать работу модели искусственного интеллекта
Крис Кокс, директор по продуктам компании Meta, описал готовящуюся к выпуску Llama 4 как «омни-модель», которая позволяет использовать родной язык вместо перевода речи в текст

Агентный ИИ и расширенные возможности

Марк Цукерберг объявил, что Llama 4 будет обладать «агентными возможностями», которые позволят реализовать новые сценарии использования
Компания Meta ставит перед собой цель разработать модели искусственного интеллекта, способные «выполнять обобщенные действия, естественно общаться с людьми и решать сложные задачи»
Компания рассматривает возможность введения платных подписок на своего ИИ-помощника для задач, связанных с работой агентов, таких как бронирование или создание видеороликов

Почему Llama 4 — поворотный момент в мире искусственного интеллекта

Выпуск Llama 4 представляет собой важный шаг в стратегии Meta по превращению в лидера в высококонкурентной области генеративного ИИ. Внедрение архитектуры Mixture of Experts, нативной мультимодальности и впечатляюще длительного контекстного окна демонстрирует, что открытые модели могут конкурировать с проприетарными моделями крупных технологических компаний.

Несмотря на споры вокруг лицензирования и вопрос о том, действительно ли Llama 4 следует называть «открытым исходным кодом», технические достижения представляют собой значительную веху. Способность моделей обрабатывать как текст, так и изображения открывает новые возможности для разработчиков и бизнеса.

Учитывая, что Llama 4 Behemoth всё ещё находится в разработке, а планы по расширению языковых и агентских возможностей уже объявлены, очевидно, что Meta продолжит наращивать инвестиции в ИИ. В ближайшие месяцы станет ясно, как эти новые модели изменят ландшафт ИИ и действительно ли они, как предсказывал Марк Цукерберг, помогут открытым моделям ИИ стать ведущей силой в области искусственного интеллекта.

В связи с этим:

Ваш глобальный партнер по маркетингу и развитию бизнеса

☑️ Язык ведения нашего бизнеса — английский или немецкий

☑️ НОВИНКА: Переписка на вашем родном языке!

Konrad Wolfenstein

Я и моя команда будем рады быть вашими личными консультантами.

Вы можете связаться со мной, заполнив контактную форму здесь wolfenstein@xpert.digital:или просто позвонив по номеру +49 7348 4088 965. Мой адрес электронной почты

Я с нетерпением жду начала нашего совместного проекта.

Компания Meta выпустила новые серии моделей ИИ: Llama 4 Scout, Maverick и Behemoth.

Llama 4: Новое поколение открытых систем искусственного интеллекта от Meta