Значок веб-сайта Эксперт.Цифровой

Компания Meta выпустила новые серии моделей ИИ: Llama 4 Scout, Maverick и Behemoth.

Компания Meta выпустила новые серии моделей ИИ: Llama 4 Scout, Maverick и Behemoth.

Компания Meta выпустила новую серию моделей ИИ: Llama 4 Scout, Maverick и Behemoth – Изображение: Xpert.Digital

Llama 4: Новое поколение открытых систем искусственного интеллекта от Meta.

Llama 4 раскрыта: ключ Meta к следующей эре искусственного интеллекта

5 апреля 2025 года компания Meta представила последнее поколение своих моделей искусственного интеллекта — Llama 4. Эти новые модели представляют собой значительный шаг вперед в разработке открытых систем ИИ и обладают рядом революционных возможностей, которые существенно повышают их производительность и эффективность. Серия Llama 4 включает в себя несколько моделей, две из которых уже доступны публично, а самая мощная модель все еще находится на стадии обучения.

Подходит для:

Семейство моделей Llama 4

Компания Meta разработала три различные модели серии Llama 4, каждая из которых оптимизирована для разных сценариев использования:

Лама 4 Скаут

Llama 4 Scout — это компактная модель с впечатляющими техническими характеристиками:

  • 17 миллиардов активных параметров с участием 16 экспертов (всего 109 миллиардов параметров)
  • Может работать на одном графическом процессоре NVIDIA H100 с квантованием Int4.
  • Она отличается невероятно большим контекстным окном в 10 миллионов токенов, что делает её одной из первых открытых моделей с такими возможностями.

По данным Meta, Scout превосходит другие модели своего класса, такие как Gemini 3, Gemini 2.0 Flash-Lite и Mistral 3.1. Он особенно хорошо подходит для таких задач, как составление кратких обзоров длинных документов, персонализация контента на основе пользовательских данных и извлечение сложных выводов из больших объемов информации.

Лама 4 Маверик

Llama 4 Maverick — более мощная из двух доступных моделей:

  • 17 миллиардов активных параметров, 128 экспертов (всего 400 миллиардов параметров)
  • Экспериментальная версия чата достигла рейтинга 1417 ELO на LMArena.
  • По данным Meta, в многочисленных тестах она превосходит такие модели, как GPT-4o и Gemini 2.0 Flash.

Эта модель особенно подходит для приложений общего назначения и чата, таких как приложения для творческого письма, и демонстрирует результаты, сопоставимые с DeepSeek v3 в задачах логического мышления и программирования, но с вдвое меньшим количеством параметров.

Лама 4 Бегемот

Llama 4 Behemoth — самая мощная модель в Meta, но она пока недоступна для публичного доступа:

  • 288 миллиардов активных параметров, управляемых 16 экспертами (всего почти 2 триллиона параметров).
  • По данным Meta, он превосходит GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro в нескольких тестах STEM.
  • Служит "учебным образцом" для более компактных моделей Llama 4.

В настоящее время Бегемот находится на стадии обучения и будет выпущен позже.

Технические инновации

В модельном ряду Llama 4 представлен ряд значительных технических инноваций, повышающих его производительность и эффективность:

Архитектура смешанного экспертного подхода (MoE)

Одним из важнейших нововведений в Llama 4 является архитектура «смешанных экспертов» (Mixture of Experts, MoE), в которой для каждого токена активируется только подмножество параметров модели:

  • Это значительно снижает вычислительные затраты и задержку, сохраняя при этом высокую производительность.
  • В Llama 4 Maverick каждый токен обрабатывается общим экспертом и одним из 128 маршрутизируемых экспертов.
  • Такая архитектура позволяет увеличить общее количество параметров модели без увеличения затрат на вывод результатов.

Встроенная мультимодальность с ранним слиянием

Llama 4 — первая открытая модель с нативной мультимодальностью, реализованная посредством Early Fusion:

  • Текстовые и графические токены интегрированы в единую архитектуру модели.
  • Это позволяет проводить совместное предварительное обучение с использованием больших объемов текстовых, графических и видеоданных.
  • В отличие от Llama 3.2, которая использовала отдельные параметры для текста и изображений, Llama 4 распознает оба типа изображений с помощью одних и тех же параметров.

Чрезвычайно длинное контекстное окно

Особенно впечатляет чрезвычайно длинное контекстное окно игры Llama 4 Scout:

  • Имея 10 миллионов токенов, она значительно превосходит большинство доступных моделей.
  • Это позволяет обрабатывать очень длинные документы, целые кодовые базы или продолжительные диалоги.
  • Это становится возможным благодаря архитектуре iRoPE (чередование слоев внимания).

Новые методы обучения

Мета использовала несколько инновационных методов для обучения Ламы 4:

  • MetaP: Метод для надежной настройки критически важных гиперпараметров модели.
  • Точность FP8: использование 8-битных чисел с плавающей запятой для эффективного обучения.
  • Совместная дистилляция: использование Llama 4 Behemoth в качестве учебной модели для более мелких моделей.
  • Полностью асинхронное онлайн-обучение с усилением эффекта: новая инфраструктура для крупномасштабного обучения.

Доступность и интеграция

Модели Llama 4 доступны на различных платформах и сервисах:

Загрузки и облачные провайдеры

  • Модели Scout и Maverick можно скачать напрямую с сайта Meta или через Hugging Face.
  • Они также доступны через различные облачные платформы:
    • Cloudflare Workers AI
    • Azure AI Foundry и Azure Databricks
    • Vertex AI от Google Cloud
    • В ближайшие дни к ним присоединятся и другие партнеры.

Интеграция в метапродукты

Компания Meta уже обновила своих ИИ-помощников до версии Llama 4 на различных платформах:

  • WhatsApp, Messenger и Instagram Direct доступны в 40 разных странах.
  • Веб-сайт Meta.AI
  • Однако в настоящее время мультимодальные функции доступны только англоговорящим пользователям в США.

Подходит для:

Лицензирование и споры

Хотя Meta Llama 4 описывается как «программа с открытым исходным кодом», в лицензии содержатся некоторые ограничения, вызвавшие споры:

Ограничения лицензии

Лицензия сообщества Llama 4 содержит ряд ограничений:

  • Компаниям с более чем 700 миллионами активных пользователей в месяц требуется специальная лицензия от Meta.
  • Пользователям и компаниям из ЕС, по всей видимости, запрещено использовать или распространять эти модели, предположительно из-за нормативных требований.
  • Существуют требования к наименованию и указанию авторства производных моделей.

Дискуссия об «открытом исходном коде»

Ведутся споры о том, следует ли Llama 4 называть «программой с открытым исходным кодом»:

  • В 2023 году организация Open Source Initiative определила, что ограничения, содержащиеся в лицензии Llama, выводят её «за пределы категории „открытого исходного кода“».
  • Критики утверждают, что это скорее модель «открытого исходного кода» или «открытых весов», чем истинное программное обеспечение с открытым исходным кодом.
  • Ограничения на лицензирование могут создать проблемы для малых предприятий, не имеющих собственных юридических отделов.

Планы на будущее

Мета уже поделился некоторыми подробностями своих планов на будущее, касающихся Llama 4 и последующих игр:

LlamaCon и другие объявления

  • Компания Meta проведет свою первую конференцию LlamaCon 29 апреля 2025 года, где будут объявлены дополнительные подробности о ее моделях искусственного интеллекта и планах по развитию продуктов.
  • Компания также планирует выпустить специальное приложение для своего мета-чат-бота во втором квартале.

Расширение языковых навыков

  • Компания Meta работает над улучшением языковых навыков Llama 4, чтобы обеспечить более естественное общение.
  • Цель состоит в том, чтобы обеспечить более плавный двусторонний диалог, в котором пользователи могут прерывать работу модели искусственного интеллекта.
  • Крис Кокс, директор по продуктам компании Meta, описал готовящуюся к выпуску Llama 4 как «омни-модель», которая позволяет использовать родной язык вместо перевода речи в текст.

Агентный ИИ и расширенные возможности

  • Марк Цукерберг объявил, что Llama 4 будет обладать «агентными возможностями», которые позволят реализовать новые сценарии использования.
  • Компания Meta ставит перед собой цель разработать модели искусственного интеллекта, способные «выполнять обобщенные действия, естественно общаться с людьми и решать сложные задачи».
  • Компания рассматривает возможность введения платных подписок на своего ИИ-помощника для задач, связанных с работой агентов, таких как бронирование или создание видеороликов.

Почему Llama 4 — поворотный момент в мире искусственного интеллекта

Выпуск Llama 4 представляет собой важный шаг в стратегии Meta по превращению в лидера в высококонкурентной области генеративного ИИ. Внедрение архитектуры Mixture of Experts, нативной мультимодальности и впечатляюще длительного контекстного окна демонстрирует, что открытые модели могут конкурировать с проприетарными моделями крупных технологических компаний.

Несмотря на споры вокруг лицензирования и вопрос о том, действительно ли Llama 4 следует называть «открытым исходным кодом», технические достижения представляют собой значительную веху. Способность моделей обрабатывать как текст, так и изображения открывает новые возможности для разработчиков и бизнеса.

Учитывая, что Llama 4 Behemoth всё ещё находится в разработке, а планы по расширению языковых и агентских возможностей уже объявлены, очевидно, что Meta продолжит наращивать инвестиции в ИИ. В ближайшие месяцы станет ясно, как эти новые модели изменят ландшафт ИИ и действительно ли они, как предсказывал Марк Цукерберг, помогут открытым моделям ИИ стать ведущей силой в области искусственного интеллекта.

Подходит для:

 

Ваш глобальный партнер по маркетингу и развитию бизнеса

☑️ Наш деловой язык — английский или немецкий.

☑️ НОВИНКА: Переписка на вашем национальном языке!

 

Konrad Wolfenstein

Я был бы рад служить вам и моей команде в качестве личного консультанта.

Вы можете связаться со мной, заполнив контактную форму или просто позвоните мне по телефону +49 89 89 674 804 (Мюнхен) . Мой адрес электронной почты: wolfenstein xpert.digital

Я с нетерпением жду нашего совместного проекта.

 

 

☑️ Поддержка МСП в разработке стратегии, консультировании, планировании и реализации.

☑️ Создание или корректировка цифровой стратегии и цифровизации.

☑️ Расширение и оптимизация процессов международных продаж.

☑️ Глобальные и цифровые торговые платформы B2B

☑️ Пионерское развитие бизнеса/маркетинг/PR/выставки.

Выйти из мобильной версии