иконка веб-сайта Xpert.Digital

Компания Meta выпустила новые серии моделей ИИ: Llama 4 Scout, Maverick и Behemoth.

Компания Meta выпустила новые серии моделей ИИ: Llama 4 Scout, Maverick и Behemoth.

Компания Meta выпустила новую серию моделей ИИ: Llama 4 Scout, Maverick и Behemoth – Изображение: Xpert.Digital

Llama 4: Новое поколение открытых систем искусственного интеллекта от Meta

Llama 4 раскрыта: ключ Meta к следующей эре искусственного интеллекта

5 апреля 2025 года компания Meta представила последнее поколение своих моделей искусственного интеллекта — Llama 4. Эти новые модели представляют собой значительный шаг вперед в разработке открытых систем ИИ и обладают рядом революционных возможностей, которые существенно повышают их производительность и эффективность. Серия Llama 4 включает в себя несколько моделей, две из которых уже доступны публично, а самая мощная модель все еще находится на стадии обучения.

В связи с этим:

Семейство моделей Llama 4

Компания Meta разработала три различные модели серии Llama 4, каждая из которых оптимизирована для разных сценариев использования:

Лама 4 Скаут

Llama 4 Scout — это компактная модель с впечатляющими техническими характеристиками:

  • 17 миллиардов активных параметров с участием 16 экспертов (всего 109 миллиардов параметров)
  • Может работать на одном графическом процессоре NVIDIA H100 с квантованием Int4
  • Она отличается невероятно большим контекстным окном в 10 миллионов токенов, что делает её одной из первых открытых моделей с такими возможностями

По данным Meta, Scout превосходит другие модели своего класса, такие как Gemini 3, Gemini 2.0 Flash-Lite и Mistral 3.1. Он особенно хорошо подходит для таких задач, как составление кратких обзоров длинных документов, персонализация контента на основе пользовательских данных и извлечение сложных выводов из больших объемов информации.

Лама 4 Маверик

Llama 4 Maverick — более мощная из двух доступных моделей:

  • 17 миллиардов активных параметров, 128 экспертов (всего 400 миллиардов параметров)
  • Экспериментальная версия чата достигла рейтинга 1417 ELO на LMArena
  • По данным Meta, в многочисленных тестах она превосходит такие модели, как GPT-4o и Gemini 2.0 Flash

Эта модель особенно подходит для приложений общего назначения и чата, таких как приложения для творческого письма, и демонстрирует результаты, сопоставимые с DeepSeek v3 в задачах логического мышления и программирования, но с вдвое меньшим количеством параметров.

Лама 4 Бегемот

Llama 4 Behemoth — самая мощная модель в Meta, но она пока недоступна для публичного доступа:

  • 288 миллиардов активных параметров, управляемых 16 экспертами (всего почти 2 триллиона параметров)
  • По данным Meta, он превосходит GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro в нескольких тестах STEM
  • Служит "учебным образцом" для более компактных моделей Llama 4

В настоящее время Бегемот находится на стадии обучения и будет выпущен позже.

Технические инновации

В модельном ряду Llama 4 представлен ряд значительных технических инноваций, повышающих его производительность и эффективность:

Архитектура смешанного экспертного подхода (MoE)

Одним из важнейших нововведений в Llama 4 является архитектура «смешанных экспертов» (Mixture of Experts, MoE), в которой для каждого токена активируется только подмножество параметров модели:

  • Это значительно снижает вычислительные затраты и задержку, сохраняя при этом высокую производительность
  • В Llama 4 Maverick каждый токен обрабатывается общим экспертом и одним из 128 маршрутизируемых экспертов
  • Такая архитектура позволяет увеличить общее количество параметров модели без увеличения затрат на вывод результатов

Встроенная мультимодальность с ранним слиянием

Llama 4 — первая открытая модель с нативной мультимодальностью, реализованная посредством Early Fusion:

  • Текстовые и графические токены интегрированы в единую архитектуру модели
  • Это позволяет проводить совместное предварительное обучение с использованием больших объемов текстовых, графических и видеоданных
  • В отличие от Llama 3.2, которая использовала отдельные параметры для текста и изображений, Llama 4 распознает оба типа изображений с помощью одних и тех же параметров

Чрезвычайно длинное контекстное окно

Особенно впечатляет чрезвычайно длинное контекстное окно игры Llama 4 Scout:

  • Имея 10 миллионов токенов, она значительно превосходит большинство доступных моделей
  • Это позволяет обрабатывать очень длинные документы, целые кодовые базы или продолжительные диалоги
  • Это становится возможным благодаря архитектуре iRoPE (чередование слоев внимания)

Новые методы обучения

Мета использовала несколько инновационных методов для обучения Ламы 4:

  • MetaP: Метод для надежной настройки критически важных гиперпараметров модели
  • Точность FP8: использование 8-битных чисел с плавающей запятой для эффективного обучения
  • Совместная дистилляция: использование Llama 4 Behemoth в качестве учебной модели для более мелких моделей
  • Полностью асинхронное онлайн-обучение с усилением эффекта: новая инфраструктура для крупномасштабного обучения

Доступность и интеграция

Модели Llama 4 доступны на различных платформах и сервисах:

Загрузки и облачные провайдеры

  • Модели Scout и Maverick можно скачать напрямую с сайта Meta или через Hugging Face
  • Они также доступны через различные облачные платформы:
    • Cloudflare Workers AI
    • Azure AI Foundry и Azure Databricks
    • Vertex AI от Google Cloud
    • В ближайшие дни к ним присоединятся и другие партнеры

Интеграция в метапродукты

Компания Meta уже обновила своих ИИ-помощников до версии Llama 4 на различных платформах:

  • WhatsApp, Messenger и Instagram Direct доступны в 40 разных странах
  • Веб-сайт Meta.AI
  • Однако в настоящее время мультимодальные функции доступны только англоговорящим пользователям в США

В связи с этим:

Лицензирование и споры

Хотя Meta Llama 4 описывается как «программа с открытым исходным кодом», в лицензии содержатся некоторые ограничения, вызвавшие споры:

Ограничения лицензии

Лицензия сообщества Llama 4 содержит ряд ограничений:

  • Компаниям с более чем 700 миллионами активных пользователей в месяц требуется специальная лицензия от Meta
  • Пользователям и компаниям из ЕС, по всей видимости, запрещено использовать или распространять эти модели, предположительно из-за нормативных требований
  • Существуют требования к наименованию и указанию авторства производных моделей

Дискуссия об «открытом исходном коде»

Ведутся споры о том, следует ли Llama 4 называть «программой с открытым исходным кодом»:

  • В 2023 году организация Open Source Initiative определила, что ограничения, содержащиеся в лицензии Llama, выводят её «за пределы категории „открытого исходного кода“»
  • Критики утверждают, что это скорее модель «открытого исходного кода» или «открытых весов», чем истинное программное обеспечение с открытым исходным кодом
  • Ограничения на лицензирование могут создать проблемы для малых предприятий, не имеющих собственных юридических отделов

Планы на будущее

Мета уже поделился некоторыми подробностями своих планов на будущее, касающихся Llama 4 и последующих игр:

LlamaCon и другие объявления

  • Компания Meta проведет свою первую конференцию LlamaCon 29 апреля 2025 года, где будут объявлены дополнительные подробности о ее моделях искусственного интеллекта и планах по развитию продуктов
  • Компания также планирует выпустить специальное приложение для своего мета-чат-бота во втором квартале

Расширение языковых навыков

  • Компания Meta работает над улучшением языковых навыков Llama 4, чтобы обеспечить более естественное общение
  • Цель состоит в том, чтобы обеспечить более плавный двусторонний диалог, в котором пользователи могут прерывать работу модели искусственного интеллекта
  • Крис Кокс, директор по продуктам компании Meta, описал готовящуюся к выпуску Llama 4 как «омни-модель», которая позволяет использовать родной язык вместо перевода речи в текст

Агентный ИИ и расширенные возможности

  • Марк Цукерберг объявил, что Llama 4 будет обладать «агентными возможностями», которые позволят реализовать новые сценарии использования
  • Компания Meta ставит перед собой цель разработать модели искусственного интеллекта, способные «выполнять обобщенные действия, естественно общаться с людьми и решать сложные задачи»
  • Компания рассматривает возможность введения платных подписок на своего ИИ-помощника для задач, связанных с работой агентов, таких как бронирование или создание видеороликов

Почему Llama 4 — поворотный момент в мире искусственного интеллекта

Выпуск Llama 4 представляет собой важный шаг в стратегии Meta по превращению в лидера в высококонкурентной области генеративного ИИ. Внедрение архитектуры Mixture of Experts, нативной мультимодальности и впечатляюще длительного контекстного окна демонстрирует, что открытые модели могут конкурировать с проприетарными моделями крупных технологических компаний.

Несмотря на споры вокруг лицензирования и вопрос о том, действительно ли Llama 4 следует называть «открытым исходным кодом», технические достижения представляют собой значительную веху. Способность моделей обрабатывать как текст, так и изображения открывает новые возможности для разработчиков и бизнеса.

Учитывая, что Llama 4 Behemoth всё ещё находится в разработке, а планы по расширению языковых и агентских возможностей уже объявлены, очевидно, что Meta продолжит наращивать инвестиции в ИИ. В ближайшие месяцы станет ясно, как эти новые модели изменят ландшафт ИИ и действительно ли они, как предсказывал Марк Цукерберг, помогут открытым моделям ИИ стать ведущей силой в области искусственного интеллекта.

В связи с этим:

 

Ваш глобальный партнер по маркетингу и развитию бизнеса

☑️ Язык ведения нашего бизнеса — английский или немецкий

☑️ НОВИНКА: Переписка на вашем родном языке!

 

Konrad Wolfenstein

Я и моя команда будем рады быть вашими личными консультантами.

Вы можете связаться со мной, заполнив контактную форму здесь wolfenstein@xpert.digital:или просто позвонив по номеру +49 7348 4088 965. Мой адрес электронной почты

Я с нетерпением жду начала нашего совместного проекта.

 

 

☑️ Поддержка малых и средних предприятий в области стратегии, консалтинга, планирования и реализации проектов

☑️ Разработка или корректировка цифровой стратегии и цифровизации

☑️ Расширение и оптимизация международных процессов продаж

☑️ Глобальные и цифровые торговые платформы B2B

☑️ Развитие бизнеса / Маркетинг / PR / Выставки от компании Pioneer

Оставьте мобильную версию