⭐ Штучний інтелект (AI) -AI-блог, гаряча точка та контент-центр ⭐ Цифровий інтелект ⭐ xpaper

Вибір голосу 📢

Meta публікує New Llama 4 Scout, Maverick та Behemoth

Опубліковано: 6 квітня 2025 р. / Оновлення з: 6 квітня 2025 р. - Автор: Конрад Вольфенштейн

Meta публікує нову Llama 4 Scout, Maverick та Behemoth-Image: xpert.digital

LLAMA 4: Нове покоління відкритих систем AI від Meta

Llama 4 виявив: ключ метас до наступного віку АІ

5 квітня 2025 року Meta представила останнє покоління своїх моделей AI, Llama 4. Ці нові моделі представляють значний прогрес у розробці відкритих систем AI та мають ряд новаторських функцій, які значно підвищують їх ефективність та ефективність. Серія Llama 4 складається з різних моделей, з двома з них вже загальнодоступними, тоді як найпотужніша модель все ще знаходиться на етапі навчання.

Підходить для цього:

Просто пояснили моделі AI: Зрозумійте основи AI, голосові моделі та міркування

Сім'я моделей Llama 4

META розробила три різні моделі в серії Llama 4, кожна з яких оптимізована для різних додатків:

Llama 4 розвідник

Llama 4 Scout - це компактна модель з вражаючими технічними характеристиками:

17 мільярдів активних параметрів з 16 експертами (загалом 109 мільярдів параметрів)
Може керуватися на одному GPU NVIDIA H100 з квантуванням Int4
Має надзвичайно велике контекстне вікно з 10 мільйонів жетонів, що робить його однією з перших відкритих моделей з цією потужністю

За даними META, скаут перевищує інші моделі у своєму класі, такі як Gemini 3, Gemini 2.0 Flash-Lite та Mistral 3.1. Він особливо підходить для таких завдань, як підсумок довгих документів, персоналізація на основі даних користувачів та складних висновків про велику кількість знань.

Llama 4 Maverick

Llama 4 Maverick є більш потужною з двох доступних моделей:

17 мільярдів активних параметрів із 128 експертами (загалом 400 мільярдів параметрів)
Експериментальна версія чату досягла ELO 1417 на Lmarena
Перевищує такі моделі, як GPT-4O та Gemini 2.0 Flash у численних орієнтирах

Ця модель особливо підходить для загальної допомоги та додатків для чатів, таких як творче письмо, і показує результати, порівнянні з DeepSeek V3 у міркуванні та кодуванні завдань, але з половиною параметрів.

Llama 4 Бегемот

Llama 4 Behemoth - найпотужніша модель Metas, яка ще не є загальнодоступною:

288 мільярдів активних параметрів з 16 експертами (загалом майже 2 трлн параметрів)
Згідно з META, він перевищує GPT-4.5, Claude Sonnet 3.7 та Gemini 2.0 Pro для декількох орієнтирів STEM
Служить «моделлю вчителя» для менших моделей Llama 4

Наразі Бегемот все ще знаходиться на етапі навчання і буде опублікований пізніше.

Технічні інновації

Модельна серія Llama 4 представляє кілька важливих технічних інновацій, які підвищують їх ефективність та ефективність:

Суміш експертів (МО) архітектури

Однією з найважливіших нововведень Lama 4 є суміш архітектури експертів (МО), в якій для кожного токена активується лише частина параметрів моделі:

Це суттєво зменшує зусилля та затримку розрахунків, тоді як висока продуктивність зберігається
У Llama 4 Maverick кожен жетон обробляється загальним експертом і одним із 128 побігових експертів
Ця архітектура дозволяє збільшити загальний параметр моделі без збільшення витрат на висновки

Рідна мультимодальність з раннім синтезом

Llama 4 - перша відкрита модель з рідною мультимодальністю від раннього Fusion:

Текстові та зображення жетони інтегровані в єдину архітектуру моделі
Це забезпечує спільну попередню підготовку з великими кількостями текстових, зображень та відеоданих
На відміну від LLAMA 3.2, яка використовувала окремі параметри для тексту та зображень, Llama 4 розуміє обидва модальності з однаковими параметрами

Надзвичайно довге контекстне вікно

Надзвичайно довге контекстне вікно розвідника Llama 4 є особливо вражаючим:

Маючи 10 мільйонів жетонів, він явно перевищує більшість наявних моделей
Це дозволяє обробляти дуже довгі документи, цілі бази коду або великі розмови
Архітектура IROPE (переплетені шари уваги) робить це можливим

Нові методи навчання

META використовував кілька інноваційних методів для навчання LLAMA 4:

Метап: методика надійної координації критичної моделі гіпераметра
FP8 Точність: Використання 8-бітних слайдних номерів для ефективної підготовки
Співізиляція: Використання Llama 4 Behemoth як модель вчителя для менших моделей
Повністю асинхронне навчання в Інтернеті з підкріпленнями: нова інфраструктура для масштабного навчання

Наявність та інтеграція

Моделі Llama 4 доступні через різні платформи та послуги:

Завантажити та хмарний постачальник

Моделі розвідника та маверика можна завантажити безпосередньо з мета або через обійми обличчя
Вони також доступні через різні хмарні платформи:
- Cloudflare Workers AI
- Azure AI Foundry та Azure Databricks
- Вершина AI Google Cloud
- Інші партнери будуть слідувати в найближчі дні

Інтеграція в мета -продукти

Meta вже оновив своїх помічників AI на різних платформах на Llama 4:

WhatsApp, Messenger та Instagram безпосередньо в 40 різних країнах
Веб -сайт Meta.ai
Однак мультимодальні функції наразі доступні лише для користувачів англійської мови в США

Підходить для цього:

Мета AI в Німеччині тут! WhatsApp, Instagram & Facebook Отримайте AI з важливими відмінностями у версії США

Ліцензія та суперечка

Хоча Meta Llama 4 відноситься до "відкритого коду", є деякі обмеження в ліцензії, що викликало суперечки:

Обмеження ліцензії

Ліцензія громади LLAMA 4 містить кілька обмежень:

Компанії з більш ніж 700 мільйонами щомісячних активних користувачів потребують спеціальної ліцензії від Meta
Моделі, мабуть, не дозволяють використовувати або розповсюджувати користувачів та компанії з ЄС, імовірно, через регуляторні вимоги
Існують вимоги щодо іменування та атрибуції для похідних моделей

Дебати про "відкритий код"

Існує дискусія щодо того, чи слід насправді називати "відкритим кодом" Llama 4:

Ініціатива з відкритим кодом виявила в 2023 році, що обмеження ліцензії LLAMA виводять її з категорії "Відкритий код"
Критики стверджують, що це більше модель "відкриття джерела" або "з відкритими вагами", ніж реальне програмне забезпечення з відкритим кодом
Обмеження ліцензії можуть бути проблематичними для малих компаній без власних юридичних відділів

Майбутні плани

Мета вже дала певну інформацію про свої майбутні плани щодо Llama 4 і за його межами:

Llamacon та інші оголошення

META організуватиме першу конференцію Llamacon 29 квітня 2025 року
Компанія також планує опублікувати спеціальну заявку на свій мета-чат у другому кварталі

Розширення мовних навичок

META працює над вдосконаленням мовних навичок Llama 4, щоб забезпечити більше природних розмов
Мета полягає в тому, щоб забезпечити більше рідких, двосторонніх діалогів, в яких користувачі можуть перервати модель AI
Кріс Кокс, головний директор з продуктів META, описав майбутню Llama 4 як "модель Omni", яка дозволяє рідною мовою замість того, щоб перекладати мову в текст

Агентний ШІ та розширені навички

Марк Цукерберг оголосив, що Llama 4 матиме "навички агента", які повинні дозволити нові програми
META має на меті розробити моделі AI, які "здійснюють узагальнені дії, звичайно спілкуються з людьми та вирішують складні проблеми"
Компанія розглядає можливість пропонувати передплату на премію за своїм помічником AI для таких цілей агента, як бронювання або відеопродукція

Чому Llama 4 - це переломний момент в пейзажі ШІ

Публікація LLAMA 4 є значним кроком у стратегії Metas, щоб стати провідною сферою генеративного ШІ у висококонкурентній області. Завдяки впровадженню суміші архітектури експертів, рідної мультимодальності та вражаюче довгим вікном контексту, Meta показує, що відкриті моделі можуть йти в курсі власних моделей великих технологічних компаній.

Незважаючи на суперечки щодо ліцензування та питання про те, чи слід дійсно LLAMA 4 як "відкритий код", технічний прогрес є важливою віхою. Здатність моделей обробляти як текстові, так і зображення відкриває нові можливості для розробників та компаній.

З видатним бегемотом Llama 4 та оголошеними планами розширених навичок мови та агентів зрозуміло, що META ще більше посилить свої інвестиції в ШІ. У найближчі місяці покажуть, як ці нові моделі змінюють пейзаж AI та чи, як це прогнозував Марк Цукерберг, вони насправді допоможуть зробити відкриті моделі AI у галузі штучного інтелекту.

Підходить для цього:

Ваш глобальний партнер з маркетингу та розвитку бізнесу

☑ Наша ділова мова - англійська чи німецька

☑ Нове: листування на вашій національній мові!

Конрад Вольфенштейн

Я радий бути доступним вам та моїй команді як особистого консультанта.

Ви можете зв’язатися зі мною, заповнивши тут контактну форму або просто зателефонуйте мені за номером +49 89 674 804 (Мюнхен) . Моя електронна адреса: Вольфенштейн ∂ xpert.digital

Я з нетерпінням чекаю нашого спільного проекту.