Meta випускає нові серії моделей зі штучним інтелектом: Llama 4 Scout, Maverick та Behemoth

Konrad Wolfenstein

1 рік тому

Meta випускає нові серії моделей зі штучним інтелектом: Llama 4 Scout, Maverick та Behemoth – Зображення: Xpert.Digital

Llama 4: Нове покоління відкритих систем штучного інтелекту від Meta

Розкрито Llama 4: ключ Мети до наступної ери штучного інтелекту

5 квітня 2025 року компанія Meta представила останнє покоління своїх моделей штучного інтелекту, Llama 4. Ці нові моделі є значним кроком у розвитку відкритих систем штучного інтелекту та мають низку новаторських можливостей, які суттєво підвищують їхню продуктивність та ефективність. Серія Llama 4 складається з кількох моделей, дві з яких вже є загальнодоступними, тоді як найпотужніша модель все ще перебуває на стадії навчання.

Пов'язано з цим:

Моделі ШІ, пояснені просто: Зрозумійте основи ШІ, мовних моделей та міркувань

Сімейство моделей Llama 4

Meta розробила три різні моделі серії Llama 4, кожна з яких оптимізована для різних випадків використання:

Лама 4 Скаут

Llama 4 Scout – це компактна модель із вражаючими технічними характеристиками:

17 мільярдів активних параметрів з 16 експертами (загалом 109 мільярдів параметрів)
Може працювати на одному графічному процесорі NVIDIA H100 з квантуванням Int4
Він має надзвичайно велике контекстне вікно в 10 мільйонів токенів, що робить його однією з перших відкритих моделей з такою ємністю

Згідно з Meta, Scout перевершує інші моделі у своєму класі, такі як Gemini 3, Gemini 2.0 Flash-Lite та Mistral 3.1. Він особливо добре підходить для таких завдань, як узагальнення довгих документів, персоналізація контенту на основі даних користувачів та формування складних висновків з великих обсягів знань.

Лама 4 Маверік

Llama 4 Maverick є потужнішою з двох доступних моделей:

17 мільярдів активних параметрів зі 128 експертами (загалом 400 мільярдів параметрів)
Експериментальна версія чату досягла ELO 1417 на LMArena
Згідно з Meta, він перевершує такі моделі, як GPT-4o та Gemini 2.0 Flash, у численних бенчмарках

Ця модель особливо підходить для загальної допомоги та чат-додатків, таких як творче письмо, і показує результати, порівнянні з DeepSeek v3, у завданнях міркування та кодування, але з вдвічі меншими параметрами.

Лама 4 Бегемот

Llama 4 Behemoth — найпотужніша модель від Meta, але вона ще не доступна для широкого загалу:

288 мільярдів активних параметрів з 16 експертами (майже 2 трильйони параметрів загалом)
Згідно з Meta, він перевершує GPT-4.5, Claude Sonnet 3.7 та Gemini 2.0 Pro в кількох STEM-тестах
Служить «моделлю для вчителя» для менших моделей Llama 4

Бегемот зараз все ще перебуває на стадії тренувань і буде випущений пізніше.

Технічні інновації

Модельний ряд Llama 4 представлений кількома значними технічними інноваціями, які покращують його продуктивність та ефективність:

Архітектура змішаних експертів (Міністерство освіти)

Одним із найважливіших нововведень у Llama 4 є архітектура Mixture of Experts (MoE), в якій для кожного токена активується лише підмножина параметрів моделі:

Це значно зменшує обчислювальні зусилля та затримку, зберігаючи при цьому високу продуктивність
У Llama 4 Maverick кожен токен обробляється спільним експертом та одним зі 128 маршрутизованих експертів
Така архітектура дозволяє збільшити загальні параметри моделі без збільшення витрат на логічний висновок

Рідна мультимодальність з раннім злиттям

Llama 4 — це перша відкрита модель з власною мультимодальністю завдяки Early Fusion:

Текстові та графічні токени інтегровані в єдину архітектуру моделі
Це дозволяє проводити спільне попереднє навчання з великими обсягами текстових, графічних та відеоданих
На відміну від Llama 3.2, яка використовувала окремі параметри для тексту та зображень, Llama 4 розуміє обидві модальності з однаковими параметрами

Надзвичайно довге контекстне вікно

Надзвичайно довге контекстне вікно Llama 4 Scout особливо вражає:

З 10 мільйонами токенів він значно перевершує більшість доступних моделей
Це дозволяє обробляти дуже довгі документи, цілі кодові бази або розгорнуті діалоги
Архітектура iRoPE (черезшарові шари уваги) робить це можливим

Нові методи навчання

Meta використала кілька інноваційних методів для дресирування Лами 4:

MetaP: Методика для надійного налаштування критичних гіперпараметрів моделі
Точність FP8: Використання 8-бітних чисел з плаваючою комою для ефективного навчання
Спільна дистиляція: Використання Llama 4 Behemoth як навчальної моделі для менших моделей
Повністю асинхронне онлайн-навчання з посиленням: нова інфраструктура для масштабного навчання

Доступність та інтеграція

Моделі Llama 4 доступні на різних платформах та сервісах:

Постачальники послуг завантаження та хмарних послуг

Моделі Scout та Maverick можна завантажити безпосередньо з Meta або через Hugging Face
Вони також доступні через різні хмарні платформи:
- Штучний інтелект працівників Cloudflare
- Azure AI Foundry та Azure Databricks
- Штучний інтелект Vertex від Google Cloud
- Більше партнерів підтримають нас найближчими днями

Інтеграція в метапродукти

Meta вже оновила своїх помічників зі штучним інтелектом до Llama 4 на різних платформах:

WhatsApp, Messenger та Instagram Direct у 40 різних країнах
Вебсайт Meta.AI
Однак мультимодальні функції наразі доступні лише англомовним користувачам у США

Пов'язано з цим:

Мета-ШІ вже в Німеччині! WhatsApp, Instagram та Facebook отримують ШІ – з важливими відмінностями від версії для США

Ліцензування та суперечки

Хоча Meta Llama 4 описується як «програма з відкритим вихідним кодом», у ліцензії є деякі обмеження, які викликали суперечки:

Ліцензійні обмеження

Ліцензія спільноти Llama 4 містить кілька обмежень:

Компанії з понад 700 мільйонами активних користувачів щомісяця потребують спеціальної ліцензії від Meta
Користувачам та компаніям з ЄС, очевидно, заборонено використовувати або розповсюджувати ці моделі, ймовірно, через нормативні вимоги
Існують вимоги щодо найменування та атрибуції похідних моделей

Дебати про «відкритий вихідний код»

Точаться дебати щодо того, чи варто називати Llama 4 «програмою з відкритим вихідним кодом»:

Ініціатива з відкритого коду у 2023 році визначила, що обмеження ліцензії Llama виводять її «з категорії «відкритого коду»»
Критики стверджують, що це радше модель «відкритого вихідного коду» або «відкритих ваг», ніж справжнє програмне забезпечення з відкритим вихідним кодом
Ліцензійні обмеження можуть бути проблематичними для малого бізнесу без власних юридичних відділів

Плани на майбутнє

Мета вже поділився деякими планами на майбутнє щодо Llama 4 та подальших проектів:

LlamaCon та інші оголошення

Meta проведе свою першу конференцію LlamaCon 29 квітня 2025 року, де буде оголошено додаткові подробиці про моделі штучного інтелекту та плани щодо продуктів
Компанія також планує випустити спеціальний застосунок для свого мета-чат-бота у другому кварталі

Розширення мовних навичок

Мета працює над покращенням мовних навичок Лами 4, щоб зробити розмови більш природними
Мета полягає в тому, щоб забезпечити більш плавні двосторонні діалоги, де користувачі можуть переривати модель штучного інтелекту
Кріс Кокс, головний директор з продуктів Meta, описав майбутню Llama 4 як «омні-модель», яка дозволяє використовувати рідну мову замість перекладу мовлення в текст

Штучний інтелект агента та розширені можливості

Марк Цукерберг оголосив, що Llama 4 матиме «агентські можливості», які дозволять реалізувати нові варіанти використання
Meta прагне розробити моделі штучного інтелекту, які можуть «виконувати узагальнені дії, природним чином спілкуватися з людьми та вирішувати складні проблеми»
Компанія розглядає можливість запропонувати преміум-підписки для свого помічника зі штучним інтелектом для потреб, пов'язаних з агентами, таких як бронювання або відеовиробництво

Чому Llama 4 є поворотним моментом у світі штучного інтелекту

Випуск Llama 4 є важливим кроком у стратегії Meta, спрямованій на лідерство у висококонкурентній галузі генеративного штучного інтелекту. Завдяки впровадженню архітектури Mixture of Experts, нативної мультимодальності та вражаюче довгого контекстного вікна, Meta демонструє, що відкриті моделі можуть конкурувати з власними моделями великих технологічних компаній.

Незважаючи на суперечки щодо ліцензування та питання про те, чи дійсно Llama 4 слід називати «відкритим кодом», технічні досягнення є важливою віхою. Здатність моделей обробляти як текст, так і зображення відкриває нові можливості для розробників та бізнесу.

З огляду на те, що Llama 4 Behemoth все ще очікує розробки, а також оголошені плани щодо покращення можливостей мови та агентів, очевидно, що Meta ще більше активізує свої інвестиції в штучний інтелект. Найближчі місяці покажуть, як ці нові моделі трансформують ландшафт штучного інтелекту та чи справді вони, як передбачав Марк Цукерберг, допоможуть відкритим моделям ШІ стати провідною силою в галузі штучного інтелекту.

Пов'язано з цим:

Ваш глобальний партнер з маркетингу та розвитку бізнесу

☑️ Наша ділова мова – англійська або німецька

☑️ НОВИНКА: Листування вашою рідною мовою!

Konrad Wolfenstein

Я та моя команда раді бути вашим особистим консультантом.

Ви можете зв'язатися зі мною, заповнивши контактну форму тут wolfenstein@xpert.digital:, або просто зателефонувавши мені за номером +49 7348 4088 965. Моя адреса електронної пошти

Я з нетерпінням чекаю нашого спільного проєкту.

Meta випускає нові серії моделей зі штучним інтелектом: Llama 4 Scout, Maverick та Behemoth

Llama 4: Нове покоління відкритих систем штучного інтелекту від Meta