Meta wypuszcza nową serię modeli AI: Llama 4 Scout, Maverick i Behemoth

Konrad Wolfenstein

1 rok temu

Meta wprowadza na rynek nową serię modeli AI: Llama 4 Scout, Maverick i Behemoth – Zdjęcie: Xpert.Digital

Llama 4: Nowa generacja otwartych systemów AI od Meta

Ujawniono Llamę 4: klucz Meta do kolejnej ery sztucznej inteligencji

5 kwietnia 2025 roku firma Meta zaprezentowała najnowszą generację swoich modeli AI – Llama 4. Te nowe modele stanowią znaczący postęp w rozwoju otwartych systemów AI i oferują szereg przełomowych funkcji, które znacząco zwiększają ich wydajność i efektywność. Seria Llama 4 obejmuje kilka modeli, z których dwa są już dostępne publicznie, a najpotężniejszy jest wciąż w fazie szkolenia.

W związku z tym:

Proste wyjaśnienie modeli sztucznej inteligencji: poznaj podstawy sztucznej inteligencji, modele językowe i rozumowanie

Rodzina modeli Llama 4

Firma Meta opracowała trzy różne modele w serii Llama 4, każdy zoptymalizowany pod kątem innego przypadku użycia:

Llama 4 Scout

Llama 4 Scout to kompaktowy model o imponujących parametrach technicznych:

17 miliardów aktywnych parametrów z 16 ekspertami (łącznie 109 miliardów parametrów)
Można go obsługiwać na pojedynczym procesorze graficznym NVIDIA H100 z kwantyzacją Int4
Cechuje się wyjątkowo dużym oknem kontekstowym obejmującym 10 milionów tokenów, co czyni go jednym z pierwszych otwartych modeli o takiej pojemności

Według Meta, Scout przewyższa inne modele w swojej klasie, takie jak Gemini 3, Gemini 2.0 Flash-Lite i Mistral 3.1. Szczególnie dobrze sprawdza się w takich zadaniach, jak streszczanie długich dokumentów, personalizowanie treści na podstawie danych użytkownika oraz wyciąganie złożonych wniosków z dużej ilości wiedzy.

Lama 4 Maverick

Llama 4 Maverick jest mocniejszym z dwóch dostępnych modeli:

17 miliardów aktywnych parametrów z 128 ekspertami (łącznie 400 miliardów parametrów)
Eksperymentalna wersja czatu osiągnęła ELO 1417 na LMArena
Według Meta, w licznych testach porównawczych przewyższa modele takie jak GPT-4o i Gemini 2.0 Flash

Model ten jest szczególnie przydatny w ogólnych zastosowaniach związanych z pomocą techniczną i czatami, takich jak twórcze pisanie, a w zadaniach wymagających rozumowania i kodowania zapewnia wyniki porównywalne z DeepSeek v3, jednak przy połowie parametrów.

Lama 4 Behemoth

Llama 4 Behemoth to najpotężniejszy model Meta, ale nie jest jeszcze publicznie dostępny:

288 miliardów aktywnych parametrów z 16 ekspertami (łącznie prawie 2 biliony parametrów)
Według Meta, w kilku testach STEM przewyższa GPT-4.5, Claude Sonnet 3.7 i Gemini 2.0 Pro
Służy jako „model nauczyciela” dla mniejszych modeli Llama 4

Behemoth jest obecnie nadal w fazie treningowej i zostanie wydany w późniejszym terminie.

Innowacje techniczne

W serii modeli Llama 4 wprowadzono kilka istotnych innowacji technicznych, które poprawiają jej wydajność i efektywność:

Architektura Mieszanki Ekspertów (MoE)

Jedną z najważniejszych innowacji w Llama 4 jest architektura Mixture of Experts (MoE), w której dla każdego tokena aktywowany jest tylko podzbiór parametrów modelu:

Znacznie zmniejsza to nakłady obliczeniowe i opóźnienia, a jednocześnie pozwala zachować wysoką wydajność
W Llama 4 Maverick każdy token jest przetwarzany przez współdzielonego eksperta i jednego ze 128 kierowanych ekspertów
Taka architektura umożliwia zwiększenie ogólnych parametrów modelu bez zwiększania kosztów wnioskowania

Natywna multimodalność z wczesną fuzją

Llama 4 to pierwszy otwarty model z natywną multimodalnością dzięki Early Fusion:

Tokeny tekstowe i graficzne są zintegrowane w ujednoliconą architekturę modelu
Dzięki temu możliwe jest wspólne wstępne trenowanie z wykorzystaniem dużej ilości danych tekstowych, graficznych i wideo
W przeciwieństwie do Llamy 3.2, która używała oddzielnych parametrów dla tekstu i obrazów, Llama 4 rozpoznaje obie modalności natywnie, korzystając z tych samych parametrów

Bardzo długie okno kontekstowe

Szczególnie imponujący jest niezwykle długi kontekst gry Llama 4 Scout:

Dysponując 10 milionami tokenów, znacznie przewyższa większość dostępnych modeli
Dzięki temu możliwe jest przetwarzanie bardzo długich dokumentów, całych baz kodów lub rozbudowanych konwersacji
Umożliwia to architektura iRoPE (przeplatane warstwy uwagi)

Nowe metody szkoleniowe

Meta zastosowała kilka innowacyjnych metod szkolenia Lamy 4:

MetaP: Technika solidnego dostrajania krytycznych hiperparametrów modelu
Precyzja FP8: Wykorzystanie 8-bitowych liczb zmiennoprzecinkowych do efektywnego szkolenia
Współdestylacja: Wykorzystanie Llama 4 Behemoth jako modelu edukacyjnego dla mniejszych modeli
W pełni asynchroniczne uczenie się online z amplifikacją: Nowa infrastruktura do nauki na dużą skalę

Dostępność i integracja

Modele Llama 4 są dostępne za pośrednictwem różnych platform i usług:

Dostawcy pobierania i chmury

Modele Scout i Maverick można pobrać bezpośrednio z serwisu Meta lub za pośrednictwem Hugging Face
Są one również dostępne za pośrednictwem różnych platform chmurowych:
- Cloudflare Workers AI
- Azure AI Foundry i Azure Databricks
- Vertex AI firmy Google Cloud
- W najbliższych dniach dołączą do nas kolejni partnerzy

Integracja z metaproduktami

Meta zaktualizowała już swoich asystentów AI do Llama 4 na różnych platformach:

WhatsApp, Messenger i Instagram Direct w 40 różnych krajach
Strona internetowa Meta.AI
Jednakże funkcje multimodalne są obecnie dostępne jedynie dla użytkowników anglojęzycznych w USA

W związku z tym:

Meta AI jest już w Niemczech! WhatsApp, Instagram i Facebook korzystają ze sztucznej inteligencji – z istotnymi różnicami w stosunku do wersji amerykańskiej

Licencjonowanie i kontrowersje

Chociaż Meta Llama 4 jest określana jako oprogramowanie „open source”, licencja zawiera pewne ograniczenia, które wywołały kontrowersje:

Ograniczenia licencyjne

Licencja społecznościowa Llama 4 zawiera kilka ograniczeń:

Firmy mające ponad 700 milionów aktywnych użytkowników miesięcznie potrzebują specjalnej licencji od Meta
Użytkownicy i firmy z UE nie mają prawa używać ani rozpowszechniać tych modeli, prawdopodobnie ze względu na wymogi regulacyjne
Istnieją wymagania dotyczące nazewnictwa i atrybucji modeli pochodnych

Debata na temat „Open Source”

Trwa debata na temat tego, czy Llama 4 powinna być nazywana „Open Source”:

Inicjatywa Open Source ustaliła w 2023 r., że ograniczenia zawarte w licencji Llama powodują, że oprogramowanie to „nie należy do kategorii Open Source”
Krytycy twierdzą, że jest to raczej model „o otwartym kodzie źródłowym” lub „o otwartym kodzie wagowym” niż prawdziwe oprogramowanie typu open source
Ograniczenia licencyjne mogą być problematyczne dla małych firm nieposiadających własnych działów prawnych

Plany na przyszłość

Meta podzielił się już pewnymi informacjami na temat swoich przyszłych planów dotyczących Lamy 4 i kolejnych części:

LlamaCon i inne ogłoszenia

Meta zorganizuje swoją pierwszą konferencję LlamaCon 29 kwietnia 2025 r., na której zostaną ogłoszone dalsze szczegóły dotyczące jej modeli sztucznej inteligencji i planów produktowych
Firma planuje również wypuścić w drugim kwartale specjalną aplikację dla swojego meta-chatbota

Rozwijanie umiejętności językowych

Meta pracuje nad udoskonaleniem umiejętności językowych Llamy 4, aby umożliwić prowadzenie bardziej naturalnych rozmów
Celem jest umożliwienie płynniejszych, dwustronnych dialogów, w których użytkownicy mogą przerywać pracę modelu sztucznej inteligencji
Chris Cox, dyrektor ds. produktów w firmie Meta, opisał nadchodzącą Llamę 4 jako „model wszechobecny”, który umożliwia obsługę języka ojczystego zamiast tłumaczenia mowy na tekst

Agentowa sztuczna inteligencja i ulepszone możliwości

Mark Zuckerberg ogłosił, że Llama 4 będzie miała „możliwości agentowe”, które umożliwią nowe przypadki użycia
Celem Meta jest opracowanie modeli sztucznej inteligencji, które będą mogły „wykonywać uogólnione czynności, komunikować się naturalnie z ludźmi i rozwiązywać trudne problemy”
Firma rozważa wprowadzenie subskrypcji premium dla swojego asystenta AI do celów związanych z obsługą agentów, takich jak rezerwacje czy produkcja wideo

Dlaczego Llama 4 to punkt zwrotny w krajobrazie sztucznej inteligencji

Premiera Llama 4 stanowi ważny krok w strategii Meta, której celem jest osiągnięcie pozycji lidera w wysoce konkurencyjnej dziedzinie generatywnej sztucznej inteligencji. Dzięki wprowadzeniu architektury Mixture of Experts, natywnej multimodalności i imponująco długiego okna kontekstowego, Meta udowadnia, że otwarte modele mogą konkurować z zastrzeżonymi modelami czołowych firm technologicznych.

Pomimo kontrowersji związanych z licencjonowaniem i wątpliwości, czy Llama 4 rzeczywiście powinna być nazywana „oprogramowaniem open source”, postęp techniczny stanowi istotny kamień milowy. Możliwość przetwarzania tekstu i obrazów przez te modele otwiera nowe możliwości dla deweloperów i firm.

Biorąc pod uwagę wciąż oczekiwany projekt Llama 4 Behemoth oraz ogłoszone plany ulepszonego języka i możliwości agentów, jasne jest, że Meta będzie dalej intensyfikować inwestycje w sztuczną inteligencję. Nadchodzące miesiące pokażą, jak te nowe modele zmienią krajobraz sztucznej inteligencji i czy rzeczywiście, zgodnie z przewidywaniami Marka Zuckerberga, pomogą otwartym modelom AI stać się wiodącą siłą w dziedzinie sztucznej inteligencji.

W związku z tym:

Twój globalny partner w zakresie marketingu i rozwoju biznesu

☑️ Naszym językiem biznesowym jest angielski lub niemiecki

☑️ NOWOŚĆ: Korespondencja w Twoim ojczystym języku!

Konrad Wolfenstein

Ja i mój zespół chętnie będziemy do Państwa dyspozycji jako osobisty doradca.

Możesz się ze mną skontaktować, wypełniając formularz kontaktowy tutaj wolfenstein@xpert.digital:lub po prostu dzwoniąc pod numer +49 7348 4088 965. Mój adres e-mail to

Nie mogę się doczekać naszego wspólnego projektu.

Meta wypuszcza nową serię modeli AI: Llama 4 Scout, Maverick i Behemoth

Llama 4: Nowa generacja otwartych systemów AI od Meta