⭐️ Sztuczna inteligencja (AI )   -

Wybór głosu 📢


Meta publikuje New Lamy Scout, Maverick i Behemoth

Opublikowano: 6 kwietnia 2025 / Aktualizacja od: 6 kwietnia 2025 r. - Autor: Konrad Wolfenstein

Meta publikuje New Lamy Scout, Maverick i Behemoth

Meta publikuje New Lama 4 Scout, Maverick i Behemoth-Imagage: xpert.digital

LAMA 4: Nowa generacja otwartych systemów AI z Meta

Lama 4 ujawniono: Metas Key do następnego wieku AI

Meta zaprezentował najnowszą generację swoich modeli AI, LAMA 4, 5 kwietnia 2025 r. Te nowe modele reprezentują znaczny postęp w rozwoju otwartych systemów AI i mają szereg przełomowych funkcji, które znacznie zwiększają ich wydajność i wydajność. Seria Lamy 4 składa się z różnych modeli, z dwoma z nich już dostępnymi publicznie, podczas gdy najpotężniejszy model jest nadal w fazie szkoleniowej.

Nadaje się do:

Modelowa rodzina Lamy 4

Meta opracował trzy różne modele w serii LLAMA 4, z których każdy jest zoptymalizowany do różnych zastosowań:

LAMA 4 Scout

LLAMA 4 Scout to kompaktowy model o imponujących specyfikacjach technicznych:

  • 17 miliardów aktywnych parametrów z 16 ekspertami (łącznie 109 miliardów parametrów)
  • Może być obsługiwane na pojedynczym GPU NVIDIA H100 z kwantyzacją INT4
  • Ma niezwykle duże okno kontekstowe o wartości 10 milionów tokenów, co czyni go jednym z pierwszych otwartych modeli z tą pojemnością

Według Meta, Scout przekracza inne modele w swojej klasie, takie jak Gemini 3, Gemini 2.0 Flash-Lite i Mistral 3.1. Jest to szczególnie odpowiednie do zadań takich jak podsumowanie długich dokumentów, personalizacja oparta na danych użytkownika i złożone wnioski na temat dużych ilości wiedzy.

LAMA 4 Maverick

LLAMA 4 Maverick jest potężniejszym z dwóch dostępnych modeli:

  • 17 miliardów aktywnych parametrów z 128 ekspertami (łącznie 400 miliardów parametrów)
  • Eksperymentalna wersja czatu osiągnęła Elo 1417 na Lmarena
  • Przekracza modele takie jak GPT-4O i Gemini 2.0 Flash w wielu testach porównawczych

Ten model jest szczególnie odpowiedni do ogólnej pomocy i aplikacji czatu, takich jak kreatywne pisanie i pokazuje wyniki porównywalne z Deepseek V3 w zadaniach rozumowania i kodowania, ale z połową parametrów.

LAMA 4 Behemot

Lamy 4 Behemot jest najpotężniejszym modelem Metas, który nie jest jeszcze publicznie dostępny:

  • 288 miliardów aktywnych parametrów z 16 ekspertami (łącznie prawie 2 biliony parametrów)
  • Według Meta, przekracza GPT-4.5, Claude Sonnet 3.7 i Gemini 2.0 Pro dla kilku testów porównawczych STEM
  • Służy jako „model nauczyciela” dla mniejszych modeli LLAMA 4

Behemoth jest obecnie w fazie szkoleniowej i zostanie opublikowany w późniejszym terminie.

Innowacje techniczne

Seria Model LAMA 4 wprowadza kilka ważnych innowacji technicznych, które poprawiają ich wydajność i wydajność:

Mieszanka architektury ekspertów (MOE)

Jedną z najważniejszych innowacji w LAMA 4 jest mieszanka architektury ekspertów (MOE), w której tylko część parametrów modelu jest aktywowana dla każdego tokena:

  • To znacznie zmniejsza wysiłek i opóźnienie obliczeń, podczas gdy wysoka wydajność jest zachowana
  • W Llama 4 Maverick każdy token jest przetwarzany przez wspólnego eksperta i jednego z 128 dżemonych ekspertów
  • Ta architektura umożliwia zwiększenie całkowitego parametru modelu bez zwiększania kosztów wnioskowania

Natywna multimodalność z wczesną fuzją

LAMA 4 to pierwszy otwarty model z natywną multimodalność przez wczesną fuzję:

  • Tokeny tekstowe i obrazowe są zintegrowane z jednolitą architekturą modelu
  • Umożliwia to wspólne wstępne szkolenie z dużymi ilościami danych tekstowych, obrazów i wideo
  • W przeciwieństwie do LLAMA 3.2, który używał oddzielnych parametrów tekstu i obrazów, LAMA 4 rozumie obie modalności natywne z tymi samymi parametrami

Niezwykle długie okno kontekstowe

Niezwykle długie kontekstowe okno Llama 4 Scout jest szczególnie imponujące:

  • Z 10 milionami tokenów wyraźnie przekracza większość dostępnych modeli
  • Umożliwia to przetwarzanie bardzo długich dokumentów, całych podstaw kodu lub rozległych rozmów
  • Architektura Irope (przeplatane warstwy uwagi) umożliwia to

Nowe metody szkolenia

Meta zastosowała kilka innowacyjnych metod szkolenia LLamy 4:

  • Metap: technika solidnej koordynacji modelu krytycznego hiperametra
  • FP8 Precyzja: Zastosowanie 8-bitowych liczb wykonanych z slajdów do wydajnego treningu
  • Ko-dystrybacja: Zastosowanie Lamy 4 Beemoth jako model nauczyciela dla mniejszych modeli
  • W pełni asynchroniczna nauka online z wzmocnieniami: nowa infrastruktura do nauki na dużą skalę

Dostępność i integracja

Modele LLAMA 4 są dostępne za pośrednictwem różnych platform i usług:

Pobierz i dostawca chmur

  • Modele Scout i Maverick można pobrać bezpośrednio z Meta lub za pomocą przytulania twarzy
  • Są one również dostępne za pośrednictwem różnych platform chmurowych:
    • Cloudflare Workers AI
    • Azure AI Foundry i Azure Databricks
    • Google Cloud's Vertex AI
    • Inni partnerzy będą następować w najbliższych dniach

Integracja z produktami meta

Meta zaktualizował już swoich asystentów AI na różnych platformach na LAMA 4:

  • WhatsApp, Messenger i Instagram bezpośrednio w 40 różnych krajach
  • Witryna Meta.ai
  • Jednak funkcje multimodalne są obecnie dostępne tylko dla użytkowników języka angielskiego w USA

Nadaje się do:

Licencja i kontrowersje

Chociaż Meta Llama 4 odnosi się do „open source”, istnieją pewne ograniczenia w licencji, które wywołały kontrowersje:

Ograniczenia licencyjne

Licencja społeczności LLAMA 4 zawiera kilka ograniczeń:

  • Firmy z ponad 700 milionami aktywnych użytkowników potrzebują specjalnej licencji od Meta
  • Modele najwyraźniej nie mogą używać ani dystrybuować użytkowników i firm z UE, prawdopodobnie ze względu na wymagania regulacyjne
  • Istnieją wymagania dotyczące nazywania i przypisania dla modeli pochodnych

Debata na temat „open source”

Trwa debata na temat tego, czy LAMA 4 powinna być nazywana „Open Source”:

  • Inicjatywa typu open source w 2023 r., Że ograniczenia w licencji LAMA wyciągają ją „z kategorii„ Open Source ””
  • Krytycy twierdzą, że jest to raczej model „otwartego źródła” lub „z otwartymi wagami” niż prawdziwe oprogramowanie typu open source
  • Ograniczenia licencji mogą być problematyczne dla małych firm bez własnych działów prawnych

Plany na przyszłość

Meta dał już pewne wgląd w swoje przyszłe plany Lamy 4 i później:

Llamacon i inne ogłoszenia

  • Meta zorganizuje pierwszą konferencję Llamacon w dniu 29 kwietnia 2025 r., W której zostaną ogłoszone dodatkowe szczegóły dotyczące modeli AI i planów produktów
  • Firma planuje również opublikować dedykowaną aplikację do meta-czatowego bota w drugim kwartale

Rozszerzenie umiejętności językowych

  • Meta pracuje nad poprawą umiejętności językowych Llama 4, aby umożliwić więcej naturalnych rozmów
  • Celem jest włączenie większej liczby płynnych, dwustronnych dialogów, w których użytkownicy mogą przerwać model AI
  • Chris Cox, dyrektor ds. Produktu Meta, opisał nadchodzącą LAMA 4 jako „model omni”, który umożliwia język ojczysty zamiast tłumaczyć język na tekst

Agentical AI i rozszerzone umiejętności

  • Mark Zuckerberg ogłosił, że LLAMA 4 będzie miał „umiejętności agenta”, które powinny włączyć nowe aplikacje
  • Meta ma na celu opracowanie modeli AI, które „przeprowadzają uogólnione działania, oczywiście komunikują się z ludźmi i rozwiązują trudne problemy”
  • Firma rozważa oferowanie subskrypcji premium dla asystenta AI do celów agentów, takich jak rezerwacje lub produkcja wideo

Dlaczego Lama 4 jest punktem zwrotnym w krajobrazie AI

Publikacja LAMA 4 stanowi znaczący krok w strategii Metas, aby stać się wiodącym obszarem generatywnej sztucznej inteligencji w wysoce konkurencyjnym obszarze. Wraz z wprowadzeniem mieszanki architektury ekspertów, natywnej multimodalności i imponująco długiego okna kontekstowego, Meta pokazuje, że otwarte modele mogą nadążyć za zastrzeżonymi modelami dużych firm technologicznych.

Pomimo kontrowersji dotyczących licencjonowania i pytania, czy LLAMA 4 należy naprawdę nazywać „open source”, postęp techniczny jest ważnym kamieniem milowym. Zdolność modeli do przetwarzania zarówno tekstu, jak i obrazów otwiera nowe możliwości dla programistów i firm.

Dzięki wybitnemu behemotowi LLAMA 4 i ogłoszonymi planami rozszerzonego języka i umiejętności agenta, jasne jest, że Meta dodatkowo nasili swoje inwestycje w sztuczną inteligencję. Nadchodzące miesiące pokażą, w jaki sposób te nowe modele zmieniają krajobraz AI i czy, jak przewiduje Mark Zuckerberg, faktycznie pomogą tworzyć otwarte modele AI w dziedzinie sztucznej inteligencji.

Nadaje się do:

 

Twój globalny partner w zakresie marketingu i rozwoju biznesu

☑️Naszym językiem biznesowym jest angielski lub niemiecki

☑️ NOWOŚĆ: Korespondencja w Twoim języku narodowym!

 

Cyfrowy pionier – Konrad Wolfenstein

Konrada Wolfensteina

Chętnie będę służyć Tobie i mojemu zespołowi jako osobisty doradca.

Możesz się ze mną skontaktować wypełniając formularz kontaktowy lub po prostu dzwoniąc pod numer +49 89 89 674 804 (Monachium) . Mój adres e-mail to: wolfenstein xpert.digital

Nie mogę się doczekać naszego wspólnego projektu.

 

 

☑️ Wsparcie MŚP w zakresie strategii, doradztwa, planowania i wdrażania

☑️ Stworzenie lub dostosowanie strategii cyfrowej i cyfryzacji

☑️Rozbudowa i optymalizacja procesów sprzedaży międzynarodowej

☑️ Globalne i cyfrowe platformy handlowe B2B

☑️ Pionierski rozwój biznesu / marketing / PR / targi


⭐️ Sztuczna inteligencja (AI )   -