⭐️ Изкуствен интелект (ИИ) - Блог за ИИ, гореща точка и център за съдържание ⭐️ Дигитален интелект ⭐️ XPaper

Available in 27 languages 📢

Meta пуска нови серии модели с изкуствен интелект Llama 4 Scout, Maverick и Behemoth

Публикувано на: 6 април 2025 г. / Актуализирано на: 6 април 2025 г. – Автор: Konrad Wolfenstein

Meta пуска нови серии модели с изкуствен интелект Llama 4 Scout, Maverick и Behemoth – Изображение: Xpert.Digital

Лама 4: Новото поколение отворени AI системи от Meta

Разкрита е Llama 4: Ключът на Meta към следващата ера на изкуствения интелект

На 5 април 2025 г. Meta представи най-новото поколение на своите AI модели, Llama 4. Тези нови модели представляват значителен напредък в разработването на отворени AI системи и разполагат с редица новаторски възможности, които значително подобряват тяхната производителност и ефективност. Серията Llama 4 се състои от няколко модела, два от които вече са публично достъпни, докато най-мощният модел все още е във фаза на обучение.

Свързано с това:

Моделите на изкуствен интелект, обяснени просто: Разберете основите на изкуствения интелект, езиковите модели и разсъжденията

Моделното семейство Llama 4

Meta е разработила три различни модела от серията Llama 4, всеки от които е оптимизиран за различни случаи на употреба:

Лама 4 Скаут

Llama 4 Scout е компактен модел с впечатляващи технически характеристики:

17 милиарда активни параметъра с 16 експерта (общо 109 милиарда параметъра)
Може да работи с един графичен процесор NVIDIA H100 с квантуване Int4
Той разполага със забележително голям контекстен прозорец от 10 милиона токена, което го прави един от първите отворени модели с този капацитет

Според Meta, Scout превъзхожда други модели в своя клас, като Gemini 3, Gemini 2.0 Flash-Lite и Mistral 3.1. Той е особено подходящ за задачи като обобщаване на дълги документи, персонализиране на съдържание въз основа на потребителски данни и извличане на сложни заключения от големи количества знания.

Лама 4 Маверик

Llama 4 Maverick е по-мощният от двата налични модела:

17 милиарда активни параметъра със 128 експерти (общо 400 милиарда параметъра)
Експерименталната чат версия достигна ELO 1417 на LMArena
Според Meta, той превъзхожда модели като GPT-4o и Gemini 2.0 Flash в множество бенчмаркове

Този модел е особено подходящ за приложения за обща помощ и чат, като например творческо писане, и показва резултати, сравними с DeepSeek v3 при задачи за разсъждение и кодиране, но с наполовина по-ниски параметри.

Лама 4 Бегемот

Llama 4 Behemoth е най-мощният модел на Meta, но все още не е публично достъпен:

288 милиарда активни параметъра с 16 експерти (общо почти 2 трилиона параметъра)
Според Meta, той превъзхожда GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro в няколко STEM теста
Служи като „модел за учител“ за по-малките модели Llama 4

Бегемот все още е във фаза на обучение и ще бъде освободен на по-късна дата.

Технически иновации

Моделната гама Llama 4 въвежда няколко значителни технически иновации, които подобряват нейната производителност и ефективност:

Архитектура на смес от експерти (Министерство на образованието)

Едно от най-важните нововъведения в Llama 4 е архитектурата на Mixture of Experts (MoE), в която за всеки токен се активира само подмножество от параметрите на модела:

Това значително намалява изчислителните усилия и латентността, като същевременно поддържа висока производителност
В Llama 4 Maverick всеки токен се обработва от споделен експерт и един от 128-те маршрутизирани експерти
Тази архитектура позволява увеличаване на общите параметри на модела, без да се увеличават разходите за извод

Нативна мултимодалност с ранно сливане

Llama 4 е първият отворен модел с вградена мултимодалност чрез Early Fusion:

Текстовите и графичните токени са интегрирани в унифицирана архитектура на модела
Това позволява съвместно предварително обучение с големи количества текстови, графични и видео данни
За разлика от Llama 3.2, която използваше отделни параметри за текст и изображения, Llama 4 разбира и двата режима с едни и същи параметри

Изключително дълъг контекстен прозорец

Изключително дългият контекстен прозорец на Llama 4 Scout е особено впечатляващ:

С 10 милиона токена, той значително превъзхожда повечето налични модели
Това позволява обработката на много дълги документи, цели кодови бази или обширни разговори
Архитектурата iRoPE (interleaved attention layers - преплетени слоеве за внимание) прави това възможно

Нови методи на обучение

Мета е използвала няколко иновативни метода за обучение на Лама 4:

MetaP: Техника за стабилно настройване на критични хиперпараметри на модела
FP8 прецизност: Използване на 8-битови числа с плаваща запетая за ефективно обучение
Ко-дестилация: Използване на Llama 4 Behemoth като модел за учители за по-малки модели
Напълно асинхронно онлайн обучение с усилване: Нова инфраструктура за мащабно обучение

Наличност и интеграция

Моделите Llama 4 са достъпни чрез различни платформи и услуги:

Доставчици на услуги за изтегляне и облачни услуги

Моделите Scout и Maverick могат да бъдат изтеглени директно от Meta или чрез Hugging Face
Те са достъпни и чрез различни облачни платформи:
- Cloudflare Workers AI
- Azure AI Foundry и Azure Databricks
- Vertex AI на Google Cloud
- Още партньори ще последват през следващите дни

Интеграция в мета-продукти

Meta вече е актуализирала своите AI асистенти до Llama 4 на различни платформи:

WhatsApp, Messenger и Instagram Direct в 40 различни държави
Уебсайтът на Meta.AI
Въпреки това, мултимодалните функции в момента са достъпни само за англоговорящи потребители в САЩ

Свързано с това:

Мета ИИ е тук, в Германия! WhatsApp, Instagram и Facebook получават ИИ – с важни разлики спрямо американската версия

Лицензиране и спорове

Въпреки че Meta Llama 4 е описана като „с отворен код“, има някои ограничения в лиценза, които предизвикаха противоречия:

Лицензионни ограничения

Лицензът за общността на Llama 4 съдържа няколко ограничения:

Компаниите с над 700 милиона активни потребители месечно изискват специален лиценз от Meta
Потребителите и компаниите от ЕС очевидно нямат право да използват или разпространяват моделите, вероятно поради регулаторни изисквания
Съществуват изисквания относно именуването и приписването на производни модели

Дебат за „отворения код“

Има дебат дали Llama 4 всъщност трябва да се нарича „с отворен код“:

През 2023 г. Инициативата за отворен код определи, че ограниченията в лиценза Llama го изваждат „извън категорията „отворен код““
Критиците твърдят, че това е по-скоро модел с „отворен код“ или „отворени тегла“, отколкото истински софтуер с отворен код
Ограниченията за лицензиране биха могли да бъдат проблематични за малките предприятия без собствени правни отдели

Бъдещи планове

Мета вече е дал някои насоки за бъдещите си планове за Llama 4 и след това:

LlamaCon и други съобщения

Meta ще бъде домакин на първата си конференция LlamaCon на 29 април 2025 г., където ще бъдат обявени допълнителни подробности за нейните AI модели и продуктови планове
Компанията планира също така да пусне специално приложение за своя мета чатбот през второто тримесечие

Разширяване на езиковите умения

Мета работи за подобряване на езиковите умения на Лама 4, за да може да води по-естествени разговори
Целта е да се осигури по-плавен, двупосочен диалог, при който потребителите могат да прекъсват AI модела
Крис Кокс, главен продуктов директор на Meta, описа предстоящия Llama 4 като „омни-модел“, който позволява превод на реч в текст, вместо да се използва роден език

Агентски изкуствен интелект и подобрени възможности

Марк Зукърбърг обяви, че Llama 4 ще има „агентски възможности“, които ще позволят нови случаи на употреба
Meta има за цел да разработи модели на изкуствен интелект, които могат да „изпълняват обобщени действия, да комуникират естествено с хората и да решават трудни проблеми“
Компанията обмисля предлагането на премиум абонаменти за своя AI асистент за цели, свързани с агенти, като например резервации или видео продукция

Защо Llama 4 е повратна точка в света на изкуствения интелект

Пускането на Llama 4 представлява значителна стъпка в стратегията на Meta да се превърне в лидер в силно конкурентната област на генеративния изкуствен интелект. С въвеждането на архитектурата Mixture of Experts, вградената мултимодалност и впечатляващо дългия контекстен прозорец, Meta демонстрира, че отворените модели могат да се конкурират със собствените модели на големите технологични компании.

Въпреки противоречията около лицензирането и въпроса дали Llama 4 наистина трябва да се нарича „с отворен код“, техническите подобрения представляват важен етап. Способността на моделите да обработват както текст, така и изображения отваря нови възможности за разработчиците и бизнеса.

С все още предстоящия Llama 4 Behemoth и обявените планове за подобрени езикови и агентни възможности, е ясно, че Meta ще засили допълнително инвестициите си в изкуствен интелект. Следващите месеци ще покажат как тези нови модели ще трансформират пейзажа на изкуствения интелект и дали наистина, както прогнозира Марк Зукърбърг, ще помогнат на отворените модели на изкуствен интелект да се превърнат във водеща сила в областта на изкуствения интелект.

Свързано с това:

Вашият глобален партньор по маркетинг и бизнес развитие

☑️ Нашият бизнес език е английски или немски

☑️ НОВО: Кореспонденция на родния ви език!

Konrad Wolfenstein

Аз и моят екип с удоволствие ще бъдем на ваше разположение като ваш личен съветник.

Можете да се свържете с мен, като попълните формата за контакт тук или просто ми се обадите на +49 89 89 674 804 ( Мюнхен) . Моят имейл адрес е: [email protected]

Очаквам с нетърпение нашия съвместен проект.