Публикувано на: 6 април 2025 г. / Актуализирано на: 6 април 2025 г. – Автор: Konrad Wolfenstein

Meta пуска нови серии модели с изкуствен интелект Llama 4 Scout, Maverick и Behemoth – Изображение: Xpert.Digital
Лама 4: Новото поколение отворени AI системи от Meta
Разкрита е Llama 4: Ключът на Meta към следващата ера на изкуствения интелект
На 5 април 2025 г. Meta представи най-новото поколение на своите AI модели, Llama 4. Тези нови модели представляват значителен напредък в разработването на отворени AI системи и разполагат с редица новаторски възможности, които значително подобряват тяхната производителност и ефективност. Серията Llama 4 се състои от няколко модела, два от които вече са публично достъпни, докато най-мощният модел все още е във фаза на обучение.
Свързано с това:
- Моделите на изкуствен интелект, обяснени просто: Разберете основите на изкуствения интелект, езиковите модели и разсъжденията
Моделното семейство Llama 4
Meta е разработила три различни модела от серията Llama 4, всеки от които е оптимизиран за различни случаи на употреба:
Лама 4 Скаут
Llama 4 Scout е компактен модел с впечатляващи технически характеристики:
- 17 милиарда активни параметъра с 16 експерта (общо 109 милиарда параметъра)
- Може да работи с един графичен процесор NVIDIA H100 с квантуване Int4
- Той разполага със забележително голям контекстен прозорец от 10 милиона токена, което го прави един от първите отворени модели с този капацитет
Според Meta, Scout превъзхожда други модели в своя клас, като Gemini 3, Gemini 2.0 Flash-Lite и Mistral 3.1. Той е особено подходящ за задачи като обобщаване на дълги документи, персонализиране на съдържание въз основа на потребителски данни и извличане на сложни заключения от големи количества знания.
Лама 4 Маверик
Llama 4 Maverick е по-мощният от двата налични модела:
- 17 милиарда активни параметъра със 128 експерти (общо 400 милиарда параметъра)
- Експерименталната чат версия достигна ELO 1417 на LMArena
- Според Meta, той превъзхожда модели като GPT-4o и Gemini 2.0 Flash в множество бенчмаркове
Този модел е особено подходящ за приложения за обща помощ и чат, като например творческо писане, и показва резултати, сравними с DeepSeek v3 при задачи за разсъждение и кодиране, но с наполовина по-ниски параметри.
Лама 4 Бегемот
Llama 4 Behemoth е най-мощният модел на Meta, но все още не е публично достъпен:
- 288 милиарда активни параметъра с 16 експерти (общо почти 2 трилиона параметъра)
- Според Meta, той превъзхожда GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro в няколко STEM теста
- Служи като „модел за учител“ за по-малките модели Llama 4
Бегемот все още е във фаза на обучение и ще бъде освободен на по-късна дата.
Технически иновации
Моделната гама Llama 4 въвежда няколко значителни технически иновации, които подобряват нейната производителност и ефективност:
Архитектура на смес от експерти (Министерство на образованието)
Едно от най-важните нововъведения в Llama 4 е архитектурата на Mixture of Experts (MoE), в която за всеки токен се активира само подмножество от параметрите на модела:
- Това значително намалява изчислителните усилия и латентността, като същевременно поддържа висока производителност
- В Llama 4 Maverick всеки токен се обработва от споделен експерт и един от 128-те маршрутизирани експерти
- Тази архитектура позволява увеличаване на общите параметри на модела, без да се увеличават разходите за извод
Нативна мултимодалност с ранно сливане
Llama 4 е първият отворен модел с вградена мултимодалност чрез Early Fusion:
- Текстовите и графичните токени са интегрирани в унифицирана архитектура на модела
- Това позволява съвместно предварително обучение с големи количества текстови, графични и видео данни
- За разлика от Llama 3.2, която използваше отделни параметри за текст и изображения, Llama 4 разбира и двата режима с едни и същи параметри
Изключително дълъг контекстен прозорец
Изключително дългият контекстен прозорец на Llama 4 Scout е особено впечатляващ:
- С 10 милиона токена, той значително превъзхожда повечето налични модели
- Това позволява обработката на много дълги документи, цели кодови бази или обширни разговори
- Архитектурата iRoPE (interleaved attention layers - преплетени слоеве за внимание) прави това възможно
Нови методи на обучение
Мета е използвала няколко иновативни метода за обучение на Лама 4:
- MetaP: Техника за стабилно настройване на критични хиперпараметри на модела
- FP8 прецизност: Използване на 8-битови числа с плаваща запетая за ефективно обучение
- Ко-дестилация: Използване на Llama 4 Behemoth като модел за учители за по-малки модели
- Напълно асинхронно онлайн обучение с усилване: Нова инфраструктура за мащабно обучение
Наличност и интеграция
Моделите Llama 4 са достъпни чрез различни платформи и услуги:
Доставчици на услуги за изтегляне и облачни услуги
- Моделите Scout и Maverick могат да бъдат изтеглени директно от Meta или чрез Hugging Face
- Те са достъпни и чрез различни облачни платформи:
- Cloudflare Workers AI
- Azure AI Foundry и Azure Databricks
- Vertex AI на Google Cloud
- Още партньори ще последват през следващите дни
Интеграция в мета-продукти
Meta вече е актуализирала своите AI асистенти до Llama 4 на различни платформи:
- WhatsApp, Messenger и Instagram Direct в 40 различни държави
- Уебсайтът на Meta.AI
- Въпреки това, мултимодалните функции в момента са достъпни само за англоговорящи потребители в САЩ
Свързано с това:
- Мета ИИ е тук, в Германия! WhatsApp, Instagram и Facebook получават ИИ – с важни разлики спрямо американската версия
Лицензиране и спорове
Въпреки че Meta Llama 4 е описана като „с отворен код“, има някои ограничения в лиценза, които предизвикаха противоречия:
Лицензионни ограничения
Лицензът за общността на Llama 4 съдържа няколко ограничения:
- Компаниите с над 700 милиона активни потребители месечно изискват специален лиценз от Meta
- Потребителите и компаниите от ЕС очевидно нямат право да използват или разпространяват моделите, вероятно поради регулаторни изисквания
- Съществуват изисквания относно именуването и приписването на производни модели
Дебат за „отворения код“
Има дебат дали Llama 4 всъщност трябва да се нарича „с отворен код“:
- През 2023 г. Инициативата за отворен код определи, че ограниченията в лиценза Llama го изваждат „извън категорията „отворен код““
- Критиците твърдят, че това е по-скоро модел с „отворен код“ или „отворени тегла“, отколкото истински софтуер с отворен код
- Ограниченията за лицензиране биха могли да бъдат проблематични за малките предприятия без собствени правни отдели
Бъдещи планове
Мета вече е дал някои насоки за бъдещите си планове за Llama 4 и след това:
LlamaCon и други съобщения
- Meta ще бъде домакин на първата си конференция LlamaCon на 29 април 2025 г., където ще бъдат обявени допълнителни подробности за нейните AI модели и продуктови планове
- Компанията планира също така да пусне специално приложение за своя мета чатбот през второто тримесечие
Разширяване на езиковите умения
- Мета работи за подобряване на езиковите умения на Лама 4, за да може да води по-естествени разговори
- Целта е да се осигури по-плавен, двупосочен диалог, при който потребителите могат да прекъсват AI модела
- Крис Кокс, главен продуктов директор на Meta, описа предстоящия Llama 4 като „омни-модел“, който позволява превод на реч в текст, вместо да се използва роден език
Агентски изкуствен интелект и подобрени възможности
- Марк Зукърбърг обяви, че Llama 4 ще има „агентски възможности“, които ще позволят нови случаи на употреба
- Meta има за цел да разработи модели на изкуствен интелект, които могат да „изпълняват обобщени действия, да комуникират естествено с хората и да решават трудни проблеми“
- Компанията обмисля предлагането на премиум абонаменти за своя AI асистент за цели, свързани с агенти, като например резервации или видео продукция
Защо Llama 4 е повратна точка в света на изкуствения интелект
Пускането на Llama 4 представлява значителна стъпка в стратегията на Meta да се превърне в лидер в силно конкурентната област на генеративния изкуствен интелект. С въвеждането на архитектурата Mixture of Experts, вградената мултимодалност и впечатляващо дългия контекстен прозорец, Meta демонстрира, че отворените модели могат да се конкурират със собствените модели на големите технологични компании.
Въпреки противоречията около лицензирането и въпроса дали Llama 4 наистина трябва да се нарича „с отворен код“, техническите подобрения представляват важен етап. Способността на моделите да обработват както текст, така и изображения отваря нови възможности за разработчиците и бизнеса.
С все още предстоящия Llama 4 Behemoth и обявените планове за подобрени езикови и агентни възможности, е ясно, че Meta ще засили допълнително инвестициите си в изкуствен интелект. Следващите месеци ще покажат как тези нови модели ще трансформират пейзажа на изкуствения интелект и дали наистина, както прогнозира Марк Зукърбърг, ще помогнат на отворените модели на изкуствен интелект да се превърнат във водеща сила в областта на изкуствения интелект.
Свързано с това:
Вашият глобален партньор по маркетинг и бизнес развитие
☑️ Нашият бизнес език е английски или немски
☑️ НОВО: Кореспонденция на родния ви език!
Аз и моят екип с удоволствие ще бъдем на ваше разположение като ваш личен съветник.
Можете да се свържете с мен, като попълните формата за контакт тук или просто ми се обадите на +49 89 89 674 804 ( Мюнхен) . Моят имейл адрес е: [email protected]
Очаквам с нетърпение нашия съвместен проект.













