Избор на език 📢


Meta пуска нови серии модели с изкуствен интелект Llama 4 Scout, Maverick и Behemoth

Публикувано на: 6 април 2025 г. / Актуализирано на: 6 април 2025 г. – Автор: Konrad Wolfenstein

Meta пуска нови серии модели с изкуствен интелект Llama 4 Scout, Maverick и Behemoth

Meta пуска нови серии модели с изкуствен интелект Llama 4 Scout, Maverick и Behemoth – Изображение: Xpert.Digital

Лама 4: Новото поколение отворени AI системи от Meta

Разкрита е Llama 4: Ключът на Meta към следващата ера на изкуствения интелект

На 5 април 2025 г. Meta представи най-новото поколение на своите AI модели, Llama 4. Тези нови модели представляват значителен напредък в разработването на отворени AI системи и разполагат с редица новаторски възможности, които значително подобряват тяхната производителност и ефективност. Серията Llama 4 се състои от няколко модела, два от които вече са публично достъпни, докато най-мощният модел все още е във фаза на обучение.

Свързано с това:

Моделното семейство Llama 4

Meta е разработила три различни модела от серията Llama 4, всеки от които е оптимизиран за различни случаи на употреба:

Лама 4 Скаут

Llama 4 Scout е компактен модел с впечатляващи технически характеристики:

  • 17 милиарда активни параметъра с 16 експерта (общо 109 милиарда параметъра)
  • Може да работи с един графичен процесор NVIDIA H100 с квантуване Int4
  • Той разполага със забележително голям контекстен прозорец от 10 милиона токена, което го прави един от първите отворени модели с този капацитет

Според Meta, Scout превъзхожда други модели в своя клас, като Gemini 3, Gemini 2.0 Flash-Lite и Mistral 3.1. Той е особено подходящ за задачи като обобщаване на дълги документи, персонализиране на съдържание въз основа на потребителски данни и извличане на сложни заключения от големи количества знания.

Лама 4 Маверик

Llama 4 Maverick е по-мощният от двата налични модела:

  • 17 милиарда активни параметъра със 128 експерти (общо 400 милиарда параметъра)
  • Експерименталната чат версия достигна ELO 1417 на LMArena
  • Според Meta, той превъзхожда модели като GPT-4o и Gemini 2.0 Flash в множество бенчмаркове

Този модел е особено подходящ за приложения за обща помощ и чат, като например творческо писане, и показва резултати, сравними с DeepSeek v3 при задачи за разсъждение и кодиране, но с наполовина по-ниски параметри.

Лама 4 Бегемот

Llama 4 Behemoth е най-мощният модел на Meta, но все още не е публично достъпен:

  • 288 милиарда активни параметъра с 16 експерти (общо почти 2 трилиона параметъра)
  • Според Meta, той превъзхожда GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro в няколко STEM теста
  • Служи като „модел за учител“ за по-малките модели Llama 4

Бегемот все още е във фаза на обучение и ще бъде освободен на по-късна дата.

Технически иновации

Моделната гама Llama 4 въвежда няколко значителни технически иновации, които подобряват нейната производителност и ефективност:

Архитектура на смес от експерти (Министерство на образованието)

Едно от най-важните нововъведения в Llama 4 е архитектурата на Mixture of Experts (MoE), в която за всеки токен се активира само подмножество от параметрите на модела:

  • Това значително намалява изчислителните усилия и латентността, като същевременно поддържа висока производителност
  • В Llama 4 Maverick всеки токен се обработва от споделен експерт и един от 128-те маршрутизирани експерти
  • Тази архитектура позволява увеличаване на общите параметри на модела, без да се увеличават разходите за извод

Нативна мултимодалност с ранно сливане

Llama 4 е първият отворен модел с вградена мултимодалност чрез Early Fusion:

  • Текстовите и графичните токени са интегрирани в унифицирана архитектура на модела
  • Това позволява съвместно предварително обучение с големи количества текстови, графични и видео данни
  • За разлика от Llama 3.2, която използваше отделни параметри за текст и изображения, Llama 4 разбира и двата режима с едни и същи параметри

Изключително дълъг контекстен прозорец

Изключително дългият контекстен прозорец на Llama 4 Scout е особено впечатляващ:

  • С 10 милиона токена, той значително превъзхожда повечето налични модели
  • Това позволява обработката на много дълги документи, цели кодови бази или обширни разговори
  • Архитектурата iRoPE (interleaved attention layers - преплетени слоеве за внимание) прави това възможно

Нови методи на обучение

Мета е използвала няколко иновативни метода за обучение на Лама 4:

  • MetaP: Техника за стабилно настройване на критични хиперпараметри на модела
  • FP8 прецизност: Използване на 8-битови числа с плаваща запетая за ефективно обучение
  • Ко-дестилация: Използване на Llama 4 Behemoth като модел за учители за по-малки модели
  • Напълно асинхронно онлайн обучение с усилване: Нова инфраструктура за мащабно обучение

Наличност и интеграция

Моделите Llama 4 са достъпни чрез различни платформи и услуги:

Доставчици на услуги за изтегляне и облачни услуги

  • Моделите Scout и Maverick могат да бъдат изтеглени директно от Meta или чрез Hugging Face
  • Те са достъпни и чрез различни облачни платформи:
    • Cloudflare Workers AI
    • Azure AI Foundry и Azure Databricks
    • Vertex AI на Google Cloud
    • Още партньори ще последват през следващите дни

Интеграция в мета-продукти

Meta вече е актуализирала своите AI асистенти до Llama 4 на различни платформи:

  • WhatsApp, Messenger и Instagram Direct в 40 различни държави
  • Уебсайтът на Meta.AI
  • Въпреки това, мултимодалните функции в момента са достъпни само за англоговорящи потребители в САЩ

Свързано с това:

Лицензиране и спорове

Въпреки че Meta Llama 4 е описана като „с отворен код“, има някои ограничения в лиценза, които предизвикаха противоречия:

Лицензионни ограничения

Лицензът за общността на Llama 4 съдържа няколко ограничения:

  • Компаниите с над 700 милиона активни потребители месечно изискват специален лиценз от Meta
  • Потребителите и компаниите от ЕС очевидно нямат право да използват или разпространяват моделите, вероятно поради регулаторни изисквания
  • Съществуват изисквания относно именуването и приписването на производни модели

Дебат за „отворения код“

Има дебат дали Llama 4 всъщност трябва да се нарича „с отворен код“:

  • През 2023 г. Инициативата за отворен код определи, че ограниченията в лиценза Llama го изваждат „извън категорията „отворен код““
  • Критиците твърдят, че това е по-скоро модел с „отворен код“ или „отворени тегла“, отколкото истински софтуер с отворен код
  • Ограниченията за лицензиране биха могли да бъдат проблематични за малките предприятия без собствени правни отдели

Бъдещи планове

Мета вече е дал някои насоки за бъдещите си планове за Llama 4 и след това:

LlamaCon и други съобщения

  • Meta ще бъде домакин на първата си конференция LlamaCon на 29 април 2025 г., където ще бъдат обявени допълнителни подробности за нейните AI модели и продуктови планове
  • Компанията планира също така да пусне специално приложение за своя мета чатбот през второто тримесечие

Разширяване на езиковите умения

  • Мета работи за подобряване на езиковите умения на Лама 4, за да може да води по-естествени разговори
  • Целта е да се осигури по-плавен, двупосочен диалог, при който потребителите могат да прекъсват AI модела
  • Крис Кокс, главен продуктов директор на Meta, описа предстоящия Llama 4 като „омни-модел“, който позволява превод на реч в текст, вместо да се използва роден език

Агентски изкуствен интелект и подобрени възможности

  • Марк Зукърбърг обяви, че Llama 4 ще има „агентски възможности“, които ще позволят нови случаи на употреба
  • Meta има за цел да разработи модели на изкуствен интелект, които могат да „изпълняват обобщени действия, да комуникират естествено с хората и да решават трудни проблеми“
  • Компанията обмисля предлагането на премиум абонаменти за своя AI асистент за цели, свързани с агенти, като например резервации или видео продукция

Защо Llama 4 е повратна точка в света на изкуствения интелект

Пускането на Llama 4 представлява значителна стъпка в стратегията на Meta да се превърне в лидер в силно конкурентната област на генеративния изкуствен интелект. С въвеждането на архитектурата Mixture of Experts, вградената мултимодалност и впечатляващо дългия контекстен прозорец, Meta демонстрира, че отворените модели могат да се конкурират със собствените модели на големите технологични компании.

Въпреки противоречията около лицензирането и въпроса дали Llama 4 наистина трябва да се нарича „с отворен код“, техническите подобрения представляват важен етап. Способността на моделите да обработват както текст, така и изображения отваря нови възможности за разработчиците и бизнеса.

С все още предстоящия Llama 4 Behemoth и обявените планове за подобрени езикови и агентни възможности, е ясно, че Meta ще засили допълнително инвестициите си в изкуствен интелект. Следващите месеци ще покажат как тези нови модели ще трансформират пейзажа на изкуствения интелект и дали наистина, както прогнозира Марк Зукърбърг, ще помогнат на отворените модели на изкуствен интелект да се превърнат във водеща сила в областта на изкуствения интелект.

Свързано с това:

 

Вашият глобален партньор по маркетинг и бизнес развитие

☑️ Нашият бизнес език е английски или немски

☑️ НОВО: Кореспонденция на родния ви език!

 

Дигитален пионер - Konrad Wolfenstein

Konrad Wolfenstein

Аз и моят екип с удоволствие ще бъдем на ваше разположение като ваш личен съветник.

Можете да се свържете с мен, като попълните формата за контакт тук или просто ми се обадите на +49 89 89 674 804 ( Мюнхен) . Моят имейл адрес е: [email protected]

Очаквам с нетърпение нашия съвместен проект.

 

 

☑️ Подкрепа за МСП в стратегията, консултирането, планирането и внедряването

☑️ Създаване или пренасочване на дигиталната стратегия и дигитализация

☑️ Разширяване и оптимизиране на международните процеси на продажби

☑️ Глобални и дигитални B2B търговски платформи

☑️ Pioneer Развитие на бизнеса / Маркетинг / PR / Търговски панаири


⭐️ Изкуствен интелект (ИИ) - Блог за ИИ, гореща точка и център за съдържание ⭐️ Дигитален интелект ⭐️ XPaper