Избор језика 📢


Мета објављује нове серије вештачке интелигенције: Лама 4 Скаут, Маверик и Бехемот

Објављено: 6. априла 2025. / Ажурирано: 6. априла 2025. – Аутор: Konrad Wolfenstein

Мета објављује нове серије вештачке интелигенције: Лама 4 Скаут, Маверик и Бехемот

Мета објављује нове серије вештачке интелигенције: Лама 4 Скаут, Маверик и Бехемот – Слика: Xpert.Digital

Лама 4: Нова генерација отворених вештачких интелигенција од Мете

Откривена Лама 4: Метин кључ за следеће доба вештачке интелигенције

Дана 5. априла 2025. године, компанија Мета је представила најновију генерацију својих вештачке интелигенције, Лама 4. Ови нови модели представљају значајан напредак у развоју отворених вештачких интелигенција и садрже низ револуционарних могућности које значајно побољшавају њихове перформансе и ефикасност. Серија Лама 4 обухвата неколико модела, од којих су два већ јавно доступна, док је најмоћнији модел још увек у фази обуке.

У вези са овим:

Породица модела Лама 4

Мета је развила три различита модела у серији Ллама 4, сваки оптимизован за различите случајеве употребе:

Лама 4 Извиђач

Лама 4 Скаут је компактан модел са импресивним техничким спецификацијама:

  • 17 милијарди активних параметара са 16 стручњака (укупно 109 милијарди параметара)
  • Може се користити на једној NVIDIA H100 графичкој картици са Int4 квантизацијом
  • Има изузетно велики контекстуални прозор од 10 милиона токена, што га чини једним од првих отворених модела са овим капацитетом

Према Мети, Скаут надмашује друге моделе у својој класи, као што су Џемини 3, Џемини 2.0 Флеш-лајт и Мистрал 3.1. Посебно је погодан за задатке као што су сумирање дугачких докумената, персонализација садржаја на основу корисничких података и извлачење сложених закључака из великих количина знања.

Лама 4 Маверик

Лама 4 Маверик је снажнији од два доступна модела:

  • 17 милијарди активних параметара са 128 стручњака (укупно 400 милијарди параметара)
  • Експериментална верзија за ћаскање је достигла ЕЛО 1417 на ЛМАрени
  • Према Мети, надмашује моделе попут GPT-4o и Gemini 2.0 Flash у бројним тестовима

Овај модел је посебно погодан за општу помоћ и апликације за ћаскање као што је креативно писање и показује резултате упоредиве са DeepSeek v3 у задацима расуђивања и кодирања, али са упола мањим параметрима.

Лама 4 Бехемот

Лама 4 Бехемот је Метин најмоћнији модел, али још увек није јавно доступан:

  • 288 милијарди активних параметара са 16 стручњака (скоро 2 трилиона параметара укупно)
  • Према Мети, надмашује GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro у неколико STEM тестова
  • Служи као „модел за наставнике“ за мање моделе Лама 4

Бехемот је тренутно још увек у фази обуке и биће пуштен касније.

Техничке иновације

Моделска серија Llama 4 представља неколико значајних техничких иновација које побољшавају њене перформансе и ефикасност:

Архитектура мешавине стручњака (Министарство просвете)

Једна од најважнијих иновација у Llama 4 је архитектура мешавине стручњака (MoE), у којој се за сваки токен активира само подскуп параметара модела:

  • Ово значајно смањује рачунарски напор и латенцију, уз одржавање високих перформанси
  • У Llama 4 Maverick-у, сваки токен обрађује дељени стручњак и један од 128 усмерених стручњака
  • Ова архитектура омогућава повећање укупних параметара модела без повећања трошкова закључивања

Нативна мултимодалност са раном фузијом

Лама 4 је први отворени модел са изворном мултимодалошћу кроз рану фузију:

  • Текстуални и сликовни токени су интегрисани у јединствену архитектуру модела
  • Ово омогућава заједничку претходну обуку са великим количинама текстуалних, сликовних и видео података
  • За разлику од Llama 3.2, која је користила одвојене параметре за текст и слике, Llama 4 разуме оба модалитета изворно са истим параметрима

Изузетно дуг контекстни прозор

Изузетно дуг контекстуални прозор игре Llama 4 Scout је посебно импресиван:

  • Са 10 милиона токена, значајно надмашује већину доступних модела
  • Ово омогућава обраду веома дугих докумената, целих база кода или опсежних разговора
  • iRoPE архитектура (испреплетени слојеви пажње) ово омогућава

Нове методе обуке

Мета је користила неколико иновативних метода за дресуру Ламе 4:

  • MetaP: Техника за робусно подешавање критичних хиперпараметара модела
  • FP8 прецизност: Коришћење 8-битних бројева са покретним зарезом за ефикасно тренирање
  • Ко-дестилација: Коришћење Ламе 4 Бехемота као модела наставника за мање моделе
  • Потпуно асинхроно онлајн учење са појачавањем: Нова инфраструктура за учење великих размера

Доступност и интеграција

Модели Llama 4 су доступни преко различитих платформи и услуга:

Провајдери услуга преузимања и облака

  • Модели Scout и Maverick могу се преузети директно са Мете или преко Hugging Face-а
  • Такође су доступни преко разних cloud платформи:
    • Cloudflare радници са вештачком интелигенцијом
    • Azure AI Foundry и Azure Databricks
    • Vertex AI у Google Cloud-у
    • Више партнера ће уследити у наредним данима

Интеграција у мета-производе

Мета је већ ажурирала своје AI асистенте на Llama 4 на различитим платформама:

  • WhatsApp, Messenger и Instagram Direct у 40 различитих земаља
  • Веб-сајт Meta.AI
  • Међутим, мултимодалне функције су тренутно доступне само корисницима који говоре енглески језик у САД

У вези са овим:

Лиценцирање и контроверзе

Иако је Meta Llama 4 описан као „отворени код“, постоје нека ограничења у лиценци која су изазвала контроверзе:

Ограничења лиценце

Лиценца заједнице Llama 4 садржи неколико ограничења:

  • Компаније са више од 700 милиона активних корисника месечно захтевају посебну лиценцу од Мете
  • Корисницима и компанијама из ЕУ очигледно није дозвољено да користе или дистрибуирају моделе, вероватно због регулаторних захтева
  • Постоје захтеви у вези са именовањем и приписивањем изведених модела

Дебата о „отвореном коду“

Постоји дебата о томе да ли би Llama 4 заправо требало назвати „отвореним кодом“:

  • Иницијатива отвореног кода је 2023. године утврдила да ограничења у лиценци Llama избацују програм „из категорије 'отвореног кода'“
  • Критичари тврде да је то више модел „отвореног изворног кода“ или „отворених тежина“ него прави софтвер отвореног кода
  • Ограничења лиценцирања могла би бити проблематична за мала предузећа без сопствених правних одељења

Будући планови

Мета је већ дао неке увиде у своје будуће планове за Ламу 4 и даље:

LlamaCon и друга обавештења

  • Мета ће бити домаћин своје прве конференције LlamaCon 29. априла 2025. године, где ће бити објављени додатни детаљи о њеним моделима вештачке интелигенције и плановима производа
  • Компанија такође планира да објави посебну апликацију за свог мета четбота у другом кварталу

Проширивање језичких вештина

  • Мета ради на побољшању језичких вештина Ламе 4 како би омогућила природније разговоре
  • Циљ је омогућити глаткији, двосмерни дијалог где корисници могу прекинути вештачку интелигенцију (AI) модел
  • Крис Кокс, главни директор производа компаније Мета, описао је предстојећи Лама 4 као „омни-модел“ који омогућава превођење говора у текст, уместо да се користи матерњи језик

Агентска вештачка интелигенција и побољшане могућности

  • Марк Закерберг је најавио да ће Лама 4 имати „агентске могућности“ које ће омогућити нове случајеве употребе
  • Мета има за циљ да развије моделе вештачке интелигенције који могу да „извршавају генерализоване радње, природно комуницирају са људима и решавају изазовне проблеме“
  • Компанија разматра понуду премиум претплата за свог вештачког интелигенцијског асистента за потребе везане за агенте, као што су резервације или видео продукција

Зашто је Лама 4 прекретница у свету вештачке интелигенције

Објављивање Llama 4 представља значајан корак у Метиној стратегији да постане лидер у веома конкурентном пољу генеративне вештачке интелигенције. Увођењем архитектуре „Mixture of Experts“, изворне мултимодалности и импресивно дугог контекстуалног прозора, Мета показује да отворени модели могу да се такмиче са власничким моделима великих технолошких компанија.

Упркос контроверзама око лиценцирања и питања да ли Llama 4 заиста треба назвати „отвореним кодом“, технички напредак представља значајну прекретницу. Способност модела да обрађују и текст и слике отвара нове могућности за програмере и предузећа.

С обзиром на то да је Llama 4 Behemoth још увек у припреми и да су најављени планови за побољшане језичке и агентске могућности, јасно је да ће Meta додатно интензивирати своја улагања у вештачку интелигенцију. Наредни месеци ће показати како ће ови нови модели трансформисати пејзаж вештачке интелигенције и да ли ће заиста, како је предвидео Марк Закерберг, помоћи да отворени модели вештачке интелигенције постану водећа снага у вештачкој интелигенцији.

У вези са овим:

 

Ваш глобални партнер за маркетинг и развој пословања

☑️ Наш пословни језик је енглески или немачки

☑️ НОВО: Преписка на вашем матерњем језику!

 

Дигитални пионир - Konrad Wolfenstein

Konrad Wolfenstein

Ја и мој тим смо срећни што вам можемо бити на располагању као ваш лични саветник.

Можете ме контактирати попуњавањем контакт форме овде или једноставно позовите на +49 89 89 674 804 ( Минхен) . Моја имејл адреса је: [email protected]

Радујем се нашем заједничком пројекту.

 

 

☑️ Подршка малим и средњим предузећима у стратегији, консултацијама, планирању и имплементацији

☑️ Креирање или реорганизација дигиталне стратегије и дигитализације

☑️ Проширење и оптимизација међународних продајних процеса

☑️ Глобалне и дигиталне B2B платформе за трговање

☑️ Пионирски развој пословања / Маркетинг / Односи с јавношћу / Сајмови


⭐️ Вештачка интелигенција (ВИ) - Блог о ВИ, жариште и центар за садржај ⭐️ Дигитална интелигенција ⭐️ XPaper