⭐️ Вештачка интелигенција (ВИ) - Блог о ВИ, жариште и центар за садржај ⭐️ Дигитална интелигенција ⭐️ XPaper

Available in 27 languages 📢

Мета објављује нове серије вештачке интелигенције: Лама 4 Скаут, Маверик и Бехемот

Објављено: 6. априла 2025. / Ажурирано: 6. априла 2025. – Аутор: Konrad Wolfenstein

Мета објављује нове серије вештачке интелигенције: Лама 4 Скаут, Маверик и Бехемот – Слика: Xpert.Digital

Лама 4: Нова генерација отворених вештачких интелигенција од Мете

Откривена Лама 4: Метин кључ за следеће доба вештачке интелигенције

Дана 5. априла 2025. године, компанија Мета је представила најновију генерацију својих вештачке интелигенције, Лама 4. Ови нови модели представљају значајан напредак у развоју отворених вештачких интелигенција и садрже низ револуционарних могућности које значајно побољшавају њихове перформансе и ефикасност. Серија Лама 4 обухвата неколико модела, од којих су два већ јавно доступна, док је најмоћнији модел још увек у фази обуке.

У вези са овим:

Модели вештачке интелигенције објашњени једноставно: Разумети основе вештачке интелигенције, језичких модела и резоновања

Породица модела Лама 4

Мета је развила три различита модела у серији Ллама 4, сваки оптимизован за различите случајеве употребе:

Лама 4 Извиђач

Лама 4 Скаут је компактан модел са импресивним техничким спецификацијама:

17 милијарди активних параметара са 16 стручњака (укупно 109 милијарди параметара)
Може се користити на једној NVIDIA H100 графичкој картици са Int4 квантизацијом
Има изузетно велики контекстуални прозор од 10 милиона токена, што га чини једним од првих отворених модела са овим капацитетом

Према Мети, Скаут надмашује друге моделе у својој класи, као што су Џемини 3, Џемини 2.0 Флеш-лајт и Мистрал 3.1. Посебно је погодан за задатке као што су сумирање дугачких докумената, персонализација садржаја на основу корисничких података и извлачење сложених закључака из великих количина знања.

Лама 4 Маверик

Лама 4 Маверик је снажнији од два доступна модела:

17 милијарди активних параметара са 128 стручњака (укупно 400 милијарди параметара)
Експериментална верзија за ћаскање је достигла ЕЛО 1417 на ЛМАрени
Према Мети, надмашује моделе попут GPT-4o и Gemini 2.0 Flash у бројним тестовима

Овај модел је посебно погодан за општу помоћ и апликације за ћаскање као што је креативно писање и показује резултате упоредиве са DeepSeek v3 у задацима расуђивања и кодирања, али са упола мањим параметрима.

Лама 4 Бехемот

Лама 4 Бехемот је Метин најмоћнији модел, али још увек није јавно доступан:

288 милијарди активних параметара са 16 стручњака (скоро 2 трилиона параметара укупно)
Према Мети, надмашује GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro у неколико STEM тестова
Служи као „модел за наставнике“ за мање моделе Лама 4

Бехемот је тренутно још увек у фази обуке и биће пуштен касније.

Техничке иновације

Моделска серија Llama 4 представља неколико значајних техничких иновација које побољшавају њене перформансе и ефикасност:

Архитектура мешавине стручњака (Министарство просвете)

Једна од најважнијих иновација у Llama 4 је архитектура мешавине стручњака (MoE), у којој се за сваки токен активира само подскуп параметара модела:

Ово значајно смањује рачунарски напор и латенцију, уз одржавање високих перформанси
У Llama 4 Maverick-у, сваки токен обрађује дељени стручњак и један од 128 усмерених стручњака
Ова архитектура омогућава повећање укупних параметара модела без повећања трошкова закључивања

Нативна мултимодалност са раном фузијом

Лама 4 је први отворени модел са изворном мултимодалошћу кроз рану фузију:

Текстуални и сликовни токени су интегрисани у јединствену архитектуру модела
Ово омогућава заједничку претходну обуку са великим количинама текстуалних, сликовних и видео података
За разлику од Llama 3.2, која је користила одвојене параметре за текст и слике, Llama 4 разуме оба модалитета изворно са истим параметрима

Изузетно дуг контекстни прозор

Изузетно дуг контекстуални прозор игре Llama 4 Scout је посебно импресиван:

Са 10 милиона токена, значајно надмашује већину доступних модела
Ово омогућава обраду веома дугих докумената, целих база кода или опсежних разговора
iRoPE архитектура (испреплетени слојеви пажње) ово омогућава

Нове методе обуке

Мета је користила неколико иновативних метода за дресуру Ламе 4:

MetaP: Техника за робусно подешавање критичних хиперпараметара модела
FP8 прецизност: Коришћење 8-битних бројева са покретним зарезом за ефикасно тренирање
Ко-дестилација: Коришћење Ламе 4 Бехемота као модела наставника за мање моделе
Потпуно асинхроно онлајн учење са појачавањем: Нова инфраструктура за учење великих размера

Доступност и интеграција

Модели Llama 4 су доступни преко различитих платформи и услуга:

Провајдери услуга преузимања и облака

Модели Scout и Maverick могу се преузети директно са Мете или преко Hugging Face-а
Такође су доступни преко разних cloud платформи:
- Cloudflare радници са вештачком интелигенцијом
- Azure AI Foundry и Azure Databricks
- Vertex AI у Google Cloud-у
- Више партнера ће уследити у наредним данима

Интеграција у мета-производе

Мета је већ ажурирала своје AI асистенте на Llama 4 на различитим платформама:

WhatsApp, Messenger и Instagram Direct у 40 различитих земаља
Веб-сајт Meta.AI
Међутим, мултимодалне функције су тренутно доступне само корисницима који говоре енглески језик у САД

У вези са овим:

Мета вештачка интелигенција је стигла у Немачку! WhatsApp, Instagram и Facebook добијају вештачку интелигенцију – са важним разликама у односу на америчку верзију

Лиценцирање и контроверзе

Иако је Meta Llama 4 описан као „отворени код“, постоје нека ограничења у лиценци која су изазвала контроверзе:

Ограничења лиценце

Лиценца заједнице Llama 4 садржи неколико ограничења:

Компаније са више од 700 милиона активних корисника месечно захтевају посебну лиценцу од Мете
Корисницима и компанијама из ЕУ очигледно није дозвољено да користе или дистрибуирају моделе, вероватно због регулаторних захтева
Постоје захтеви у вези са именовањем и приписивањем изведених модела

Дебата о „отвореном коду“

Постоји дебата о томе да ли би Llama 4 заправо требало назвати „отвореним кодом“:

Иницијатива отвореног кода је 2023. године утврдила да ограничења у лиценци Llama избацују програм „из категорије 'отвореног кода'“
Критичари тврде да је то више модел „отвореног изворног кода“ или „отворених тежина“ него прави софтвер отвореног кода
Ограничења лиценцирања могла би бити проблематична за мала предузећа без сопствених правних одељења

Будући планови

Мета је већ дао неке увиде у своје будуће планове за Ламу 4 и даље:

LlamaCon и друга обавештења

Мета ће бити домаћин своје прве конференције LlamaCon 29. априла 2025. године, где ће бити објављени додатни детаљи о њеним моделима вештачке интелигенције и плановима производа
Компанија такође планира да објави посебну апликацију за свог мета четбота у другом кварталу

Проширивање језичких вештина

Мета ради на побољшању језичких вештина Ламе 4 како би омогућила природније разговоре
Циљ је омогућити глаткији, двосмерни дијалог где корисници могу прекинути вештачку интелигенцију (AI) модел
Крис Кокс, главни директор производа компаније Мета, описао је предстојећи Лама 4 као „омни-модел“ који омогућава превођење говора у текст, уместо да се користи матерњи језик

Агентска вештачка интелигенција и побољшане могућности

Марк Закерберг је најавио да ће Лама 4 имати „агентске могућности“ које ће омогућити нове случајеве употребе
Мета има за циљ да развије моделе вештачке интелигенције који могу да „извршавају генерализоване радње, природно комуницирају са људима и решавају изазовне проблеме“
Компанија разматра понуду премиум претплата за свог вештачког интелигенцијског асистента за потребе везане за агенте, као што су резервације или видео продукција

Зашто је Лама 4 прекретница у свету вештачке интелигенције

Објављивање Llama 4 представља значајан корак у Метиној стратегији да постане лидер у веома конкурентном пољу генеративне вештачке интелигенције. Увођењем архитектуре „Mixture of Experts“, изворне мултимодалности и импресивно дугог контекстуалног прозора, Мета показује да отворени модели могу да се такмиче са власничким моделима великих технолошких компанија.

Упркос контроверзама око лиценцирања и питања да ли Llama 4 заиста треба назвати „отвореним кодом“, технички напредак представља значајну прекретницу. Способност модела да обрађују и текст и слике отвара нове могућности за програмере и предузећа.

С обзиром на то да је Llama 4 Behemoth још увек у припреми и да су најављени планови за побољшане језичке и агентске могућности, јасно је да ће Meta додатно интензивирати своја улагања у вештачку интелигенцију. Наредни месеци ће показати како ће ови нови модели трансформисати пејзаж вештачке интелигенције и да ли ће заиста, како је предвидео Марк Закерберг, помоћи да отворени модели вештачке интелигенције постану водећа снага у вештачкој интелигенцији.

У вези са овим:

Ваш глобални партнер за маркетинг и развој пословања

☑️ Наш пословни језик је енглески или немачки

☑️ НОВО: Преписка на вашем матерњем језику!

Konrad Wolfenstein

Ја и мој тим смо срећни што вам можемо бити на располагању као ваш лични саветник.

Можете ме контактирати попуњавањем контакт форме овде или једноставно позовите на +49 89 89 674 804 ( Минхен) . Моја имејл адреса је: [email protected]

Радујем се нашем заједничком пројекту.