पर प्रकाशित: 6 अप्रैल, 2025 / अपडेट से: 6 अप्रैल, 2025 - लेखक: कोनराड वोल्फेंस्टीन
लामा 4: मेटा से ओपन एआई सिस्टम की नई पीढ़ी
Llama 4 का खुलासा: मेटास कुंजी अगली एआई युग के लिए
मेटा ने 5 अप्रैल, 2025 को अपने एआई मॉडल, लामा 4 की नवीनतम पीढ़ी को प्रस्तुत किया। ये नए मॉडल खुले एआई सिस्टम के विकास में महत्वपूर्ण प्रगति का प्रतिनिधित्व करते हैं और कई ग्राउंडब्रेकिंग कार्य हैं जो उनके प्रदर्शन और दक्षता को काफी बढ़ाते हैं। लामा 4 श्रृंखला में अलग -अलग मॉडल होते हैं, जिनमें से दो पहले से ही सार्वजनिक रूप से उपलब्ध हैं, जबकि सबसे शक्तिशाली मॉडल अभी भी प्रशिक्षण चरण में है।
के लिए उपयुक्त:
लामा 4 मॉडल परिवार
मेटा ने लामा 4 श्रृंखला में तीन अलग -अलग मॉडल विकसित किए हैं, जिनमें से प्रत्येक को विभिन्न अनुप्रयोगों के लिए अनुकूलित किया गया है:
लामा 4 स्काउट
लामा 4 स्काउट प्रभावशाली तकनीकी विनिर्देशों के साथ एक कॉम्पैक्ट मॉडल है:
- 16 विशेषज्ञों के साथ 17 बिलियन सक्रिय पैरामीटर (कुल 109 बिलियन पैरामीटर)
- INT4 परिमाणीकरण के साथ एक एकल NVIDIA H100 GPU पर संचालित किया जा सकता है
- 10 मिलियन टोकन की उल्लेखनीय रूप से बड़ी संदर्भ विंडो है, जो इसे इस क्षमता के साथ पहले खुले मॉडल में से एक बनाता है
मेटा के अनुसार, स्काउट अपनी कक्षा में अन्य मॉडलों से अधिक है जैसे कि मिथुन 3, मिथुन 2.0 फ्लैश-लाइट और मिस्ट्रल 3.1। यह विशेष रूप से लंबे दस्तावेजों का सारांश, उपयोगकर्ता डेटा के आधार पर निजीकरण और बड़ी मात्रा में ज्ञान के बारे में जटिल निष्कर्ष जैसे कार्यों के लिए उपयुक्त है।
लामा 4 मावरिक
Llama 4 Maverick दो उपलब्ध मॉडलों में अधिक शक्तिशाली है:
- 128 विशेषज्ञों के साथ 17 बिलियन सक्रिय पैरामीटर (कुल 400 बिलियन पैरामीटर)
- प्रायोगिक चैट संस्करण Lmarena पर Elo 1417 तक पहुंच गया
- कई बेंचमार्क में GPT-4O और GEMINI 2.0 फ्लैश जैसे मॉडल से अधिक है
यह मॉडल विशेष रूप से सामान्य सहायता और चैट एप्लिकेशन जैसे रचनात्मक लेखन के लिए उपयुक्त है और ऐसे परिणाम दिखाता है जो तर्क और कोडिंग कार्यों में डीपसेक वी 3 के लिए तुलनीय हैं, लेकिन आधे मापदंडों के साथ।
Llama 4 behemoth
Llama 4 Behemoth Metas का सबसे शक्तिशाली मॉडल है, जो अभी तक सार्वजनिक रूप से उपलब्ध नहीं है:
- 16 विशेषज्ञों के साथ 288 बिलियन सक्रिय पैरामीटर (लगभग 2 ट्रिलियन पैरामीटर)
- मेटा के अनुसार, यह कई स्टेम बेंचमार्क के लिए GPT-4.5, क्लाउड सॉनेट 3.7 और मिथुन 2.0 प्रो से अधिक है
- छोटे लामा 4 मॉडल के लिए "शिक्षक मॉडल" के रूप में कार्य करता है
Behemoth वर्तमान में अभी भी प्रशिक्षण चरण में है और बाद की तारीख में प्रकाशित किया जाएगा।
तकनीकी नवाचार
लामा 4 मॉडल श्रृंखला कई महत्वपूर्ण तकनीकी नवाचारों का परिचय देती है जो उनके प्रदर्शन और दक्षता में सुधार करते हैं:
विशेषज्ञों का मिश्रण (एमओई) वास्तुकला
लामा 4 में सबसे महत्वपूर्ण नवाचारों में से एक विशेषज्ञों (एमओई) वास्तुकला का मिश्रण है, जिसमें केवल मॉडल मापदंडों का एक हिस्सा हर टोकन के लिए सक्रिय होता है:
- यह गणना के प्रयास और विलंबता को काफी कम कर देता है, जबकि उच्च प्रदर्शन संरक्षित है
- Llama 4 Maverick पर, प्रत्येक टोकन को एक सामान्य विशेषज्ञ द्वारा संसाधित किया जाता है और 128 gerized विशेषज्ञों में से एक
- यह आर्किटेक्चर अनुमान लागत को बढ़ाए बिना मॉडल के कुल पैरामीटर को बढ़ाना संभव बनाता है
प्रारंभिक संलयन के साथ देशी बहुपक्षीयता
लामा 4 प्रारंभिक संलयन द्वारा देशी मल्टीमॉडलिटी के साथ पहला खुला मॉडल है:
- पाठ और छवि टोकन एक समान मॉडल वास्तुकला में एकीकृत हैं
- यह बड़ी मात्रा में पाठ, छवि और वीडियो डेटा के साथ संयुक्त प्रारंभिक प्रशिक्षण को सक्षम बनाता है
- Llama 3.2 के विपरीत, जो पाठ और छवियों के लिए अलग -अलग मापदंडों का उपयोग करते थे, llama 4 एक ही मापदंडों के साथ मूल निवासी दोनों तौर -तरीकों को समझता है
बेहद लंबी संदर्भ विंडो
लामा 4 स्काउट की बहुत लंबी संदर्भ खिड़की विशेष रूप से प्रभावशाली है:
- 10 मिलियन टोकन के साथ, यह स्पष्ट रूप से उपलब्ध मॉडल में से अधिकांश से अधिक है
- यह बहुत लंबे दस्तावेजों, संपूर्ण कोड ठिकानों या व्यापक वार्तालापों के प्रसंस्करण में सक्षम बनाता है
- इरोप आर्किटेक्चर (इंटरलेव्ड अटेंशन लेयर्स) यह संभव बनाता है
नए प्रशिक्षण के तरीके
मेटा ने लामा 4 के प्रशिक्षण के लिए कई नवीन तरीकों का उपयोग किया है:
- METAP: महत्वपूर्ण मॉडल हाइपरमीटर के मजबूत समन्वय के लिए एक तकनीक
- FP8 परिशुद्धता: कुशल प्रशिक्षण के लिए 8-बिट स्लाइड-निर्मित संख्याओं का उपयोग
- CO-Distillation: छोटे मॉडल के लिए एक शिक्षक मॉडल के रूप में Llama 4 Behemoth का उपयोग
- सुदृढीकरण के साथ पूरी तरह से अतुल्यकालिक ऑनलाइन सीखना: बड़े पैमाने पर सीखने के लिए एक नया बुनियादी ढांचा
उपलब्धता और एकीकरण
लामा 4 मॉडल विभिन्न प्लेटफार्मों और सेवाओं के माध्यम से उपलब्ध हैं:
डाउनलोड और बादल प्रदाता
- मॉडल स्काउट और मावरिक को सीधे मेटा से या हगिंग फेस के माध्यम से डाउनलोड किया जा सकता है
- वे विभिन्न क्लाउड प्लेटफार्मों के माध्यम से भी उपलब्ध हैं:
- CloudFlare कार्यकर्ता AI
- Azure AI फाउंड्री और Azure DataBricks
- Google क्लाउड का वर्टेक्स एआई
- अन्य साथी आने वाले दिनों में पालन करेंगे
मेटा उत्पादों में एकीकरण
मेटा ने पहले से ही लामा 4 पर विभिन्न प्लेटफार्मों में अपने एआई सहायकों को अपडेट कर दिया है:
- 40 अलग -अलग देशों में व्हाट्सएप, मैसेंजर और इंस्टाग्राम डायरेक्ट
- Meta.ai वेबसाइट
- हालाँकि, मल्टीमॉडल फ़ंक्शंस वर्तमान में केवल यूएसए में अंग्रेजी -लैंग्वेज उपयोगकर्ताओं के लिए उपलब्ध हैं
के लिए उपयुक्त:
- जर्मनी में मेटा एआई यहाँ है! व्हाट्सएप, इंस्टाग्राम और फेसबुक यूएस संस्करण में महत्वपूर्ण अंतर के साथ एआई प्राप्त करते हैं
लाइसेंस और विवाद
यद्यपि मेटा लामा 4 "खुले स्रोत" को संदर्भित करता है, लाइसेंस में कुछ प्रतिबंध हैं जो विवाद को ट्रिगर करते हैं:
लाइसेंस प्रतिबंध
लामा 4 सामुदायिक लाइसेंस में कई प्रतिबंध हैं:
- 700 मिलियन से अधिक मासिक सक्रिय उपयोगकर्ताओं वाली कंपनियों को मेटा से एक विशेष लाइसेंस की आवश्यकता होती है
- मॉडल को स्पष्ट रूप से यूरोपीय संघ से उपयोगकर्ताओं और कंपनियों का उपयोग करने या वितरित करने की अनुमति नहीं है, संभवतः नियामक आवश्यकताओं के कारण
- व्युत्पन्न मॉडल के लिए नामकरण और अटेंशन के बारे में आवश्यकताएं हैं
"ओपन सोर्स" के बारे में बहस
इस बारे में एक बहस है कि क्या लामा 4 को वास्तव में "ओपन सोर्स" कहा जाना चाहिए:
- 2023 में ओपन सोर्स इनिशिएटिव ने पाया कि लामा लाइसेंस में प्रतिबंध "ओपन सोर्स '" श्रेणी से इसे बाहर निकालते हैं
- आलोचकों का तर्क है कि यह वास्तविक ओपन सोर्स सॉफ्टवेयर की तुलना में "सोर्स-ओपन" या "ओपन वेट" मॉडल के साथ अधिक है
- लाइसेंस प्रतिबंध अपने स्वयं के कानूनी विभागों के बिना छोटी कंपनियों के लिए समस्याग्रस्त हो सकते हैं
भविष्य की योजनाएं
मेटा ने पहले ही लामा 4 और उससे आगे के लिए अपनी भविष्य की योजनाओं में कुछ अंतर्दृष्टि दी है:
Llamacon और अन्य घोषणाएँ
- मेटा 29 अप्रैल, 2025 को पहला ललामकॉन सम्मेलन आयोजित करेगा, जिसमें इसके एआई मॉडल और उत्पाद योजनाओं पर अधिक जानकारी की घोषणा की जानी है
- कंपनी ने दूसरी तिमाही में अपने मेटा-चैट बॉट के लिए एक समर्पित आवेदन प्रकाशित करने की भी योजना बनाई है
भाषा कौशल का विस्तार
- मेटा अधिक प्राकृतिक वार्तालापों को सक्षम करने के लिए लामा 4 के भाषा कौशल में सुधार पर काम कर रहा है
- उद्देश्य अधिक तरल पदार्थ, दो-तरफा संवादों को सक्षम करना है जिसमें उपयोगकर्ता एआई मॉडल को बाधित कर सकते हैं
- मेटा के मुख्य उत्पाद अधिकारी क्रिस कॉक्स ने आगामी लामा 4 को एक "ओमनी मॉडल" के रूप में वर्णित किया जो भाषा को पाठ में अनुवाद करने के बजाय मूल भाषा को सक्षम बनाता है
एजेंट एआई और विस्तारित कौशल
- मार्क जुकरबर्ग ने घोषणा की है कि लामा 4 में "एजेंट कौशल" होगा जो नए अनुप्रयोगों को सक्षम करना चाहिए
- मेटा का उद्देश्य एआई मॉडल विकसित करना है जो "सामान्यीकृत कार्यों को पूरा करता है, निश्चित रूप से लोगों के साथ संवाद करता है और चुनौतीपूर्ण समस्याओं को हल करता है"
- कंपनी आरक्षण या वीडियो उत्पादन जैसे एजेंट उद्देश्यों के लिए अपने एआई सहायक के लिए प्रीमियम सदस्यता की पेशकश करने पर विचार कर रही है
क्यों लामा 4 एआई परिदृश्य में एक महत्वपूर्ण मोड़ है
Llama 4 का प्रकाशन अत्यधिक प्रतिस्पर्धी क्षेत्र में जनरेटिव AI का अग्रणी क्षेत्र बनने के लिए METAS रणनीति में एक महत्वपूर्ण कदम का प्रतिनिधित्व करता है। विशेषज्ञों की वास्तुकला, देशी मल्टीमॉडलिटी और एक प्रभावशाली लंबी संदर्भ विंडो के मिश्रण की शुरूआत के साथ, मेटा से पता चलता है कि खुले मॉडल बड़ी प्रौद्योगिकी कंपनियों के मालिकाना मॉडल के साथ रख सकते हैं।
लाइसेंसिंग और इस सवाल के बारे में विवाद के बावजूद कि क्या लामा 4 को वास्तव में "खुले स्रोत" के रूप में संदर्भित किया जाना चाहिए, तकनीकी प्रगति एक महत्वपूर्ण मील का पत्थर है। पाठ और छवियों दोनों को संसाधित करने के लिए मॉडल की क्षमता डेवलपर्स और कंपनियों के लिए नए अवसर खोलती है।
बकाया लामा 4 बीहेमोथ और विस्तारित भाषा और एजेंट कौशल के लिए घोषित योजनाओं के साथ, यह स्पष्ट है कि मेटा एआई में अपने निवेश को और तेज कर देगा। आने वाले महीने दिखाएंगे कि ये नए मॉडल एआई परिदृश्य को कैसे बदलते हैं और क्या, जैसा कि मार्क जुकरबर्ग द्वारा भविष्यवाणी की गई है, वे वास्तव में कृत्रिम बुद्धिमत्ता के क्षेत्र में खुले एआई मॉडल बनाने में मदद करेंगे।
के लिए उपयुक्त:
आपका वैश्विक विपणन और व्यवसाय विकास भागीदार
☑️ हमारी व्यावसायिक भाषा अंग्रेजी या जर्मन है
☑️ नया: आपकी राष्ट्रीय भाषा में पत्राचार!
मुझे निजी सलाहकार के रूप में आपकी और मेरी टीम की सेवा करने में खुशी होगी।
संपर्क फ़ॉर्म भरकर मुझसे संपर्क कर सकते हैं +49 89 89 674 804 (म्यूनिख) पर कॉल कर सकते हैं । मेरा ईमेल पता है: वोल्फेंस्टीन ∂ xpert.digital
मैं हमारी संयुक्त परियोजना की प्रतीक्षा कर रहा हूं।