वेबसाइट आइकन विशेषज्ञ.डिजिटल

मूनशॉट एआई से की मॉडल किमी के 2: चीन से नया ओपन सोर्स फ्लैगशिप-ओपन एआई सिस्टम के लिए एक और मील का पत्थर

एआई मॉडल किमी के 2: चीन से नया ओपन सोर्स फ्लैगशिप-ओपन एआई सिस्टम के लिए एक और मील का पत्थर

KI मॉडल KIMI K2: चीन से नया ओपन सोर्स फ्लैगशिप-एक और मीलस्टोन फॉर ओपन KI सिस्टम्स-इमेज: Xpert.Digital

ट्रिलियन पैरामीटर मॉडल किमी K2 यूरोप में संप्रभु एआई विकास के लिए दूर भागता है

एक अन्य खुला स्रोत क्रांति: किमी K2 यूरोपीय डेटा केंद्रों में विश्व स्तरीय एआई लाता है

किमी K2 खुले एआई पारिस्थितिकी तंत्र को एक नए स्तर पर लाता है। एक ट्रिलियन मापदंडों के साथ मिक्स-ऑफ-एक्सपर्ट्स मॉडल यथार्थवादी प्रोग्रामिंग, गणित और एजेंट बेंचमार्क में मालिकाना हैवीवेट के साथ परिणाम प्रदान करता है-साथ लागतों के एक अंश और पूरी तरह से प्रकाशित वजन के साथ। जर्मनी में डेवलपर्स के लिए, यह मौजूदा प्रक्रियाओं को एम्बेड करने और नए उत्पादों को विकसित करने के लिए उच्च-प्रदर्शन एआई सेवाओं की मेजबानी करने का अवसर खोलता है।

के लिए उपयुक्त:

क्यों किमी K2 अगले बड़े एआई मॉडल से अधिक है

जबकि वेस्टर्न लैब जैसे कि ओपनएई और एन्थ्रोपिक भुगतान किए गए इंटरफेस के पीछे अपने सर्वश्रेष्ठ मॉडल को छिपाते हैं, मोनशॉट एआई एक अलग कोर्स का पीछा कर रहा है: सभी वेट सार्वजनिक रूप से एक संशोधित सह-लाइसेंस के तहत उपलब्ध हैं। यह कदम न केवल वैज्ञानिक प्रतिलिपि प्रस्तुत करने योग्यता को संभव बनाता है, बल्कि छोटे और मध्यम आकार की कंपनियों को अपने स्वयं के अनुमान क्लस्टर बनाने या एज परिदृश्यों में किमी K2 का उपयोग करने की अनुमति देता है। शुरुआत एक ऐसे चरण में आती है जिसमें चीन को ओपन सोर्स एलएलएम मूवमेंट की घड़ी के रूप में स्थापित किया जाता है; दीपसेक वी 3 को जून तक एक बेंचमार्क माना जाता था, अब किमी K2 फिर से क्रॉसबार सेट करता है।

वास्तुकला और प्रशिक्षण प्रक्रिया

एक रिकॉर्ड स्तर पर मिश्रण-विशेषज्ञ

KIMI K2 384 विशेषज्ञों के साथ एक अभिनव विशेषज्ञ प्रणाली का निर्माण करता है, जिससे केवल आठ विशेषज्ञ और एक वैश्विक "साझा विशेषज्ञ" प्रति टोकन सक्रिय हैं। यह आर्किटेक्चर एक ही समय में रैम में केवल 32 बिलियन मापदंडों को लोड करने में सक्षम बनाता है, जो GPU लोड को काफी कम कर देता है। जबकि पूर्ण परिशुद्धता में एक घने 70 बिलियन पैरामीटर मॉडल को पहले से ही दो H100 GPU की आवश्यकता होती है, KIMI K2 तुलनीय या बेहतर गुणवत्ता प्राप्त करता है, हालांकि यह केवल एक ही GPU पर वजन का एक तिहाई निष्पादित करता है।

अन्य मॉडलों की तुलना में, किमी K2 की दक्षता स्पष्ट है: कुल 1,000 बिलियन मापदंडों के साथ, डीपसेक वी 3-बेस 671 बिलियन मापदंडों से अधिक है और लगभग 1,800 बिलियन मापदंडों के साथ GPT-4.1 के अनुमानित मूल्य से नीचे है। किमी K2 के साथ, प्रति टोकन केवल 32 बिलियन पैरामीटर सक्रिय रहते हैं, जबकि डीपसेक वी 3 बेस में 37 बिलियन की तुलना में। किमी K2 विशेषज्ञ प्रणाली 384 विशेषज्ञों का उपयोग करती है, जिनमें से आठ का चयन किया जाता है, जबकि दीपसेक V3-Base आठ निर्वाचित 240 विशेषज्ञों का उपयोग करता है। सभी तीन मॉडल 128K टोकन की एक संदर्भ लंबाई का समर्थन करते हैं।

इस विकास से पता चलता है कि मूनशॉट पहली बार एक ट्रिलियन मापदंडों के साथ एक सार्वजनिक मॉडल जारी करता है और अभी भी प्रति टोकन 40 बिलियन पैरामीटर सीमा के तहत रहता है, जो बड़ी भाषा मॉडल की दक्षता में एक महत्वपूर्ण प्रगति है।

MuonClip - एक नए मानक पर स्थिरीकरण

सुपर मजबूत एमओई ट्रांसफॉर्मर का प्रशिक्षण अक्सर ध्यान देने वाले लॉग्स को विस्फोट करने से ग्रस्त होता है। मूनशॉट इसलिए टोकन-कुशल म्यूऑन ऑप्टिमाइज़र को डाउनस्ट्रीम "क्यूके-क्लिप" फ्रैलाइज़ेशन के साथ जोड़ता है, जो प्रत्येक चरण के बाद क्वेरी और प्रमुख मैट्रिसेस को सामान्य करता है। मूनशॉट के अनुसार, 15.5 ट्रिलियन ट्रेनिंग टोकन में एक भी लॉस-स्पाइक दिखाई नहीं दिया। परिणाम एक अत्यंत चिकनी सीखने की अवस्था और एक मॉडल है जो पहली रिलीज से स्थिर काम करता है।

डेटाबेस

15.5 ट्रिलियन टोकन के साथ, किमी K2 GPT-4 वर्ग मॉडल के डेटा वॉल्यूम तक पहुंचता है। क्लासिक वेब टेक्स्ट और कोड के अलावा, सिम्युलेटेड टूल कॉल और वर्कफ़्लो डायलॉग्स ने अभिनय करने के लिए एंकर क्षमता के लिए पूर्व-प्रशिक्षण में प्रवाहित किया। डीपसेक आर 1 के विपरीत, एजेंट सक्षमता मुख्य रूप से चेन-ऑफ-स्विंग-सुपरविज़न पर आधारित नहीं है, लेकिन सीखने के परिदृश्यों पर जिसमें मॉडल को कई एपीआई को ऑर्केस्ट्रेट करना था।

विस्तार से बेंचमार्क सेवाएं

बेंचमार्क सेवाएं जिम्मेदारी के विभिन्न क्षेत्रों में तीन एआई मॉडल के बीच विस्तृत तुलना दिखाती हैं। प्रोग्रामिंग क्षेत्र में, किमी K2-Instr। SWE-Bench सत्यापित परीक्षण में, 65.8 प्रतिशत की सफलता दर, जबकि DeepSeek V3 ने 38.8 प्रतिशत और GPT-4.1 के साथ 54.6 प्रतिशत के साथ प्रदर्शन किया। Livecodebench V6 में, किमी K2-Instr। 53.7 प्रतिशत पर, इसके बाद 49.2 प्रतिशत के साथ दीपसेक वी 3 और 44.7 प्रतिशत के साथ जीपीटी -4.1। औसत चार प्रयासों के साथ TAU2 खुदरा परीक्षण में टूल युग्मन में, GPT-4.1 किमी K2-Instr से ठीक 74.8 प्रतिशत के साथ सर्वश्रेष्ठ प्रदर्शन प्राप्त करता है। 69.1 प्रतिशत के साथ 70.6 प्रतिशत और दीपसेक वी 3 के साथ। एक सटीक समझौते के साथ गणित -500 गणित श्रेणी में, किमी K2-Instr। 97.4 प्रतिशत के साथ, उसके बाद 94.0 प्रतिशत के साथ दीपसेक वी 3 और 92.4 प्रतिशत के साथ जीपीटी -4.1। एक प्रतिबिंब अवधि के बिना सामान्य ज्ञान परीक्षण MMLU में, GPT-4.1 90.4 प्रतिशत सबसे अच्छा करता है, जो किमी K2-Instr द्वारा निकटता से हुआ। 89.5 प्रतिशत के साथ, जबकि डीपसेक वी 3 81.2 प्रतिशत के साथ नीचे बनाता है।

परिणामों की व्याख्या

  1. यथार्थवादी कोडिंग परिदृश्यों में, किमी K2 स्पष्ट रूप से पिछले सभी खुले स्रोत मॉडल के सामने है और SWE-Bench सत्यापित GPT-4 .1 को धड़कता है।
  2. गणित और प्रतीकात्मक सोच लगभग सही है; मॉडल भी मालिकाना प्रणालियों से अधिक है।
  3. शुद्ध विश्व ज्ञान के साथ, GPT-4 .1 अभी भी आगे है, लेकिन दूरी पहले से कहीं अधिक है।

रोजमर्रा की जिंदगी में एजेंट कौशल

कई एलएलएम अच्छी तरह से समझाते हैं, लेकिन कार्य नहीं करते हैं। KIMI K2 को लगातार स्वायत्त रूप से टूल कॉल, कोड संस्करण और फ़ाइल अनुकूलन को पूरा करने के लिए प्रशिक्षित किया गया था।

उदाहरण 1: व्यापार यात्रा योजना

मॉडल 17 एपीआई कॉल: कैलेंडर, फ्लाइट एग्रीगेटर, ट्रेन एपीआई, ओपेंटेबल, कंपनी ईमेल, Google शीट-विथआउट मैनुअल प्रॉम्प्ट इंजीनियरिंग में एक जांच ("बुक फ्लाइट, होटल और बर्लिन में तीन लोगों के लिए टेबल और टेबल और टेबल" को समाप्त कर देता है।

उदाहरण 2: डेटा विश्लेषण

50,000 वेतन डेटा सेट के साथ एक CSV को पढ़ा जाता है, सांख्यिकीय रूप से मूल्यांकन किया जाता है, एक प्लॉट उत्पन्न और एक इंटरैक्टिव HTML पृष्ठ के रूप में सहेजा जाता है। पूरी श्रृंखला एक ही चैट जिम में चलती है।

वह महत्वपूर्ण क्यों है?

  • उत्पादकता: मॉडल प्रतिक्रिया केवल पाठ नहीं है, बल्कि एक निष्पादन योग्य कार्रवाई है।
  • त्रुटि मजबूती: वर्कफ़्लोज़ पर आरएल प्रशिक्षण के माध्यम से, किमी K2 त्रुटि संदेशों की व्याख्या करना और खुद को सही करना सीखता है।
  • लागत: एक स्वचालित एजेंट मानव हैंडओवर को बचाता है और संदर्भ लागत को कम करता है क्योंकि कम गोल यात्राएं आवश्यक हैं।

लाइसेंस, लागत और परिचालन परिणाम

लाइसेंस

वेट एक एमआईटी-जैसे लाइसेंस के अधीन हैं। केवल 100 मिलियन से अधिक मासिक सक्रिय उपयोगकर्ताओं या प्रति माह $ 20 मिलियन से अधिक बिक्री वाले उत्पादों के लिए UI में मूनशॉट को एक दृश्यमान "किमी K2" नोट की आवश्यकता होती है। यह अधिकांश जर्मन कंपनियों के लिए अप्रासंगिक है।

एपीआई और आत्म-मेजबानी की कीमतें

एपीआई और स्व-होस्टिंग की कीमतें प्रदाताओं के बीच स्पष्ट अंतर दिखाती हैं। जबकि मोनशॉट एपीआई इनपुट टोकन के लिए $ 0.15 और आउटपुट टोकन के लिए $ 2.50 प्रति मिलियन की गणना करता है, डीपसेक-एपीआई की लागत इनपुट के लिए $ 0.27 और आउटपुट के लिए यूएसडी 1.10 है। इनपुट के लिए औसत $ 10.00 और आउटपुट के लिए $ 30.00 के साथ, GPT-4 O API काफी अधिक महंगा है।

एमओई प्रौद्योगिकी के माध्यम से लागत दक्षता विशेष रूप से उल्लेखनीय है: क्लाउड लागत बेहद प्रतिस्पर्धी हो गई है। एक व्यावहारिक उदाहरण यह दिखाता है: एक डेवलपर केवल किमी K2 के साथ 2,000 टोकन चैट के लिए $ 0.005 का भुगतान करता है, जबकि GPT-4 के साथ एक ही चैट में चार डॉलर खर्च होते हैं।

इन-हाउस ऑपरेशन के लिए हार्डवेयर प्रोफाइल

  • पूर्ण मॉडल (FP16): कम से कम 8 × H100 80 GB या 4 × B200।
  • 4-बिट परिमाणीकरण: 2 × H100 या 2 × Apple M3 अल्ट्रा 512 GB पर स्थिर चलता है।
  • Inference Engine: VLLM, SGLANG और TENSORRT-LLM का समर्थन किमी K2 मूल रूप से।

यूरोप में आवेदन के व्यावहारिक क्षेत्र

  1. उद्योग 4.0: स्वचालित रखरखाव योजनाएं, त्रुटि निदान और स्पेयर पार्ट्स ऑर्डर को एक एजेंट प्रवाह के रूप में तैयार किया जा सकता है।
  2. मध्यम आकार के व्यवसाय: स्थानीय चैट बॉट्स यूएस सर्वर को डेटा भेजे बिना वास्तविक समय में आपूर्तिकर्ता और ग्राहक पूछताछ का जवाब देते हैं।
  3. हेल्थकेयर: क्लीनिक किमी के 2 का उपयोग कोडेज डॉक्टर के पत्रों, डीआरजी मामलों की गणना और परिसर में समन्वय समन्वय-सब कुछ परिसर में करते हैं।
  4. अनुसंधान और शिक्षण: विश्वविद्यालय एचपीसी समूहों में मॉडल की मेजबानी करते हैं ताकि छात्रों को नवीनतम एलएलएम के साथ मुफ्त प्रयोगों को सक्षम किया जा सके।
  5. अधिकारियों: सार्वजनिक संस्थानों को स्रोत-खुले वजन से लाभ होता है क्योंकि डेटा सुरक्षा आवश्यकताओं से मालिकाना क्लाउड मॉडल का उपयोग करना मुश्किल हो जाता है।

उत्पादक संचालन के लिए सर्वोत्तम अभ्यास

विभिन्न सिद्ध प्रथाओं ने एआई सिस्टम के उत्पादक संचालन के लिए खुद को स्थापित किया है। चैट सहायकों के मामले में, तथ्यात्मक उत्तर सुनिश्चित करने के लिए तापमान को 0.2 से 0.3 पर सेट किया जाना चाहिए, जबकि शीर्ष पी मान अधिकतम 0.8 होना चाहिए। कोड जनरेशन के लिए, सिस्टम प्रॉम्प्ट को स्पष्ट रूप से परिभाषित करना महत्वपूर्ण है, उदाहरण के लिए "आप एक सटीक पायथन सहायक हैं" और विश्वसनीय परीक्षणों को लागू करने के लिए। टूल कॉल के मामले में, JSON योजना को सख्ती से निर्दिष्ट किया जाना चाहिए ताकि मॉडल प्रारूप फ़ंक्शन सही तरीके से कॉल करें। RAG पाइपलाइनों में 800 टोकन के एक चंक आकार के साथ सबसे अच्छा काम किया जाता है और पुनर्प्राप्ति से पहले BGE-Rerank-L जैसे क्रॉस-एन्कोडर के साथ फिर से रैंकिंग। सुरक्षा के लिए, एक सैंडबॉक्स में आउटगोइंग कमांड को पूरा करने के लिए आवश्यक है, उदाहरण के लिए एक पटाखा वीएम में, इंजेक्शन जोखिमों को कम करने के लिए।

के लिए उपयुक्त:

चुनौतियां और सीमाएँ

स्मृति पदचिह्न

यद्यपि केवल 32 बी पैरामीटर सक्रिय हैं, राउटर को सभी विशेषज्ञ भार रखना चाहिए। एक शुद्ध सीपीयू अनुमान इसलिए अवास्तविक है।

उपकरण निर्भरता

गलत तरीके से परिभाषित उपकरण अंतहीन छोरों की ओर ले जाते हैं; मजबूत त्रुटि हैंडलिंग अनिवार्य है।

दु: स्वप्न

पूरी तरह से अज्ञात एपीआई के मामले में, मॉडल फ़ंक्शन आविष्कार कर सकते हैं। एक सख्त सत्यापनकर्ता आवश्यक है।

लाइसेंस खंड

मजबूत उपयोगकर्ता विकास के साथ, ब्रांडिंग दायित्व चर्चा के अधीन हो सकता है।

नैतिकता और निर्यात नियंत्रण

खुलापन संभावित रूप से अनुचित अनुप्रयोग भी करता है; कंपनियां फ़िल्टर सिस्टम के लिए जिम्मेदार हैं।

एक नवाचार इंजन के रूप में खुला स्रोत

मूनशॉट एआई के चरण से पता चलता है कि खुले मॉडल न केवल मालिकाना विकल्प के बाद चलते हैं, बल्कि कुछ क्षेत्रों पर भी हावी होते हैं। चीन में, एक पारिस्थितिकी तंत्र विश्वविद्यालयों, स्टार्ट-अप और क्लाउड प्रदाताओं से बनाया जाता है जो संयुक्त अनुसंधान और आक्रामक मूल्य निर्धारण के साथ विकास में तेजी लाते हैं।

यूरोप के लिए एक दोहरा लाभ है:

  • विक्रेता-लॉक-इन और यूरोपीय डेटा संप्रभुता के तहत तकनीकी पहुंच।
  • वाणिज्यिक प्रदाताओं की लागत दबाव, जो कि मध्यम अवधि के उचित मूल्य में तुलनीय प्रदर्शन के साथ उम्मीद की जा सकती है।

लंबी अवधि में यह उम्मीद की जा सकती है कि अन्य ट्रिलियन-मो मॉडल दिखाई देंगे, शायद मल्टीमॉडल भी। यदि मूनशॉट प्रवृत्ति का अनुसरण करता है, तो दृष्टि या ऑडियो एक्सटेंशन खोले जा सकते हैं। नवीनतम तब सर्वश्रेष्ठ "ओपन एजेंट" के लिए प्रतियोगिता एआई अर्थव्यवस्था का केंद्रीय चालक बन जाती है।

कोई और अधिक महंगा ब्लैक बॉक्स एपीआई: किमी के 2 ने एआई विकास को लोकतांत्रित किया

किमी K2 एक टर्निंग पॉइंट को चिह्नित करता है: यह शीर्ष प्रदर्शन, एक ही पैकेज में कार्य करने और वजन खोलने की क्षमता को जोड़ती है। यूरोप में डेवलपर्स, शोधकर्ताओं और कंपनियों के लिए, इसका मतलब है कि पसंद की वास्तविक स्वतंत्रता: महंगे ब्लैक बॉक्स एपीआई पर भरोसा करने के बजाय, आप एक सस्ती, शक्तिशाली एआई आधार को संचालित, अनुकूलन और एकीकृत कर सकते हैं। जो कोई भी एक प्रारंभिक चरण में एजेंट वर्कफ़्लो और एमओई इन्फ्रास्ट्रक्चर के साथ अनुभव प्राप्त करता है, वह यूरोपीय बाजार में एक स्थायी प्रतिस्पर्धात्मक लाभ बनाता है।

के लिए उपयुक्त:

 

आपका वैश्विक विपणन और व्यवसाय विकास भागीदार

☑️ हमारी व्यावसायिक भाषा अंग्रेजी या जर्मन है

☑️ नया: आपकी राष्ट्रीय भाषा में पत्राचार!

 

कोनराड वोल्फेंस्टीन

मुझे निजी सलाहकार के रूप में आपकी और मेरी टीम की सेवा करने में खुशी होगी।

संपर्क फ़ॉर्म भरकर मुझसे संपर्क कर सकते हैं +49 89 89 674 804 (म्यूनिख) पर कॉल कर सकते हैं । मेरा ईमेल पता है: वोल्फेंस्टीन xpert.digital

मैं हमारी संयुक्त परियोजना की प्रतीक्षा कर रहा हूं।

 

 

☑️ रणनीति, परामर्श, योजना और कार्यान्वयन में एसएमई का समर्थन

☑️ डिजिटल रणनीति और डिजिटलीकरण का निर्माण या पुनर्संरेखण

☑️ अंतर्राष्ट्रीय बिक्री प्रक्रियाओं का विस्तार और अनुकूलन

☑️ वैश्विक और डिजिटल B2B ट्रेडिंग प्लेटफॉर्म

☑️ पायनियर बिजनेस डेवलपमेंट/मार्केटिंग/पीआर/व्यापार मेले

मोबाइल संस्करण से बाहर निकलें