प्रकाशित तिथि: 21 जुलाई, 2025 / अद्यतन तिथि: 21 जुलाई, 2025 – लेखक: कोनराड वोल्फेंस्टाइन
एक नया "स्पुतनिक मोमेंट"? AI मॉडल: क्या Kimi K3 जल्द आ रहा है? Kimi K2 AI उद्योग में धूम क्यों मचा रहा है? - चित्र: Xpert.Digital
किमी बैंग: चीन का यह एआई मॉडल जीपीटी -4 की तुलना में 10 गुना सस्ता है और बस स्मार्ट है।
चीन की सफलता | कॉम्बैट प्राइस पर ऐ: जब प्रौद्योगिकी अधिक डेमोक्रेटिक बन जाती है
एआई की दुनिया में धूम मची हुई है, और इसके उत्प्रेरक का नाम है: किमी के2। बीजिंग स्थित स्टार्टअप मूनशॉट एआई द्वारा विकसित, यह नया भाषा मॉडल उद्योग में एक वास्तविक "किमी विस्फोट" का कारण बन रहा है और इसे पहले से ही "दूसरा डीपसीक क्षण" कहा जा रहा है - एक ऐसी घटना जो वैश्विक एआई प्रतियोगिता में शक्ति संतुलन को नया रूप दे रही है। लेकिन किमी के2 को इतना खास क्या बनाता है? यह तीन क्रांतिकारी विशेषताओं का एक विस्फोटक संयोजन है: संशोधित एमआईटी लाइसेंस के कारण क्रांतिकारी खुलापन, बेंचमार्क में जीपीटी-4 जैसे दिग्गजों को टक्कर देने वाला प्रभावशाली प्रदर्शन, और एक मूल्य निर्धारण मॉडल जो पश्चिमी प्रतिस्पर्धियों को कई गुना कमतर आंकता है।
"स्पुतनिक क्षण" का रूपक 1957 में संयुक्त राज्य अमेरिका को लगे उस सदमे का वर्णन करता है जब सोवियत संघ ने अप्रत्याशित रूप से पहला उपग्रह—स्पुतनिक 1—अंतरिक्ष में प्रक्षेपित किया। इस घटना ने पश्चिमी जगत को अचानक इस बात का एहसास दिलाया कि एक महत्वपूर्ण तकनीकी क्षेत्र में उसे एक प्रतियोगी ने पीछे छोड़ दिया है। इसका परिणाम एक राष्ट्रीय जागृति थी जिसके कारण विज्ञान और शिक्षा में भारी निवेश हुआ और "अंतरिक्ष दौड़" शुरू हो गई।
एआई में स्थानांतरित, "किमी बैंग" का अर्थ है पश्चिमी तकनीक की दुनिया के लिए एक समान वेक-अप कॉल: एक चीनी कंपनी ने न केवल एक मॉडल विकसित किया है जो प्रमुख जीपीटी -4 के साथ प्रदर्शन में रख सकता है, बल्कि इसे एक खुले स्रोत मॉडल के रूप में और लागत के एक अंश पर भी प्रकाशित कर सकता है। यह तकनीकी और आर्थिक सफलता अमेरिकी कंपनियों के पिछले प्रभुत्व पर सवाल उठाती है जैसे कि Openaai और वैश्विक AI नेतृत्व के आसपास एक नए, कड़े प्रतिस्पर्धा के चरण की शुरुआत का संकेत देता है।
यह अग्रिम प्रभावशाली रूप से साबित करता है कि खुले, स्वतंत्र रूप से उपलब्ध एआई मॉडल न केवल तकनीकी रूप से पकड़ते हैं, बल्कि लागत दक्षता और पहुंच के मामले में एक नए युग में भी प्रवेश करते हैं। स्टार्ट-अप, शोधकर्ताओं और दुनिया भर में कंपनियों के लिए, इसका मतलब है कि संभावनाओं की क्रांति, जबकि ओपनएई और एन्थ्रोपिक जैसे स्थापित खिलाड़ी बड़े पैमाने पर दबाव में हैं। हम अपने आप को आर्किटेक्चर, बेंचमार्क और किमी K2 के दूरगामी निहितार्थों में गहराई से डुबोते हैं और विश्लेषण करते हैं कि क्या चीन से यह "एआई स्पुतनिक पल" कृत्रिम बुद्धिमत्ता के भविष्य को बदल देगा।
किमी K2 तीन विघटनकारी गुणों को जोड़ती है:
- खुलापन - मूनशॉट एआई एक संशोधित एमआईटी लाइसेंस के तहत मॉडल फाइलें प्रकाशित करता है।
- प्रदर्शन - MMLU-Pro जैसे बेंचमार्क में, किमी K2 सार्वजनिक प्रतिस्पर्धियों से बेहतर प्रदर्शन करता है, तथा GPT-4 स्तर के परिणाम प्राप्त करता है।
- लागत - एपीआई प्रति 1 मिलियन इनपुट टोकन पर केवल $0.15 और प्रति 1 मिलियन आउटपुट टोकन पर $2.50 का शुल्क लेता है, जिससे यह शीर्ष पश्चिमी मॉडलों की तुलना में काफी सस्ता है।
के लिए उपयुक्त:
- मूनशॉट एआई से की मॉडल किमी के 2: चीन से नया ओपन सोर्स फ्लैगशिप-ओपन एआई सिस्टम के लिए एक और मील का पत्थर
किमी K2 को कौन विकसित करता है और "किमी बैंग" शब्द का क्या अर्थ है?
2023 में बीजिंग में स्थापित मूनशॉट एआई, बहुत बड़े वॉयस मॉडल पर ध्यान केंद्रित करता है और आंतरिक रूप से "बैंग" के रूप में प्रत्येक बड़े संस्करण प्रकाशन का वर्णन करता है। समुदाय ने उस समय कार्यभार संभाला जब किमी K2 ने 11 जुलाई, 2025 को बेंचमार्क सूची में तूफान मचाया और रिकॉर्ड समय में चेहरे को गले लगाने के लिए डाउनलोड चार्ट का नेतृत्व किया।
पहला "डीपसेक पल" क्या था?
अभिव्यक्ति उस झटके का वर्णन करती है जब पहली बार दीपसेक आर 1 ने जनवरी 2025 में एक खुले मॉडल के रूप में मालिकाना प्रणालियों के तर्क प्रदर्शन को हासिल किया। विश्लेषकों ने एआई ओपन सोर्स के लिए इस कदम की तुलना एआई ओपन सोर्स के लिए "स्पुतनिक पल" से की।
के लिए उपयुक्त:
- तकनीकी शेयरों में कीमतों में गिरावट - चीन से एआई शेयर बाजार में भूकंप: डीपसीक ने संयुक्त राज्य अमेरिका में वैश्विक एआई तकनीक दिग्गजों को हिला दिया
आप एक दूसरे गहरे पल की बात क्यों करते हैं?
किमी के2 ने इस कहानी को दोहराया और पुष्ट किया: एक चीनी स्टार्टअप ने एक निःशुल्क डाउनलोड योग्य एलएलएम प्रकाशित किया है जो न केवल प्रतिस्पर्धा कर सकता है, बल्कि व्यक्तिगत विषयों में हावी भी हो सकता है - लेकिन इस बार MoE आर्किटेक्चर, टूल उपयोग फोकस और यहां तक कि कम परिचालन लागत के साथ।
किमी K2 कैसे बनाया गया है?
- आर्किटेक्चर: 1 ट्रिलियन कुल मापदंडों के साथ मिक्सचर-ऑफ-एक्सपर्ट्स ट्रांसफार्मर, 32 बिलियन प्रति अनुमान सक्रिय हैं।
- संदर्भ विंडो: 128 के टोकन, मल्टी-हेड लेटेंट स्टेशन (एमएलए) द्वारा अनुकूलित।
- ऑप्टिमाइज़र: MuonClip प्रशिक्षण अस्थिरता को कम करता है और ADAMW की ओर अंकगणित खर्चों को कम करता है।
- टूल व्यू: इंस्ट्रक्शन चेकपॉइंट में देशी कार्यान्वित फ़ंक्शन कॉलिंग स्कीमा शामिल हैं।
एक आत्म -हार्डवेयर को किस हार्डवेयर की आवश्यकता है?
परिमाणीकरण के बिना, वज़न −1 टीबी की राशि है। Subreddit /r /localllama में एक धागा 1.152 GB DDR5 और RTX 5090 के साथ $ 10,000 के लिए एक CPU रैम कॉन्फ़िगरेशन की गणना करता है। उत्पादक विलंबता के लिए, Tensorrt-LLM या VLLM-BACK-END के साथ MOONSHOT GPU की सिफारिश करता है।
किमी K2 कोर बेंचमार्क में कैसे करता है?
MONSHOT MMLU पर 87.8%, GSM-8K पर 92.1% और Livecodebech पर 26.3% पास@1 की रिपोर्ट करता है। वेंचरबीट ने SWE-Bench सत्यापित पर 65.8% की पुष्टि की, जिसके साथ किमी K2 कई मालिकाना प्रणालियों से अधिक है।
तुलना के लिए कौन से AI मॉडल हैं?
एआई मॉडल के वर्तमान परिदृश्य में विभिन्न प्रकार के सिस्टम हैं जो विभिन्न गुणों द्वारा विशेषता हैं। तुलनात्मक अवलोकन विभिन्न प्रदाताओं के मॉडल दिखाता है जैसे कि मूनशॉट, डीपसेक, ओपनएई और एन्थ्रोपिक, जिनमें से प्रत्येक की अपनी वास्तुकला और प्रदर्शन सुविधाएँ हैं।
मूनशॉट का किमी K2 मॉडल एक मिश्रित-विशेषज्ञ आर्किटेक्चर (MOE) पर आधारित है, जिसमें कुल 1 ट्रिलियन पैरामीटर है, जिसमें से 32 बिलियन सक्रिय हैं। यह 128,000 वर्णों का एक संदर्भ दायरा प्रदान करता है और MMLU बेंचमार्क में एक उल्लेखनीय 87.8% और SWE-Bench सत्यापित रेटिंग में 65.8% प्राप्त करता है। लागत $ 0.15 प्रति मिलियन इनपुट टोकन और $ 2.50 प्रति मिलियन आउटपुट टोकन हैं।
दीपसेक का R1-0528 मॉडल MOE आर्किटेक्चर, 671 बिलियन कुल मापदंडों और 37 बिलियन सक्रिय मापदंडों के साथ समान विशेषताएं दिखाता है। यह MMLU परीक्षण में 90.8% के साथ KIMI K2 से अधिक है, लेकिन $ 0.55 प्रति मिलियन इनपुट टोकन की थोड़ी अधिक कीमत है।
Openaai और एन्थ्रोपिक जैसे GPT-4O, क्लाउड सॉनेट 4, क्लाउड ओपस 4 और GPT-4.5 पूर्वावलोकन के मॉडल उनकी घने वास्तुकला से भिन्न होते हैं और कभी-कभी प्रकाशित पैरामीटर संख्या नहीं होते हैं। काफी अधिक कीमतें विशेष रूप से हड़ताली हैं, विशेष रूप से GPT-4.5 पूर्वावलोकन मॉडल के लिए $ 75 प्रति मिलियन इनपुट टोकन और $ 150 प्रति मिलियन आउटपुट टोकन के साथ।
तुलना में विशेष रूप से ध्यान देने योग्य क्या है?
- KIMI K2 GPT-4O जैसे लगभग समान MMLU स्कोर तक पहुंचता है, लेकिन केवल प्रति उत्तर 32 B सक्रिय मापदंडों की आवश्यकता होती है।
- दीपसेक R1 ने MMLU पर किमी K2 को हराया, लेकिन सॉफ्टवेयर इंजीनियरिंग बेंचमार्क में कमजोर है।
- मूल्य के संदर्भ में, किमी K2 GPT-4O के तहत 10 का एक कारक है और क्लाउड सॉनेट 4 के तहत 5 का एक कारक है।
मूल्य अंतर कितना कट्टरपंथी है?
विभिन्न एआई मॉडल के बीच मूल्य अंतर उल्लेखनीय हैं और लागत-प्रदर्शन अनुपात में एक नाटकीय बदलाव का वर्णन करते हैं। 1 मिलियन टोकन के लिए एक नमूना गणना महत्वपूर्ण मूल्य अंतर दिखाती है: जबकि किमी के 2 और डीपसेक आर 1 जैसे मॉडल $ 2.65-2.74 प्रति मिलियन टोकन के आसपास बहुत सस्ते हैं, GPT-4O के लिए कीमतें $ 12.50 SONNET 4 पर $ 9.00 और क्लाउड Opus पर हैं। GPT-4.5 की लागत $ 112.50 प्रति मिलियन टोकन पर विशेष रूप से हड़ताली है। यह गणना रेखांकित करती है कि लागत-प्रदर्शन अनुपात चीन से खुले एमओई मॉडल (विशेषज्ञों का मिश्रण) के पक्ष में तेजी से आगे बढ़ रहा है, जो स्थापित पश्चिमी एआई मॉडल की तुलना में काफी सस्ता है।
स्टार्ट-अप और अनुसंधान पर इसका क्या प्रभाव पड़ता है?
अनुकूल टोकन की कीमतें लंबे समय तक संदर्भ खिड़कियों और प्रति प्रयोग अधिक पुनरावृत्तियों को सक्षम करती हैं, जो अनुसंधान को सस्ता बनाती है। इसी समय, उच्च पश्चिमी मूल्य किमी के 2 बुनियादी ढांचे की दिशा में कम-मार्जिन उपयोगकर्ताओं को विस्थापित करते हैं, जैसे कि सिलिकॉनफ्लो या ग्रोक।
ट्रान्साटलांटिक प्रतियोगिता के लिए किमी बैंग का क्या मतलब है?
गोलेम विश्लेषकों के अनुसार, मूनशॉट एआई ओपनाई खुले तौर पर बाहर निकलता है और अमेरिकी कंपनियों को मूल्य कदमों में तेजी लाने के लिए मजबूर करता है। डीपसेक ने कथा शुरू करने के बाद विशेषज्ञ पत्रिकाओं ने "की स्पुतनिक श्रृंखला" के साथ प्रभाव की तुलना की। यूरोप में निवेशक चेतावनी देते हैं कि नियामक जड़ता आगे तकनीकी उत्प्रवास की ओर ले जाती है।
बाजार के नेता कैसे प्रतिक्रिया देते हैं?
अप्रैल 2025 में, Openaai ने ओपन सोर्स प्रिंट का मुकाबला करने के लिए पहली बार अपने ओपन वेट मॉडल की घोषणा की। एंथ्रोपिक अब 90%तक की आक्रामक कैश छूट प्रदान करता है, लेकिन किमी के 2 के पीछे रहता है।
Muonclip महत्वपूर्ण क्यों है?
मूनशॉट और यूसीएलए दिखाते हैं कि मोनक्लिप अरब डॉलर में अस्थिरता को कम करता है और एडमव की मेमोरी खपत को कम करता है। यह बिना किसी ब्रेक -ऑफ के 15.5 ट्रिलियन टोकन प्रशिक्षण को सक्षम करता है।
मिश्रण-के-विशेषज्ञ डिजाइन क्या भूमिका निभाते हैं?
MOE प्रति टोकन विशेष विशेषज्ञों के केवल एक सबसेट को सक्रिय करता है। यह कंप्यूटिंग समय और बिजली की खपत को कम करता है, जबकि पैरामीटर की कुल संख्या अधिक है। दूसरी ओर, GPT-4O और क्लाउड, घने आर्किटेक्चर का उपयोग करते हैं और क्या लागत के सभी भारों की गणना करनी होती है।
संशोधित सह-लाइसेंस क्या शामिल है?
यह वाणिज्यिक उपयोग, पासिंग और सबलिसेंट की अनुमति देता है, लेकिन स्रोत और लाइसेंस को संदर्भित करने के लिए बाध्य करता है। इसका मतलब यह है कि किमी K2 का उपयोग ऑन-प्रेम्य वातावरण में किया जा सकता है, जो विशेष रूप से यूरोपीय डेटा सुरक्षा आवश्यकताओं को संबोधित करता है।
क्या अंधेरे पक्ष हैं?
शोधकर्ताओं ने आलोचना की कि किमी के 2 ने चीनी इतिहास में ऐतिहासिक घटनाओं को चमकाया और इस तरह पूर्वाग्रह है। यह भी डर है कि खुलापन अवांछनीय अनुप्रयोगों को आसान बनाता है, जैसे कि स्वचालित विघटन।
एजेंट इंटेलिजेंस: क्या किमी K2 स्वायत्त एआई एजेंटों के लिए एक कदम है?
हाँ। मूनशॉट ने स्पष्ट रूप से उपकरण -उपयोग और फ़ंक्शन कॉलिंग को प्रशिक्षित किया, ताकि किमी K2 स्वतंत्र रूप से ऑर्केस्ट्रेट कर सके। वेंचरबीट एक अद्वितीय विक्रय बिंदु के रूप में एजेंट कौशल पर जोर देता है। यह किमी K2 को दीपसेक R1 से अलग करता है, जो मुख्य रूप से तर्क को प्रकट करता है, लेकिन एजेंट फ्रेमवर्क पर निर्भर उपकरण-उपयोग करता है।
वर्कफ़्लोज़ में एकीकरण: मैं किमी K2 को मौजूदा Openai पाइपलाइनों में कैसे एकीकृत करूं?
मूनशॉट Openai- संगत समापन बिंदु प्रदान करता है, जिससे अनुरोधित तापमान आंतरिक रूप से 0.6 हो जाता है। डेवलपर्स को केवल आधार URL का आदान -प्रदान करना होगा और बिना किसी बदलाव के लैंगचेन या Llamaindex जैसे उपकरणों का उपयोग कर सकते हैं।
टूल कॉलिंग के लिए सबसे अच्छी प्रथाएं क्या हैं?
- एक JSON योजना के रूप में सौंपे गए कार्यों।
- नियतात्मक उपकरण कॉल को बल देने के लिए तापमान 0.6 पकड़ो।
- मतिभ्रम को कम करने के लिए प्रतिबिंब संकेत के साथ परिणाम की जाँच करें।
किस क्लाउड प्रदाता ने किमी K2 की मेजबानी की?
सिलिकॉनफ्लो, आतिशबाजी एआई और ग्रोक 100 के टीपीएम तक थ्रूपुट के साथ पे-प्रति-टोकन्स की पेशकश करते हैं।
यूरोप कैसे पकड़ सकता है?
विश्लेषकों को एक अनुकूल बिजली आपूर्ति के साथ अपने स्वयं के मॉडल को प्रशिक्षित करने के लिए यूएस मॉडल पर आधारित "एआई गिगाफैक्टरी" की आवश्यकता होती है। तब तक, यूरोप किमी K2 जैसे खुले मॉडल पर भरोसा कर सकता है और ऊर्ध्वाधर फ़िनिट्यून्स पर ध्यान केंद्रित कर सकता है।
आवेदन के कौन से विशिष्ट क्षेत्र पहले लाभान्वित होते हैं?
- कोड सहायता: KIMI-DEV-72B किमी-K2 डेटा का उपयोग करता है और 60.4% SWE-Bench तक पहुंचता है।
- दस्तावेज़ विश्लेषण: 128 K संदर्भ विंडो लंबी राय को सक्षम करती है।
- डेटा पाइपलाइनों: 0.54 एस पहले टोकन की कम विलंबता वास्तविक समय चैटबॉट को यथार्थवादी बनाती है।
मुख्य जोखिम क्या हैं?
- महत्वपूर्ण विषयों में पूर्वाग्रह और सेंसरशिप।
- सार्वजनिक एपीआई के माध्यम से डेटा बहिर्वाह।
- एमओई के बावजूद ऑन-प्रिमाइफ इन्फ्रेंस के लिए हार्डवेयर की लागत अभी भी अधिक है।
क्या किमी K2 स्थायी रूप से पश्चिमी कीमतों को दबाएगी?
मूल्य दबाव पहले से ही उपयोग किया जा चुका है: Openai ने GPT-4O को बारह महीने से भी कम समय में तीन बार कम कर दिया। कैश तंत्र द्वारा क्लाउड अंडरकट पहले टैरिफ। विश्लेषकों ने किमी के 2 को टोकन की कीमतों के लिए "दौड़ से नीचे की दौड़" के लिए एक उत्प्रेरक के रूप में देखा, जो कि AWS के समान क्लाउड मार्केट 2010 के समान है।
क्या किमी K3 जल्द ही आएगी?
मूनशॉट ने मल्टीमॉडल वर्ल्ड मॉडल और सेल्फ -इम्प्रूविंग आर्किटेक्चर को अगले मील के पत्थर के रूप में नाम दिया। इनसाइडर लीक्स 512 K टोकन और पेगासस अनुकूलन के लिए एक संदर्भ विंडो की बात करते हैं। हालांकि, कंपनी आधिकारिक तौर पर रोडमैप पर टिप्पणी नहीं करती है।
"दूसरे दीपसेक पल" के क्या अवशेष हैं?
किमी K2 साबित करता है कि खुले मॉडल न केवल ऊपर रख सकते हैं, बल्कि कीमत के मामले में भी हावी हो सकते हैं। सत्ता की आवाजाही, नवाचार को प्रेरित करती है और सभी प्रदाताओं को अधिक पारदर्शिता बनाने के लिए मजबूर करती है। कंपनियों के लिए, एक नया लागत आधार बनाया जाता है, शोधकर्ताओं के लिए एक समृद्ध परीक्षण क्षेत्र, और नियामकों के लिए खुले विकास की गति के साथ दबाव बनाए रखने के लिए दबाव।
किमी बैंग इस प्रकार एक म्यान को चिह्नित करता है: जो लोग खुलेपन और दक्षता को जोड़ते हैं, वे भविष्य में एआई अर्थव्यवस्था के मानकों को निर्धारित करेंगे।
के लिए उपयुक्त:
आपका एआई परिवर्तन, एआई एकीकरण और एआई प्लेटफॉर्म उद्योग विशेषज्ञ
☑️ हमारी व्यावसायिक भाषा अंग्रेजी या जर्मन है
☑️ नया: आपकी राष्ट्रीय भाषा में पत्राचार!
मुझे निजी सलाहकार के रूप में आपकी और मेरी टीम की सेवा करने में खुशी होगी।
संपर्क फ़ॉर्म भरकर मुझसे संपर्क कर सकते हैं +49 89 89 674 804 (म्यूनिख) पर कॉल कर सकते हैं । मेरा ईमेल पता है: वोल्फेंस्टीन ∂ xpert.digital
मैं हमारी संयुक्त परियोजना की प्रतीक्षा कर रहा हूं।