पर प्रकाशित: 31 मई, 2025 / अपडेट से: 31 मई, 2025 - लेखक: कोनराड वोल्फेंस्टीन
दीपसेक-आर 1-0528: डीपसेक अपडेट पश्चिमी उद्योग के नेताओं-छवि के साथ आंखों के स्तर पर चीनी एआई मॉडल को वापस लाता है: Xpert.Digital
सीमा पर ओपन सोर्स एआई: दीपसेक शेड में ओपनई और गूगल करता है
60 से 68 तक: दीपसेक ने चीनी एआई को शीर्ष पर वापस रखा
28 मई, 2025 को दीपसेक-आर 1-0528 के प्रकाशन के साथ, चीनी की स्टार्टअप दीपसेक ने एक महत्वपूर्ण मील का पत्थर हासिल किया जिसने वैश्विक एआई परिदृश्य को फिर से परिभाषित किया है। ओपन सोर्स रीडेरिंग मॉडल का अपडेट नाटकीय प्रदर्शन में वृद्धि को दर्शाता है और पहली बार ओपनस ओ 3 और गूगल जेमिनी 2.5 प्रो के समान स्तर पर डीपसेक की स्थिति है। यह विशेष रूप से उल्लेखनीय है कि यह शीर्ष प्रदर्शन लागतों के एक अंश के साथ और पूरी तरह से खुले मॉडल भार के साथ प्राप्त किया जाता है, जो मालिकाना एआई प्रणालियों के भविष्य के बारे में मौलिक प्रश्न उठाता है। स्वतंत्र रेटिंग प्लेटफॉर्म आर्टिफिशियल एनालिसिस 68 अंकों के साथ नए मॉडल को वर्गीकृत करता है - 60 से 68 अंकों की कूदने से ओपनईएआई ओ 1 और ओ 3 के बीच प्रदर्शन अंतर से मेल खाता है।
के लिए उपयुक्त:
अद्यतन और इसके तकनीकी सुधार
दीपसेक-आर 1-0528 एक पर्याप्त आगे के विकास का प्रतिनिधित्व करता है, जिसे बुनियादी वास्तुकला में किसी भी बदलाव की आवश्यकता नहीं होती है, लेकिन एल्गोरिथम अनुकूलन के माध्यम से पोस्ट-ट्रेनिंग में महत्वपूर्ण वृद्धि और अंकगणित संसाधनों के उपयोग में वृद्धि को प्राप्त करता है। अपडेट मुख्य रूप से तर्क कौशल में सुधार करने पर केंद्रित है और, दीपसेक के अनुसार, "काफी गहरी सोच प्रक्रियाओं" को सक्षम करता है। इस सुधार का एक विशेष रूप से प्रभावशाली उदाहरण Aime 2025 गणित परीक्षण में दिखाता है, जहां सटीकता 70 प्रतिशत से बढ़कर 87.5 प्रतिशत हो गई। इसी समय, प्रति प्रश्न टोकन की औसत संख्या 12,000 से बढ़कर 23,000 टोकन हो गई, जो अधिक गहन प्रसंस्करण प्रक्रियाओं को इंगित करती है।
तर्क में सुधार के अलावा, अपडेट महत्वपूर्ण नई कार्यक्षमताओं का परिचय देता है, जिसमें JSON आउटपुट और कार्यात्मक दृश्य, एक अनुकूलित उपयोगकर्ता इंटरफ़ेस और कम मतिभ्रम शामिल हैं। ये नवाचार डेवलपर्स के लिए मॉडल को अधिक व्यावहारिक बनाते हैं और इसके दायरे का विस्तार करते हैं। उपलब्धता अपरिवर्तित रहती है: मौजूदा एपीआई उपयोगकर्ता स्वचालित रूप से अपडेट प्राप्त करते हैं, जबकि मॉडल वेट अभी भी गले लगाने के लिए खुले सह-लाइसेंस के तहत उपलब्ध हैं।
बेंचमार्क प्रदर्शन और प्रदर्शन तुलना
दीपसेक-आर 1-0528 के बेंचमार्क परिणाम सभी मूल्यांकन श्रेणियों में प्रभावशाली सुधार दिखाते हैं। गणितीय कार्यों में, Aime 2024 मूल्य 79.8 से बढ़कर 91.4 प्रतिशत, HMMT 2025 41.7 से 79.4 प्रतिशत और CNMO 2024 78.8 से 86.9 प्रतिशत तक बढ़ गया। ये परिणाम दुनिया भर में गणितीय समस्या समाधान के लिए सबसे शक्तिशाली एआई प्रणालियों में से एक के रूप में मॉडल को स्थान देते हैं।
प्रोग्रामिंग बेंचमार्क के साथ, डीपसेक-आर 1-0528 भी महत्वपूर्ण प्रगति दिखाता है। Livecodebech 63.5 से 73.3 प्रतिशत तक, Aider पॉलीग्लोट को 53.3 से 71.6 प्रतिशत और SWE ने 49.2 से 57.6 प्रतिशत तक सत्यापित किया। कोडफोर्स रेटिंग 1,530 से 1,930 अंक तक चढ़ गई, जो एल्गोरिथम समस्या समाधानों के शीर्ष समूह में मॉडल को वर्गीकृत करती है। प्रतिस्पर्धी मॉडल की तुलना में, डीपसेक-आर 1 एसडब्ल्यूई सत्यापित में 49.2 प्रतिशत तक पहुंचता है और इसलिए 48.9 प्रतिशत के साथ ओपनएईएआई ओ 1-1217 से आगे है, जबकि 96.3 प्रतिशत के साथ कोडफोर्स और 2029 अंक की ईएलओ रेटिंग ओपनैस के बहुत करीब है।
सामान्य ज्ञान और तर्क परीक्षण प्रदर्शन में व्यापक वृद्धि की पुष्टि करते हैं: GPQA-Diamond 71.5 से बढ़कर 81.0 प्रतिशत, मानवता की अंतिम परीक्षा 8.5 से 17.7 प्रतिशत, MMLU-PRO 84.0 से 85.0 प्रतिशत और MMLU-REDUX 92.9 से 93.4 प्रतिशत तक बढ़ा। केवल Openais Simpleqa के साथ 30.1 से 27.8 प्रतिशत तक मामूली गिरावट थी। ये व्यापक सुधार दस्तावेज है कि दीपसेक-आर 1-0528 न केवल विशेष क्षेत्रों में प्रतिस्पर्धी है, बल्कि संज्ञानात्मक कार्यों के पूरे स्पेक्ट्रम में भी प्रतिस्पर्धी है।
तकनीकी वास्तुकला और नवाचार
डीपसेक-आर 1-0528 का तकनीकी आधार एक उच्च विकसित एमओई (विशेषज्ञों का मिश्रण) आर्किटेक्चर पर आधारित है, जिसमें कुल 671 बिलियन मापदंडों से 37 बिलियन सक्रिय मापदंडों और 128,000 टोकन की संदर्भ लंबाई है। मॉडल स्व -चेक, मल्टी -स्टेज प्रतिबिंब और मनुष्यों के अनुरूप तर्क देने की क्षमता प्राप्त करने के लिए उन्नत शुद्धिकरण सीखने को लागू करता है। यह आर्किटेक्चर मॉडल को पुनरावृत्त सोच प्रक्रियाओं के माध्यम से जटिल तर्क कार्यों का प्रबंधन करने में सक्षम बनाता है, जो पारंपरिक आवाज मॉडल के बीच अंतर करता है।
एक विशेष रूप से अभिनव पहलू एक डिस्टिल्ड वेरिएंट, डीपसेक-आर 1-0528-QWEN3-8B का विकास है, जिसे Qwen3-8B बेस के बाद के प्रशिक्षण के लिए दीपसेक-R1-0528 के विचारों को दूर करके बनाया गया था। यह छोटा संस्करण काफी कम संसाधन आवश्यकताओं के साथ प्रभावशाली सेवाओं को प्राप्त करता है और इसे 8-12 जीबी वीआरएएम के साथ जीपीयू पर चलाया जा सकता है। मॉडल ने QWEN3-8B की तुलना में 10 प्रतिशत सुधार के साथ ओपन सोर्स मॉडल के तहत Aime 2024 टेस्ट में अत्याधुनिक प्रदर्शन और Qwen3-235b-thinking जैसे तुलनीय प्रदर्शन के साथ प्रदर्शन किया।
विकास पद्धति से पता चलता है कि डीपसेक तेजी से सुदृढीकरण सीखने के साथ प्रशिक्षण के बाद पर निर्भर करता है, जिसके कारण मूल्यांकन में 71 से 99 मिलियन टोकन के मूल्यांकन में टोकन की खपत में 40 प्रतिशत की वृद्धि हुई। यह इंगित करता है कि मॉडल मौलिक वास्तुशिल्प परिवर्तनों के बिना लंबे और गहरे उत्तर उत्पन्न करता है।
बाजार की स्थिति और प्रतिस्पर्धी गतिशीलता
दीपसेक-आर 1-0528 पश्चिमी प्रौद्योगिकी कंपनियों के अग्रणी मालिकाना मॉडल के लिए एक गंभीर प्रतियोगी के रूप में खुद को स्थापित करता है। कृत्रिम विश्लेषण के अनुसार, 68 अंकों वाला मॉडल Google के मिथुन 2.5 प्रो के समान स्तर पर है और XAIS ग्रोक 3 मिनी, मेटास लामा 4 मावेरिक और निविडियास नेमोट्रॉन अल्ट्रा जैसे मॉडलों के सामने है। कोड श्रेणी में, डीपसेक-आर 1-0528 ओ 4-मिनी और ओ 3 के ठीक नीचे एक स्तर तक पहुंचता है।
अपडेट के प्रकाशन का वैश्विक एआई परिदृश्य पर एक महत्वपूर्ण प्रभाव पड़ा है। पहले से ही जनवरी 2025 में डीपसेक-आर 1 के मूल प्रकाशन ने चीन के बाहर प्रौद्योगिकी शेयरों के ब्रेक-इन के कारण इस धारणा पर सवाल उठाया कि एआई के स्केलिंग को भारी कंप्यूटिंग शक्ति और निवेश की आवश्यकता थी। पश्चिमी प्रतियोगियों की प्रतिक्रिया त्वरित थी: Google ने मिथुन के लिए रियायती एक्सेस टैरिफ पेश की, जबकि Openai ने कीमतों को कम किया और एक O3 मिनी मॉडल पेश किया जिसे कम कंप्यूटिंग पावर की आवश्यकता थी।
दिलचस्प बात यह है कि Eqbench से टेक्स्ट-स्टाइल विश्लेषण से पता चलता है कि DeepSeek-R1 Openaai की तुलना में Google की ओर अधिक उन्मुख है, जो इंगित करता है कि विकास में अधिक सिंथेटिक मिथुन आउटपुट का उपयोग किया जा सकता है। यह अवलोकन विभिन्न एआई डेवलपर्स के बीच जटिल प्रभावों और प्रौद्योगिकी हस्तांतरण को रेखांकित करता है।
लागत दक्षता और उपलब्धता
दीपसेक-आर 1-0528 का एक निर्णायक प्रतिस्पर्धात्मक लाभ इसकी असाधारण लागत दक्षता है। Openai की तुलना में मूल्य संरचना काफी सस्ती है: कैश हिट के लिए इनपुट टोकन की लागत $ 0.14 प्रति मिलियन टोकन और कैश मिसेज में $ 0.55 है, जबकि आउटपुट टोकन की लागत $ 2.19 प्रति मिलियन टोकन है। इसकी तुलना में, OpenAI O1 को इनपुट टोकन के लिए $ 15 और प्रति मिलियन आउटपुट टोकन के लिए $ 60 की आवश्यकता होती है, जो कि डीपसेक-आर 1 को 90-95 प्रतिशत से अधिक सस्ता बनाता है।
Microsoft Azure प्रतिस्पर्धी कीमतों के साथ DEEPSEEK-R1 भी प्रदान करता है: वैश्विक संस्करण की लागत इनपुट टोकन के लिए $ 0.00135 और 1,000 टोकन पर आउटपुट टोकन के लिए $ 0.0054 है, जबकि क्षेत्रीय संस्करण की कीमतें थोड़ी अधिक हैं। यह मूल्य निर्धारण उन कंपनियों और डेवलपर्स के लिए विशेष रूप से आकर्षक बनाता है जो मालिकाना समाधानों की उच्च लागत के बिना उच्च गुणवत्ता वाले एआई कार्यात्मकता का उपयोग करना चाहते हैं।
सह-लाइसेंस के तहत एक खुले स्रोत मॉडल के रूप में उपलब्धता भी लाइसेंस शुल्क के बिना व्यावसायिक उपयोग और संशोधन को सक्षम करती है। डेवलपर्स स्थानीय रूप से मॉडल का संचालन कर सकते हैं या विभिन्न एपीआई का उपयोग कर सकते हैं, जो कार्यान्वयन पर लचीलापन और नियंत्रण प्रदान करता है। सीमित संसाधनों वाले उपयोगकर्ताओं के लिए, डिस्टिल्ड 8 बिलियन पैरामीटर संस्करण उपलब्ध है, जो 24 जीबी मेमोरी के साथ उपभोक्ता हार्डवेयर पर चलता है।
के लिए उपयुक्त:
चीन की एआई कैचिंग अप: डीपसेक की सफलता का क्या अर्थ है
दीपसेक-आर 1-0528 वैश्विक एआई विकास में एक महत्वपूर्ण मोड़ है और यह दर्शाता है कि चीनी कंपनियां अमेरिकी निर्यात प्रतिबंधों के बावजूद मॉडल विकसित कर सकती हैं जो सर्वश्रेष्ठ पश्चिमी प्रणालियों के साथ प्रतिस्पर्धा करते हैं। अपडेट से साबित होता है कि मौलिक वास्तुशिल्प परिवर्तनों के बिना महत्वपूर्ण प्रदर्शन बढ़ जाता है यदि प्रशिक्षण के बाद के अनुकूलन और पुन: उत्पादन सीखने का प्रभावी ढंग से उपयोग किया जाता है। शीर्ष प्रदर्शन, काफी कम लागत और खुले स्रोत उपलब्धता प्रश्नों का संयोजन एआई उद्योग में व्यापार मॉडल स्थापित किया।
डीपसेक की सफलता के लिए पश्चिमी प्रतियोगियों की प्रतिक्रियाएं पहले से ही पहले बाजार में बदलाव दिखाती हैं: Openaai और Google में मूल्य में कटौती के साथ -साथ संसाधन -सेविंग मॉडल का विकास भी। दीपसेक-आर 2 के अपेक्षित प्रकाशन के साथ, जिसे मूल रूप से मई 2025 के लिए योजनाबद्ध किया गया था, यह प्रतिस्पर्धी दबाव आगे बढ़ सकता है। दीपसेक-आर 1-0528 की सफलता की कहानी से पता चलता है कि एआई में नवाचार को जरूरी नहीं कि बड़े पैमाने पर निवेश और अंकगणितीय संसाधनों की आवश्यकता हो, लेकिन चतुर एल्गोरिदम और कुशल विकास विधियों के माध्यम से प्राप्त किया जा सकता है।
के लिए उपयुक्त:
आपका एआई परिवर्तन, एआई एकीकरण और एआई प्लेटफॉर्म उद्योग विशेषज्ञ
☑️ हमारी व्यावसायिक भाषा अंग्रेजी या जर्मन है
☑️ नया: आपकी राष्ट्रीय भाषा में पत्राचार!
मुझे निजी सलाहकार के रूप में आपकी और मेरी टीम की सेवा करने में खुशी होगी।
संपर्क फ़ॉर्म भरकर मुझसे संपर्क कर सकते हैं +49 89 89 674 804 (म्यूनिख) पर कॉल कर सकते हैं । मेरा ईमेल पता है: वोल्फेंस्टीन ∂ xpert.digital
मैं हमारी संयुक्त परियोजना की प्रतीक्षा कर रहा हूं।