DeepSeek-R1-0528: DeepSeek अपडेट ने चीनी AI मॉडल को पश्चिमी उद्योग के अग्रणी मॉडलों के बराबर ला खड़ा किया है।

Konrad Wolfenstein

1 साल पहले

DeepSeek-R1-0528: DeepSeek अपडेट ने चीनी AI मॉडल को पश्चिमी उद्योग के अग्रणी मॉडलों के बराबर ला खड़ा किया – चित्र: Xpert.Digital

ओपन-सोर्स एआई अपनी चरम सीमा पर: डीपसीक ने ओपनएआई और गूगल को पीछे छोड़ दिया

60 से 68 तक: डीपसीक ने चीनी एआई को फिर से शीर्ष पर पहुँचाया

चीनी एआई स्टार्टअप डीपसीक ने 28 मई, 2025 को डीपसीक-आर1-0528 जारी करके एक महत्वपूर्ण उपलब्धि हासिल की, जिससे वैश्विक एआई परिदृश्य में क्रांतिकारी बदलाव आया। ओपन-सोर्स रीजनिंग मॉडल के इस अपडेट से प्रदर्शन में ज़बरदस्त सुधार हुआ है, जिससे डीपसीक पहली बार ओपनएआई के o3 और गूगल जेमिनी 2.5 प्रो के समकक्ष खड़ा हो गया है। विशेष रूप से उल्लेखनीय बात यह है कि यह उच्चतम प्रदर्शन बहुत कम लागत में और पूरी तरह से ओपन मॉडल वेट्स के साथ प्राप्त किया गया है, जिससे मालिकाना हक वाले एआई सिस्टम के भविष्य के बारे में मूलभूत प्रश्न उठते हैं। स्वतंत्र रेटिंग प्लेटफॉर्म आर्टिफिशियल एनालिसिस ने नए मॉडल को 68 अंक दिए हैं - 60 से 68 अंकों की यह छलांग ओपनएआई o1 और o3 के प्रदर्शन अंतर के बराबर है।.

इससे संबंधित:

डीपसीक और अलीबाबा: विशेषज्ञ स्तर पर एक बड़ी सफलता? स्वास्थ्य सेवा में चीनी एआई का बढ़ता प्रभाव।

अपडेट और इसके तकनीकी सुधार

DeepSeek-R1-0528 एक महत्वपूर्ण सुधार है जो अंतर्निहित आर्किटेक्चर को बदले बिना, एल्गोरिदम अनुकूलन और प्रशिक्षण के बाद कम्प्यूटेशनल संसाधनों के अधिक उपयोग के माध्यम से प्रदर्शन में उल्लेखनीय सुधार प्राप्त करता है। यह अपडेट मुख्य रूप से तर्क क्षमताओं को बेहतर बनाने पर केंद्रित है, जिससे DeepSeek के अनुसार, "काफी गहन चिंतन प्रक्रियाएं" संभव हो पाती हैं। इस सुधार का एक विशेष रूप से प्रभावशाली उदाहरण AIME 2025 गणित परीक्षा में देखा जा सकता है, जहां सटीकता 70 प्रतिशत से बढ़कर 87.5 प्रतिशत हो गई। साथ ही, प्रति प्रश्न टोकन की औसत संख्या 12,000 से बढ़कर 23,000 हो गई, जो अधिक गहन प्रसंस्करण को इंगित करता है।.

तर्क क्षमता में सुधार के अलावा, इस अपडेट में कई महत्वपूर्ण नई कार्यक्षमताएँ शामिल की गई हैं, जिनमें JSON आउटपुट और फ़ंक्शन कॉल, एक अनुकूलित उपयोगकर्ता इंटरफ़ेस और भ्रम की कमियाँ शामिल हैं। ये सुधार मॉडल को डेवलपर्स के लिए काफी अधिक व्यावहारिक बनाते हैं और इसके दायरे को व्यापक रूप से बढ़ाते हैं। उपलब्धता अपरिवर्तित रहेगी: मौजूदा API उपयोगकर्ताओं को अपडेट स्वचालित रूप से प्राप्त होगा, जबकि मॉडल के भार Hugging Face पर खुले MIT लाइसेंस के तहत उपलब्ध रहेंगे।.

बेंचमार्क प्रदर्शन और प्रदर्शन तुलनाएँ

DeepSeek-R1-0528 के बेंचमार्क परिणामों से सभी मूल्यांकन श्रेणियों में प्रभावशाली सुधार देखने को मिलते हैं। गणितीय कार्यों में, AIME-2024 स्कोर 79.8 से बढ़कर 91.4 प्रतिशत हो गया, HMMT-2025 41.7 से बढ़कर 79.4 प्रतिशत हो गया और CNMO-2024 78.8 से बढ़कर 86.9 प्रतिशत हो गया। ये परिणाम इस मॉडल को गणितीय समस्या-समाधान के लिए विश्व स्तर पर सबसे शक्तिशाली AI प्रणालियों में से एक के रूप में स्थापित करते हैं।.

DeepSeek-R1-0528 ने प्रोग्रामिंग बेंचमार्क में भी उल्लेखनीय प्रगति दिखाई है। LiveCodeBench में इसका स्कोर 63.5 से बढ़कर 73.3 प्रतिशत हो गया, Aider-Polyglot में 53.3 से बढ़कर 71.6 प्रतिशत और SWE Verified में 49.2 से बढ़कर 57.6 प्रतिशत हो गया। Codeforces रेटिंग 1,530 से बढ़कर 1,930 अंक हो गई, जिससे यह मॉडल शीर्ष एल्गोरिथम समस्या समाधानकर्ताओं में शामिल हो गया। प्रतिस्पर्धी मॉडलों की तुलना में, DeepSeek-R1 ने SWE Verified में 49.2 प्रतिशत स्कोर प्राप्त किया है, जो इसे 48.9 प्रतिशत स्कोर वाले OpenAI o1-1217 से थोड़ा आगे रखता है, जबकि Codeforces में 96.3 प्रतिशत और 2,029 अंकों की Elo रेटिंग के साथ, यह OpenAI के अग्रणी मॉडल के बहुत करीब पहुंच गया है।.

सामान्य ज्ञान और तर्क परीक्षण व्यापक प्रदर्शन सुधार की पुष्टि करते हैं: GPQA-Diamond का प्रदर्शन 71.5 से बढ़कर 81.0 प्रतिशत हो गया, Humanity's Last Exam का 8.5 से बढ़कर 17.7 प्रतिशत हो गया, MMLU-Pro का 84.0 से बढ़कर 85.0 प्रतिशत हो गया और MMLU-Redux का 92.9 से बढ़कर 93.4 प्रतिशत हो गया। केवल OpenAI के SimpleQA में मामूली गिरावट देखी गई, जो 30.1 से घटकर 27.8 प्रतिशत हो गया। ये व्यापक सुधार दर्शाते हैं कि DeepSeek-R1-0528 न केवल विशिष्ट क्षेत्रों में बल्कि संज्ञानात्मक कार्यों के संपूर्ण स्पेक्ट्रम में प्रतिस्पर्धी है।.

तकनीकी वास्तुकला और नवाचार

DeepSeek-R1-0528 का तकनीकी आधार एक परिष्कृत MoE (मिक्सचर ऑफ एक्सपर्ट्स) आर्किटेक्चर पर आधारित है, जिसमें कुल 671 बिलियन पैरामीटर में से 37 बिलियन सक्रिय पैरामीटर और 128,000 टोकन की संदर्भ लंबाई है। यह मॉडल स्व-सत्यापन, बहु-स्तरीय चिंतन और मानव-समान तर्क क्षमता प्राप्त करने के लिए उन्नत रीइन्फोर्समेंट लर्निंग का उपयोग करता है। यह आर्किटेक्चर मॉडल को पुनरावृत्ति चिंतन प्रक्रियाओं के माध्यम से जटिल तर्क कार्यों को हल करने में सक्षम बनाता है, जो इसे पारंपरिक भाषा मॉडलों से अलग करता है।.

एक विशेष रूप से नवोन्मेषी पहलू है DeepSeek-R1-0528-Qwen3-8B नामक एक संक्षिप्त संस्करण का विकास, जिसे Qwen3-8B-Base के पोस्ट-ट्रेनिंग के लिए DeepSeek-R1-0528 की विचार प्रक्रिया को परिष्कृत करके बनाया गया है। यह छोटा संस्करण काफी कम संसाधनों की आवश्यकता के साथ प्रभावशाली प्रदर्शन प्राप्त करता है और 8-12 जीबी वीआरएएम वाले जीपीयू पर चलता है। AIME 2024 परीक्षण में, इस मॉडल ने ओपन-सोर्स मॉडलों में सर्वश्रेष्ठ प्रदर्शन हासिल किया, Qwen3-8B से 10 प्रतिशत बेहतर प्रदर्शन किया और Qwen3-235B-Thinking के समान प्रदर्शन किया।.

विकास पद्धति से पता चलता है कि डीपसीक प्रशिक्षण के बाद सुदृढ़ीकरण अधिगम पर अधिकाधिक निर्भर करता है, जिसके परिणामस्वरूप मूल्यांकन के दौरान टोकन की खपत में 40% की वृद्धि हुई – 71 मिलियन टोकन से बढ़कर 99 मिलियन टोकन हो गई। इससे संकेत मिलता है कि मॉडल मूलभूत संरचनात्मक परिवर्तनों की आवश्यकता के बिना ही लंबे और गहन उत्तर उत्पन्न कर रहा है।.

बाजार की स्थिति और प्रतिस्पर्धी गतिशीलता

DeepSeek-R1-0528 पश्चिमी प्रौद्योगिकी कंपनियों के प्रमुख मालिकाना मॉडलों के लिए एक मजबूत प्रतिस्पर्धी के रूप में अपनी पहचान बना रहा है। आर्टिफिशियल एनालिसिस के अनुसार, इस मॉडल को 68 अंक मिले हैं, जो इसे Google के Gemini 2.5 Pro के बराबर और xAI के Grok 3 mini, Meta के Llama 4 Maverick और Nvidia के Nemotron Ultra जैसे मॉडलों से आगे रखता है। कोड श्रेणी में, DeepSeek-R1-0528 OpenAI के o4-mini और o3 से थोड़ा नीचे का स्तर हासिल करता है।.

इस अपडेट के जारी होने से वैश्विक एआई परिदृश्य पर महत्वपूर्ण प्रभाव पड़ा है। जनवरी 2025 में डीपसीक-आर1 के शुरुआती लॉन्च से चीन के बाहर प्रौद्योगिकी शेयरों में गिरावट आई और इस धारणा को चुनौती मिली कि एआई को बड़े पैमाने पर विकसित करने के लिए अत्यधिक कंप्यूटिंग शक्ति और निवेश की आवश्यकता होती है। पश्चिमी प्रतिस्पर्धियों ने तुरंत प्रतिक्रिया दी: गूगल ने जेमिनी के लिए रियायती एक्सेस दरें पेश कीं, जबकि ओपनएआई ने कीमतें कम कीं और एक ओ3 मिनी मॉडल पेश किया जिसे कम कंप्यूटिंग शक्ति की आवश्यकता होती है।.

दिलचस्प बात यह है कि EQBench के टेक्स्ट स्टाइल विश्लेषण से पता चलता है कि DeepSeek-R1 की शैली OpenAI की तुलना में Google से अधिक प्रभावित है, जिससे संकेत मिलता है कि इसके विकास में अधिक कृत्रिम जेमिनी आउटपुट का उपयोग किया गया होगा। यह अवलोकन विभिन्न AI डेवलपर्स के बीच जटिल प्रभावों और प्रौद्योगिकी हस्तांतरण को रेखांकित करता है।.

लागत दक्षता और उपलब्धता

DeepSeek-R1-0528 का एक प्रमुख प्रतिस्पर्धी लाभ इसकी असाधारण लागत दक्षता में निहित है। इसकी मूल्य संरचना OpenAI की तुलना में कहीं अधिक अनुकूल है: इनपुट टोकन की लागत कैश हिट के लिए $0.14 प्रति मिलियन टोकन और कैश मिस के लिए $0.55 है, जबकि आउटपुट टोकन की लागत $2.19 प्रति मिलियन टोकन है। तुलनात्मक रूप से, OpenAI o1 इनपुट टोकन के लिए $15 और आउटपुट टोकन के लिए $60 प्रति मिलियन शुल्क लेता है, जिससे DeepSeek-R1 90-95 प्रतिशत तक सस्ता हो जाता है।.

Microsoft Azure प्रतिस्पर्धी कीमतों पर DeepSeek-R1 भी प्रदान करता है: वैश्विक संस्करण की कीमत प्रति 1,000 टोकन के लिए इनपुट टोकन के लिए $0.00135 और आउटपुट टोकन के लिए $0.0054 है, जबकि क्षेत्रीय संस्करण की कीमतें थोड़ी अधिक हैं। यह मूल्य निर्धारण मॉडल को उन कंपनियों और डेवलपर्स के लिए विशेष रूप से आकर्षक बनाता है जो मालिकाना समाधानों की उच्च लागत के बिना उच्च-गुणवत्ता वाली AI कार्यक्षमताओं का लाभ उठाना चाहते हैं।.

एमआईटी लाइसेंस के तहत ओपन-सोर्स मॉडल के रूप में इसकी उपलब्धता लाइसेंस शुल्क के बिना व्यावसायिक उपयोग और संशोधन की अनुमति देती है। डेवलपर्स मॉडल को स्थानीय रूप से चला सकते हैं या विभिन्न एपीआई के माध्यम से इसका उपयोग कर सकते हैं, जिससे कार्यान्वयन पर लचीलापन और नियंत्रण मिलता है। सीमित संसाधनों वाले उपयोगकर्ताओं के लिए, 8 अरब पैरामीटर वाला एक संक्षिप्त संस्करण उपलब्ध है, जो 24 जीबी मेमोरी वाले उपभोक्ता हार्डवेयर पर चलता है।.

इससे संबंधित:

कृत्रिम बुद्धिमत्ता में चीन की प्रगति: डीपसीक मामला और डेटा का रणनीतिक उपयोग

चीन की एआई प्रगति: डीपसीक की सफलता का क्या अर्थ है?

DeepSeek-R1-0528 वैश्विक AI विकास में एक महत्वपूर्ण मोड़ है, जो दर्शाता है कि अमेरिकी निर्यात प्रतिबंधों के बावजूद चीनी कंपनियां सर्वश्रेष्ठ पश्चिमी प्रणालियों के साथ प्रतिस्पर्धा करने वाले मॉडल विकसित कर सकती हैं। यह अपडेट साबित करता है कि प्रशिक्षण के बाद अनुकूलन और सुदृढ़ीकरण अधिगम का प्रभावी ढंग से उपयोग करने पर मूलभूत संरचनात्मक परिवर्तनों के बिना भी प्रदर्शन में महत्वपूर्ण सुधार संभव हैं। उच्चतम प्रदर्शन, लागत में भारी कमी और ओपन-सोर्स उपलब्धता का संयोजन AI उद्योग में स्थापित व्यावसायिक मॉडलों को मौलिक रूप से चुनौती देता है।.

डीपसीक की सफलता पर पश्चिमी प्रतिस्पर्धियों की प्रतिक्रियाओं से बाज़ार में शुरुआती बदलाव दिखने लगे हैं: ओपनएआई और गूगल द्वारा कीमतों में कमी, साथ ही अधिक संसाधन-कुशल मॉडल का विकास। मई 2025 में रिलीज़ होने वाली डीपसीक-आर2 के साथ, यह प्रतिस्पर्धी दबाव और भी बढ़ सकता है। डीपसीक-आर1-0528 की सफलता की कहानी यह दर्शाती है कि कृत्रिम बुद्धिमत्ता में नवाचार के लिए बड़े निवेश और कंप्यूटिंग संसाधनों की आवश्यकता नहीं होती, बल्कि इसे चतुर एल्गोरिदम और कुशल विकास विधियों के माध्यम से प्राप्त किया जा सकता है।.

इससे संबंधित:

आपके एआई रूपांतरण, एआई एकीकरण और एआई प्लेटफॉर्म उद्योग विशेषज्ञ

☑️ हमारी व्यावसायिक भाषा अंग्रेजी या जर्मन है।

☑️ नया: अपनी मातृभाषा में पत्राचार करें!

Konrad Wolfenstein

मुझे और मेरी टीम को आपके व्यक्तिगत सलाहकार के रूप में आपकी सेवा करने में खुशी होगी।.

आप यहां दिए गए संपर्क फ़ॉर्म को भरकर मुझसे संपर्क कर सकते हैं wolfenstein@xpert.digital:या मुझे +49 7348 4088 965 पर कॉल कर सकते हैं । मेरा ईमेल पता है

मैं हमारी संयुक्त परियोजना के लिए उत्सुक हूं।.

DeepSeek-R1-0528: DeepSeek अपडेट ने चीनी AI मॉडल को पश्चिमी उद्योग के अग्रणी मॉडलों के बराबर ला खड़ा किया है।

ओपन-सोर्स एआई अपनी चरम सीमा पर: डीपसीक ने ओपनएआई और गूगल को पीछे छोड़ दिया