प्रकाशित तिथि: 20 मार्च 2025 / अद्यतन तिथि: 20 मार्च 2025 – लेखक: Konrad Wolfenstein

गूगल जेमिनी 2.0, कृत्रिम बुद्धिमत्ता और रोबोटिक्स: जेमिनी रोबोटिक्स और जेमिनी रोबोटिक्स-ईआर – रचनात्मक छवि: Xpert.Digital
डीपमाइंड प्रस्तुत करता है जेमिनी: रोबोटिक्स के अगले युग की शुरुआत
जेमिनी रोबोटिक्स: गूगल का कृत्रिम बुद्धिमत्ता और रोबोटिक्स का क्रांतिकारी संगम
12 मार्च, 2025 को, Google DeepMind ने अपनी नवीनतम परियोजना, जेमिनी रोबोटिक्स का अनावरण किया, जो शक्तिशाली जेमिनी 2.0 भाषा मॉडल को उन्नत रोबोटिक्स के साथ संयोजित करने वाली एक प्रभावशाली तकनीक है। यह नवाचार प्राकृतिक भाषा को समझने और जटिल भौतिक कार्यों को करने में सक्षम बुद्धिमान रोबोटिक प्रणालियों के विकास में एक महत्वपूर्ण मील का पत्थर है।.
गूगल डीपमाइंड एक अग्रणी कृत्रिम बुद्धिमत्ता (एआई) अनुसंधान कंपनी है, जिसकी स्थापना 2010 में हुई थी और 2014 में गूगल द्वारा इसका अधिग्रहण कर लिया गया था। यह अल्पकालिक भंडारण और कृत्रिम स्मृति वाले तंत्रिका नेटवर्क द्वारा संचालित उन्नत एआई प्रौद्योगिकियों के विकास पर केंद्रित है। डीपमाइंड ने कई महत्वपूर्ण उपलब्धियां हासिल की हैं, जिनमें गो के खेल में मानव खिलाड़ियों को हराना और प्रोटीन संरचनाओं की भविष्यवाणी करने वाली प्रणाली अल्फाफोल्ड का विकास करना शामिल है। डीपमाइंड की प्रौद्योगिकियों का उपयोग रोबोटिक्स, चिकित्सा, ऊर्जा दक्षता और प्राकृतिक भाषा प्रसंस्करण जैसे क्षेत्रों में किया जाता है।.
जेमिनी रोबोटिक्स की तकनीकी नींव
जेमिनी रोबोटिक्स को एक उन्नत विज़न-लैंग्वेज-एक्शन (VLA) मॉडल के रूप में डिज़ाइन किया गया है, जो पहले से ही शक्तिशाली जेमिनी 2.0 पर आधारित है। इसकी प्रमुख नवीनता यह है कि यह सिस्टम न केवल टेक्स्ट, इमेज या वीडियो जैसे डिजिटल डेटा को प्रोसेस कर सकता है, बल्कि पहली बार वास्तविक दुनिया में भौतिक क्रियाएं भी कर सकता है।.
यह तकनीक जेमिनी 2.0 की बहुआयामी समझ क्षमताओं का लाभ उठाती है और उन्हें एक महत्वपूर्ण नई पद्धति, यानी भौतिक क्रियाओं को शामिल करने के लिए विस्तारित करती है। इससे रोबोट डिजिटल और भौतिक दुनिया को उस तरह से जोड़ने में सक्षम हो जाते हैं जो पहले असंभव था।.
इससे संबंधित:
- गूगल एआई स्टूडियो के साथ गूगल का जेमिनी प्लेटफॉर्म, जेमिनी एडवांस्ड के साथ गूगल डीप रिसर्च और गूगल डीपमाइंड
कार्यप्रणाली और अवधारणात्मक क्षमताएँ
जेमिनी रोबोटिक्स की तकनीकी सफलता इसकी कैमरे के माध्यम से अपने परिवेश को समझने, वस्तुओं को पहचानने और उनके स्थानिक आयामों को कैप्चर करने की क्षमता में निहित है। इस जानकारी को फिर सटीक तकनीकी निर्देशांकों के साथ एक 3डी दुनिया में रूपांतरित किया जाता है।.
यह सिस्टम निम्नलिखित कार्य भी कर सकता है:
- प्राकृतिक भाषा के आदेशों को समझना और उन्हें शारीरिक क्रियाओं में परिवर्तित करना।
- वस्तुओं के बीच जटिल स्थानिक संबंधों को समझना
- नई, अपरिचित परिस्थितियों के अनुकूल ढलना
- विभिन्न रोबोट प्रकारों में सामान्यीकरण करना
दो पूरक मॉडल: जेमिनी रोबोटिक्स और जेमिनी रोबोटिक्स-ईआर
गूगल डीपमाइंड ने रोबोटिक्स एआई के विभिन्न पहलुओं को संबोधित करने वाले एक नहीं बल्कि दो विशेष मॉडल पेश किए हैं।.
जेमिनी रोबोटिक्स
जेमिनी रोबोटिक्स का मुख्य मॉडल जेमिनी 2.0 की वाक् प्रसंस्करण क्षमताओं को भौतिक नियंत्रण के साथ जोड़ता है। यह रोबोटों को प्राकृतिक भाषा के आदेशों का जवाब देने, जटिल वातावरण को समझने और अनुकूल क्रियाएं करने में सक्षम बनाता है।.
जेमिनी रोबोटिक्स-ईआर
दूसरा मॉडल, जेमिनी रोबोटिक्स-ईआर (जहां ईआर का अर्थ है "शारीरिक तर्क"), बेहतर स्थानिक तर्क क्षमता पर केंद्रित है। यह क्षमता उन रोबोटों के लिए महत्वपूर्ण है जिन्हें गतिशील, त्रि-आयामी वातावरण में कार्य करना होता है।.
उदाहरण के लिए, जेमिनी रोबोटिक्स-ईआर किसी वस्तु को पकड़ने का सबसे अच्छा तरीका सहज रूप से पहचान सकता है। यदि मॉडल को एक कॉफी कप दिखाया जाए, तो यह कप को हैंडल से उठाने के लिए उपयुक्त दो-उंगली पकड़ का चयन कर सकता है और सुरक्षित गति अनुक्रम की गणना कर सकता है।.
प्रदर्शित कौशल और व्यावहारिक अनुप्रयोग
प्रभावशाली प्रदर्शन वीडियो में, Google DeepMind अपने नए AI मॉडल की व्यावहारिक क्षमताओं को प्रदर्शित करता है। ये रोबोटिक सिस्टम कई प्रकार के जटिल कार्य कर सकते हैं, जिनमें शामिल हैं:
- ओरिगामी और कागज को मोड़ना
- मौखिक निर्देशों के आधार पर वस्तुओं को छांटना और व्यवस्थित करना।
- नाज़ुक वस्तुओं को सटीक रूप से पकड़ना और स्थानांतरित करना
- ग्लासों को सावधानीपूर्वक एक केस में रखना
- पासे फेंकना और छोटी वस्तुओं को संभालना
- ज़िपर को बंद करना
- हेडफोन केबलों को लपेटना
- बास्केटबॉल डंक जैसे सटीक कार्य करना
सबसे उल्लेखनीय बात यह है कि रोबोट केवल एक निर्देश प्राप्त करने के बाद इन कार्यों को स्वायत्त रूप से पूरा करते हैं। सिस्टम स्वतंत्र रूप से वस्तुओं को पहचानता है, उनकी पहचान करता है, आवश्यक व्यक्तिगत चरणों को निर्धारित करता है और तदनुसार रोबोट की भुजाओं को नियंत्रित करता है।.
आगे के विकास के लिए रणनीतिक साझेदारी
इस तकनीक की पूरी क्षमता का लाभ उठाने के लिए, गूगल डीपमाइंड रोबोटिक्स उद्योग की अग्रणी कंपनियों के साथ सहयोग कर रहा है:
- टेक्सास स्थित स्टार्टअप कंपनी एपट्रोनिक ने ह्यूमनॉइड रोबोट "अपोलो" विकसित किया है, जिसे बक्से उठाने, ले जाने और ढेर लगाने जैसे लॉजिस्टिक्स और विनिर्माण कार्यों के लिए डिज़ाइन किया गया है।
- बोस्टन डायनेमिक्स, एक प्रसिद्ध रोबोटिक्स कंपनी है जिसे विडंबना यह है कि एक बार गूगल ने खरीदा था और बाद में फिर से बेच दिया गया था।
- जेमिनी रोबोटिक्स-ईआर के विकास और परीक्षण के लिए एजिलिटी रोबोटिक्स और एजाइल रोबोट्स अतिरिक्त भागीदार हैं।
यह सहयोग गूगल की उस रणनीति को दर्शाता है जिसके तहत वह इस तकनीक को विभिन्न रोबोट प्लेटफार्मों पर लागू करने और परीक्षण करने के लिए बाध्य है ताकि इसकी व्यापक प्रयोज्यता सुनिश्चित हो सके।.
इससे संबंधित:
रोबोटिक्स के भविष्य के लिए महत्व
डीपमाइंड के रोबोटिक्स निदेशक कनिष्क राव ने एक प्रेस कॉन्फ्रेंस के दौरान बताया कि रोबोटिक्स में सबसे बड़ी चुनौतियों में से एक यह है कि रोबोट आमतौर पर ज्ञात परिस्थितियों में अच्छा प्रदर्शन करते हैं लेकिन अज्ञात परिस्थितियों में विफल हो जाते हैं। जेमिनी रोबोटिक्स का लक्ष्य ठीक इसी समस्या का समाधान करना है।.
इससे संबंधित:
- ह्यूमनॉइड रोबोट्स को खड़े होने का नियंत्रण: "होस्ट" की मदद से, ह्यूमनॉइड रोबोट खड़े होना सीखते हैं - रोजमर्रा की जिंदगी में रोबोट्स के लिए एक अभूतपूर्व उपलब्धि।
रोबोटिक्स में लार्ज लैंग्वेज मॉडल्स (एलएलएम) का एकीकरण एक बढ़ते चलन का हिस्सा है, और जेमिनी का दृष्टिकोण इसका सबसे प्रभावशाली उदाहरण हो सकता है। स्टैनफोर्ड विश्वविद्यालय में बायोइंजीनियरिंग के प्रोफेसर और ओपनमाइंड के संस्थापक जान लिपहार्ट इस बात पर जोर देते हैं कि यह "जेनरेटिव एआई और लार्ज लैंग्वेज मॉडल्स को उन्नत रोबोटों पर लागू करने के पहले उदाहरणों में से एक है" और "रोबोट शिक्षकों, रोबोट सहायकों और रोबोट साथियों को विकसित करने की कुंजी साबित हो सकता है।".
एनवीडिया के सीईओ जेन्सेन हुआंग इससे भी आगे बढ़कर सुझाव देते हैं कि बड़े पैमाने पर रोबोट तैनात करने के लिए जनरेटिव एआई के उपयोग से कई ट्रिलियन अमेरिकी डॉलर की बाजार क्षमता का प्रतिनिधित्व हो सकता है।.
जेमिनी और रोबोटिक्स: बुद्धिमान प्रणालियों के लिए एक महत्वपूर्ण मोड़?
शानदार प्रगति के बावजूद, चुनौतियाँ अभी भी बनी हुई हैं। कैलिफोर्निया विश्वविद्यालय, बर्कले में रोबोटिक्स के प्रोफेसर केन गोल्डबर्ग एआई सिस्टम को "रोबोटिक्स के क्षेत्र में एक रोमांचक विकास" बताते हैं, लेकिन साथ ही चेतावनी देते हैं कि "सामान्य प्रयोजन वाले रोबोटों को रोजमर्रा के उपयोग के लिए तैयार होने से पहले अभी बहुत काम किया जाना बाकी है।".
गूगल आगामी गूगल आई/ओ सम्मेलन के दौरान इस तकनीक की संभावनाओं के बारे में और अधिक जानकारी देने की योजना बना रहा है। रोबोटिक्स में अपनी दीर्घकालिक रुचि और अब जेमिनी जैसे उपयुक्त सॉफ्टवेयर घटक के साथ, गूगल बुद्धिमान रोबोटों के विकास में एक नया अध्याय खोल सकता है।.
भाषण से क्रिया तक: गूगल ने रोबोटिक्स में नए मानक स्थापित किए
जेमिनी रोबोटिक्स के साथ, गूगल डीपमाइंड ने कृत्रिम बुद्धिमत्ता और रोबोटिक्स के एकीकरण की दिशा में एक महत्वपूर्ण कदम उठाया है। प्राकृतिक भाषा को समझने, जटिल वातावरण को समझने और भौतिक क्रियाएं करने की इसकी क्षमता भविष्य में रोबोटों के उपयोग के तरीके में क्रांतिकारी बदलाव ला सकती है।.
यह तकनीक विशुद्ध रूप से डिजिटल एआई अनुप्रयोगों से उन प्रणालियों की ओर संक्रमण का प्रतीक है जो भौतिक दुनिया पर सीधा प्रभाव डाल सकती हैं। हालांकि इससे कुछ एआई संशयवादियों के बीच चिंताएं उत्पन्न हो सकती हैं, गूगल डीपमाइंड का प्राथमिक ध्यान अनुकूलनीय और उपयोगी रोबोटिक प्रणालियों को विकसित करने पर है जो कम प्रशिक्षण के साथ जटिल कार्यों को संभाल सकें।.
आने वाले वर्षों में यह पता चलेगा कि यह तकनीक कैसे विकसित होती है और उद्योग से लेकर रोजमर्रा की जिंदगी तक विभिन्न क्षेत्रों में इसके क्या व्यावहारिक अनुप्रयोग होंगे।.
इससे संबंधित:
आपका वैश्विक विपणन और व्यवसाय विकास भागीदार
☑️ हमारी व्यावसायिक भाषा अंग्रेजी या जर्मन है।
☑️ नया: अपनी मातृभाषा में पत्राचार करें!
मुझे और मेरी टीम को आपके व्यक्तिगत सलाहकार के रूप में आपकी सेवा करने में खुशी होगी।.
आप यहां दिए गए संपर्क फ़ॉर्म को भरकर मुझसे संपर्क कर सकते हैं या मुझे +49 89 89 674 804 ( म्यूनिख) सकते । मेरा ईमेल पता है: [email protected]
मैं हमारी संयुक्त परियोजना के लिए उत्सुक हूं।.














