पर प्रकाशित: 20 मार्च, 2025 / अद्यतन से: 20 मार्च, 2025 - लेखक: कोनराड वोल्फेंस्टीन
Google मिथुन 2.0, द आर्टिफिशियल इंटेलिजेंस एंड रोबोटिक्स: जेमिनी रोबोटिक्स और जेमिनी रोबोटिक्स-एर-क्रिएटिव इमेज: Xpert.Digital
दीपमिंड प्रस्तुत करता है मिथुन: रोबोटिक्स का अगला युग शुरू होता है
मिथुन रोबोटिक्स: आर्टिफिशियल इंटेलिजेंस और रोबोटिक्स के Google का ट्रांसफॉर्मेटिव मर्जर
12 मार्च, 2025 को, Google डीपमाइंड ने अपनी नवीनतम परियोजना मिथुन रोबोटिक्स, एक प्रभावशाली तकनीक प्रस्तुत की, जो उन्नत रोबोटिक्स के साथ शक्तिशाली मिथुन 2.0 भाषा मॉडल को जोड़ती है। यह नवाचार बुद्धिमान रोबोट प्रणालियों के विकास में एक महत्वपूर्ण मील का पत्थर है जो प्राकृतिक भाषा को समझ सकता है और जटिल शारीरिक कार्यों को करता है।
Google DEEPMIND आर्टिफिशियल इंटेलिजेंस (AI) के लिए एक प्रमुख शोध कंपनी है, जिसे 2010 में स्थापित किया गया था और 2014 में Google द्वारा लिया गया था। यह उन्नत AI प्रौद्योगिकियों के विकास पर केंद्रित है, जो कि अल्पकालिक भंडारण और कृत्रिम स्मृति के साथ तंत्रिका नेटवर्क द्वारा विशेषता हैं। दीपमाइंड ने महत्वपूर्ण सफलताओं को हासिल किया है, जिसमें खेल में मानव खिलाड़ियों का बचाव करना "गो" और एल्फाफोल्ड का विकास, प्रोटीन संरचनाओं की भविष्यवाणी करने के लिए एक प्रणाली शामिल है। डीपमाइंड की प्रौद्योगिकियों का उपयोग रोबोटिक्स, चिकित्सा, ऊर्जा दक्षता और भाषा प्रसंस्करण जैसे क्षेत्रों में किया जाता है।
मिथुन रोबोटिक्स की तकनीकी नींव
मिथुन रोबोटिक्स को मॉडल (वीएलए) मॉडल की एक प्रगतिशील दृष्टि लंबाई के रूप में डिज़ाइन किया गया था, जो पहले से ही शक्तिशाली मिथुन 2.0 पर बनाता है। केंद्रीय नवाचार यह है कि सिस्टम न केवल डिजिटल डेटा जैसे कि ग्रंथों, छवियों या वीडियो को संसाधित कर सकता है, बल्कि पहली बार वास्तविक दुनिया में भौतिक क्रियाएं भी कर सकता है।
प्रौद्योगिकी मिथुन 2.0 की मल्टीमॉडल समझ का उपयोग करती है और इसे एक निर्णायक नई मोडेलिटी के साथ विस्तारित करती है: भौतिक क्रियाएं। यह रोबोट को डिजिटल और भौतिक दुनिया को इस तरह से पाटने में सक्षम बनाता है जो अभी तक संभव नहीं था।
के लिए उपयुक्त:
- Google AI स्टूडियो के साथ Google का जेमिनी प्लेटफ़ॉर्म, जेमिनी एडवांस्ड और Google DeepMind के साथ Google डीप रिसर्च
कार्यक्षमता और धारणा कौशल
मिथुन रोबोटिक्स की तकनीकी सफलता कैमरों के माध्यम से परिवेश को देखने, वस्तुओं को पहचानने और उनके स्थानिक आयामों को पकड़ने के लिए अपनी क्षमता में निहित है। इस जानकारी को तब सटीक तकनीकी निर्देशांक के साथ 3 डी दुनिया में बदल दिया जाता है।
सिस्टम यह भी कर सकता है:
- प्राकृतिक भाषा के आदेशों को समझें और इसे भौतिक कार्यों में लागू करें
- वस्तुओं के बीच जटिल स्थानिक संबंधों को समझें
- नई, अज्ञात स्थितियों के अनुकूल
- विभिन्न रोबोट प्रकारों पर उत्पन्न करें
दो पूरक मॉडल: मिथुन रोबोटिक्स और मिथुन रोबोटिक्स-एर
Google डीपमाइंड ने न केवल एक, बल्कि दो विशेष मॉडल प्रस्तुत किए हैं जो रोबोटिक्स एआई के विभिन्न पहलुओं को संबोधित करते हैं।
मिथुन रोबोटिक्स
मुख्य मॉडल मिथुन रोबोटिक्स भौतिक नियंत्रण के साथ मिथुन 2.0 के भाषा प्रसंस्करण कौशल को जोड़ती है। यह रोबोट को स्वाभाविक रूप से भाषा कमांड पर प्रतिक्रिया करने, जटिल वातावरण को समझने और अनुकूली क्रियाओं को अंजाम देने में सक्षम बनाता है।
मिथुन रोबोटिक्स
दूसरा मॉडल, मिथुन रोबोटिक्स-एर (जिससे वह "सन्निहित तर्क" या "संशोधित तर्क") के लिए खड़ा है, बेहतर स्थानिक सोच पर ध्यान केंद्रित करता है। यह क्षमता उन रोबोटों के लिए महत्वपूर्ण है जिन्हें गतिशील, तीन -महत्वपूर्ण वातावरण में कार्य करना है।
उदाहरण के लिए, मिथुन रोबोटिक्स-एर सहजता से पहचान सकता है कि किसी वस्तु का सबसे अच्छा उपयोग कैसे किया जा सकता है। यदि एक कॉफी कप मॉडल को दिखाया गया है, तो यह स्वतंत्र रूप से हैंडल पर कप उठाने और एक सुरक्षित आंदोलन की गणना करने के लिए एक उपयुक्त दो-उंगली हैंडल चुन सकता है।
कौशल और व्यावहारिक अनुप्रयोगों का प्रदर्शन किया
प्रभावशाली प्रदर्शन वीडियो में, Google डीपमाइंड नए एआई मॉडल के व्यावहारिक कौशल को दर्शाता है। रोबोट सिस्टम विभिन्न प्रकार के जटिल कार्यों को अंजाम दे सकते हैं, जिनमें शामिल हैं:
- ओरिगेमी और पेपर के सिलवटों
- मौखिक निर्देशों के आधार पर वस्तुओं को छाँटना और व्यवस्थित करना
- सटीक मनोरंजक और नाजुक वस्तुएं चलती हैं
- एक ETUI में चश्मे का सावधानीपूर्वक सम्मिलन
- पासा और छोटी वस्तुओं में हेरफेर करें
- एक साथ एक जिपर को बंद करना
- हेडफोन केबल लपेटना
- बास्केटबॉल डंकिंग जैसे सटीक कार्यों का निष्पादन
यह विशेष रूप से उल्लेखनीय है कि रोबोट केवल एक निर्देश प्राप्त करने के बाद स्वायत्त रूप से इन कार्यों को करते हैं। सिस्टम स्वतंत्र रूप से वस्तुओं का पता लगाता है, उनकी पहचान करता है, आवश्यक व्यक्तिगत चरणों को प्राप्त करता है और तदनुसार रोबोट हथियारों को नियंत्रित करता है।
आगे के विकास के लिए रणनीतिक भागीदारी
इस तकनीक की पूरी क्षमता को खोलने के लिए, Google DeepMind रोबोटिक्स उद्योग की प्रमुख कंपनियों के साथ काम करता है:
- Apptronik, एक टेक्सन स्टार्ट-अप जिसने ह्यूमनॉइड रोबोट "अपोलो" विकसित किया है, जिसे लॉजिस्टिक्स और मैन्युफैक्चरिंग कार्यों जैसे कि लिफ्टिंग, मूविंग और स्टैकिंग के लिए डिज़ाइन किया गया है।
- बोस्टन डायनेमिक्स, एक प्रसिद्ध रोबोटिक्स कंपनी जिसे विडंबना यह है कि Google द्वारा खरीदा गया था और बाद में फिर से बेचा गया था
- मिथुन रोबोटिक्स-एर के विकास और परीक्षण के लिए अन्य भागीदारों के रूप में चपलता रोबोटिक्स और एजाइल रोबोट
यह सहयोग उनकी व्यापक प्रयोज्यता को सुनिश्चित करने के लिए विभिन्न रोबोट प्लेटफार्मों पर प्रौद्योगिकी को लागू करने और परीक्षण करने के लिए Google की रणनीति दिखाता है।
के लिए उपयुक्त:
रोबोटिक्स के भविष्य के लिए अर्थ
दीपमाइंड में रोबोटिक्स के निदेशक, कनिष्का राव ने कहा कि एक संवाददाता सम्मेलन के दौरान, रोबोटिक्स में सबसे बड़ी चुनौतियों में से एक है कि रोबोट आमतौर पर ज्ञात परिदृश्यों में अच्छी तरह से काम करते हैं, लेकिन अज्ञात स्थितियों में विफल होते हैं। मिथुन रोबोटिक्स को इस समस्या को ठीक करना चाहिए।
के लिए उपयुक्त:
- ह्यूमनॉइड स्टैंडिंग-अप कंट्रोल: "होस्ट" ह्यूमनॉइड्स के साथ उठना सीखें-रोज़मर्रा की जिंदगी में रोबोट के लिए सफलता
रोबोट में बड़ी भाषा मॉडल (एलएलएम) का एकीकरण एक बढ़ती प्रवृत्ति का हिस्सा है, और मिथुन का दृष्टिकोण इसके सबसे प्रभावशाली उदाहरणों में से एक हो सकता है। स्टैनफोर्ड यूनिवर्सिटी में बायो इंजीनियरिंग के प्रोफेसर और ओपनमाइंड के संस्थापक जान लीफर्ड ने इस बात पर जोर दिया कि यह "उन्नत रोबोटों पर जेनेरिक एआई और बड़े भाषा मॉडल के उपयोग के पहले उदाहरणों में से एक है" और "वास्तव में रोबोट हेल्पर्स और रोबोट साथियों के विकास की कुंजी" हो सकती है।
एनवीडिया के सीईओ जेन्सेन हुआंग और भी आगे बढ़ते हैं और इंगित करते हैं कि रोबोट प्रदान करने के लिए जेनेरिक एआई का उपयोग बड़े पैमाने पर कई ट्रिलियन अमेरिकी डॉलर की बाजार क्षमता हो सकता है।
मिथुन और रोबोटिक्स: बुद्धिमान प्रणालियों के लिए एक मोड़?
प्रभावशाली प्रगति के बावजूद, अभी भी चुनौतियां हैं। केन गोल्डबर्ग, बर्कले में कैलिफोर्निया विश्वविद्यालय में रोबोटिक्स के प्रोफेसर, एआई सिस्टम को "रोबोटिक्स के क्षेत्र में एक रोमांचक विकास" के रूप में वर्णित करते हैं, लेकिन बताते हैं कि "ऑल-पर्पस रोबोट से पहले अभी भी बहुत कुछ करना है, रोज़मर्रा की जिंदगी में उपयोग के लिए तैयार हैं"।
Google ने आगामी Google I/O सम्मेलन के आसपास इस तकनीक की संभावनाओं के बारे में और जानकारी देने की योजना बनाई है। रोबोटिक्स में उनकी कई वर्षों की रुचि के साथ और अब एक उपयुक्त सॉफ्टवेयर घटक के रूप में मिथुन के साथ, Google बुद्धिमान रोबोट के विकास में एक नया अध्याय खोल सकता है।
भाषा से कार्रवाई: Google रोबोटिक्स में नए मानक सेट करता है
मिथुन रोबोटिक्स के साथ, Google डीपमाइंड ने एआई और रोबोटिक्स के संलयन की दिशा में एक महत्वपूर्ण कदम उठाया है। प्राकृतिक भाषा को समझने, जटिल वातावरण को देखने और शारीरिक कार्यों को पूरा करने की क्षमता भविष्य में रोबोट का उपयोग करने के तरीके में क्रांति ला सकती है।
यह तकनीक विशुद्ध रूप से डिजिटल एआई अनुप्रयोगों से उन प्रणालियों तक संक्रमण को चिह्नित करती है जो भौतिक दुनिया पर सीधा प्रभाव डाल सकते हैं। हालांकि यह कुछ एआई स्केप्टिक्स के साथ चिंताओं को ट्रिगर कर सकता है, Google डीपमाइंड का मुख्य ध्यान अनुकूली और उपयोगी रोबोट सिस्टम विकसित करने पर है जो कम प्रशिक्षण के साथ जटिल कार्यों का प्रबंधन कर सकते हैं।
आने वाले वर्षों से पता चलेगा कि यह तकनीक कैसे विकसित हो रही है और उद्योग से लेकर रोजमर्रा की जिंदगी तक आपको विभिन्न क्षेत्रों में क्या व्यावहारिक अनुप्रयोग मिलेंगे।
के लिए उपयुक्त:
आपका वैश्विक विपणन और व्यवसाय विकास भागीदार
☑️ हमारी व्यावसायिक भाषा अंग्रेजी या जर्मन है
☑️ नया: आपकी राष्ट्रीय भाषा में पत्राचार!
मुझे निजी सलाहकार के रूप में आपकी और मेरी टीम की सेवा करने में खुशी होगी।
संपर्क फ़ॉर्म भरकर मुझसे संपर्क कर सकते हैं +49 89 89 674 804 (म्यूनिख) पर कॉल कर सकते हैं । मेरा ईमेल पता है: वोल्फेंस्टीन ∂ xpert.digital
मैं हमारी संयुक्त परियोजना की प्रतीक्षा कर रहा हूं।