
रोबोट और अन्य एआई एजेंटों के लिए: मेटा-एआई के एआई मॉडल वी-जेईपीए 2-एआई जो हमारी भौतिक दुनिया-छवि को समझता है: Xpert.digital
मेटा ने V-JEPA 2: AI सिस्टम भौतिक दुनिया के बारे में भविष्यवाणियों को सीखता है
मेटा वी-जेईपीए 2: ए रिवोल्यूशनरी एआई वर्ल्ड मॉडल फॉर द फ्यूचर ऑफ आर्टिफिशियल इंटेलिजेंस
वी-जेईपीए 2 के साथ, मेटा ने एक ग्राउंडब्रेकिंग एआई प्रणाली प्रस्तुत की है जो पारंपरिक बड़े वॉयस मॉडल की तुलना में एक मौलिक दृष्टिकोण का पीछा करती है। 1.2 बिलियन पैरामीटर स्ट्रॉन्ग वर्ल्ड मॉडल को भौतिक दुनिया को समझने और यह अनुमान लगाने के लिए रोबोट और अन्य एआई एजेंटों की मदद करने के लिए विकसित किया गया था कि यह अपने कार्यों पर कैसे प्रतिक्रिया देगा।
V-JEPA 2 क्या है और यह वॉयस मॉडल से कैसे अलग है?
V-JEPA 2 "वीडियो संयुक्त एम्बेडिंग प्रेडिक्टिव आर्किटेक्चर 2" के लिए खड़ा है और पारंपरिक आवाज मॉडल की तुलना में पूरी तरह से अलग वास्तुकला पर आधारित है। जबकि वॉयस मॉडल जैसे कि CHATGPT या GPT-4 पाठ अनुक्रमों के बारे में संभाव्य भविष्यवाणियां करते हैं, V-JEPA 2 एक अमूर्त प्रतिनिधित्व कक्ष में काम करता है और भौतिक कानूनों को समझने पर ध्यान केंद्रित करता है।
निर्णायक अंतर सीखने की विधि में है: भाषा के मॉडल को बड़ी मात्रा में लेबल डेटा और निगरानी प्रशिक्षण के माध्यम से सीखने की आवश्यकता होती है। दूसरी ओर, वी-जेईपीए 2, स्व-निगरानी सीखने और अनिच्छुक वीडियो से ज्ञान निकालने का उपयोग करता है, जो डेटा की तैयारी के लिए लागत को काफी कम कर देता है। मॉडल पिक्सेल पुनर्निर्माण के माध्यम से नहीं सीखता है, लेकिन वीडियो सामग्री के अमूर्त अभ्यावेदन के माध्यम से।
जेईपीए आर्किटेक्चर: भविष्यवाणी द्वारा सीखना
संयुक्त एम्बेडिंग प्रेडिक्टिव आर्किटेक्चर (जेईपीए) को यान लेकुन, मेटास चीफ एआई साइंटिस्ट द्वारा विकसित किया गया था और यह जेनेक्टिव एआई मॉडल के विकल्प का प्रतिनिधित्व करता है। हर लापता पिक्सेल को फिर से संगठित करने की कोशिश करने वाले जेनेरिक दृष्टिकोणों के विपरीत, वी-जेईपीए 2 नकाबपोश वीडियो ओक के साथ काम करता है और अमूर्त अवधारणाओं की भविष्यवाणी करना सीखता है।
सिस्टम एक दो -स्टेज प्रशिक्षण दृष्टिकोण का उपयोग करता है:
पहला चरण: स्व -मोनिटोरड लर्निंग
- एक लाख घंटे से अधिक वीडियो सामग्री और एक मिलियन चित्रों के साथ प्रशिक्षण
- मानव एनोटेशन के बिना शारीरिक बातचीत पैटर्न सीखें
- भौतिक दुनिया के एक आंतरिक मॉडल का विकास
दूसरा चरण: कार्रवाई -संबंधित अनुकूलन
- Droid डेटा सेट से केवल 62 घंटे के रोबोट नियंत्रण डेटा के साथ ठीक ट्यूनिंग
- भविष्य कहनेवाला कौशल में एजेंट कार्यों का एकीकरण
- नियोजन और बंद नियंत्रण सर्किट नियंत्रण को सक्षम करना
व्यवहार में बेहतर प्रदर्शन
V-JEPA 2 विभिन्न क्षेत्रों में प्रभावशाली प्रदर्शन को प्रदर्शित करता है:
वीडियो समझ और गति का पता लगाना
- 77.3% शीर्ष 1 सटीकता कुछ में कुछ v2 डेटा सेट
- एपिक-किचेंस -100 एक्शन फोरकास्ट के लिए 39.7% रिकॉल-एटी -5 (पिछले मॉडल की तुलना में 44% सुधार)
- विभिन्न वीडियो प्रश्नों की प्रतिक्रिया कार्य कार्यों में अत्याधुनिक प्रदर्शन
रोबोट नियंत्रण
- अज्ञात वातावरण में पिक-एंड-प्लेस कार्यों के लिए 65-80% सफलता दर
- परिवेश-विशिष्ट प्रशिक्षण के बिना शून्य-शॉट रोबोट नियंत्रण
- फ्रेंका रोबोट हथियारों के साथ दो अलग -अलग प्रयोगशालाओं में उपयोग करें
प्रतियोगिता की तुलना में दक्षता
वी-जेईपीए 2 एनवीडिया के कॉस्मॉस मॉडल की तुलना में 30 गुना तेज है और रोबोट की कार्रवाई की योजना बनाने के लिए केवल 16 सेकंड की आवश्यकता होती है, जबकि कॉस्मोस को 4 मिनट की आवश्यकता होती है।
तकनीकी नवाचार और प्रमुख विशेषताओं
मॉडल को पांच केंद्रीय तकनीकी सफलताओं की विशेषता है:
- स्व -मोनोरिटेड लर्निंग: बड़ी मात्रा में लेबल किए गए डेटा की आवश्यकता को समाप्त करता है
- मास्किंग तंत्र: छिपे हुए वीडियो क्षेत्रों की भविष्यवाणी करके मॉडल को प्रशिक्षित करता है
- सार प्रतिनिधि सीखना: पिक्सेल विवरण के बजाय शब्दार्थ अर्थों पर ध्यान केंद्रित करें
- विश्व मॉडल वास्तुकला: भौतिक कानूनों की आंतरिक समझ की स्थापना
- कुशल ट्रांसफर लर्निंग: बकाया शून्य-शॉट लर्निंग स्किल्स
वर्तमान एआई की नई बेंचमार्क स्पष्ट सीमाएँ
मेटा ने वी-जेईपीए 2 के साथ समानांतर में तीन नए बेंचमार्क जारी किए हैं जो एआई सिस्टम की भौतिक समझ का परीक्षण करते हैं:
Intphys 2
शारीरिक रूप से प्रशंसनीय और असंभव परिदृश्यों के बीच अंतर करने की क्षमता का परीक्षण करता है। यहां तक कि उन्नत मॉडल अभी भी यादृच्छिक स्तर के करीब हैं।
एमवीपीबीएनच
नेत्रहीन इसी तरह के वीडियो कारों का उपयोग उसी प्रश्न के विरोध के साथ करता है। V-JEPA 2 44.5% युग्मित सटीकता तक पहुंचता है-सभी परीक्षण किए गए प्रणालियों का सबसे अच्छा प्रदर्शन।
Causalvqa
कारण समझ और काउंटर -एक्टुअल सोच की जांच करता है। परिणाम बताते हैं कि वर्तमान एआई सिस्टम अच्छी तरह से वर्णन कर सकते हैं कि वे क्या देखते हैं लेकिन वैकल्पिक पाठ्यक्रमों की भविष्यवाणी करने में कठिनाई होती है।
डेटा के लिए भूख के बिना AI: कैसे v-jepa 2 मशीन लर्निंग अधिक कुशल बनाता है
यान लेकुन वी-जेईपीए 2 जैसे विश्व मॉडल में एआई विकास की अगली पीढ़ी की कुंजी को देखता है। मॉडल आवेदन के विभिन्न क्षेत्रों में क्रांति ला सकता है:
रोबोटिक्स और बजट सहायक
विश्व मॉडल रोबोटिक्स के एक नए युग को हेराल्ड करने वाले हैं जिसमें एआई एजेंट प्रशिक्षण डेटा की खगोलीय मात्रा के बिना वास्तविक कार्यों का प्रबंधन कर सकते हैं।
स्वायत्त वाहन
वी-जेईपीए 2 से वास्तविक समय की स्थानिक समझ स्वायत्त वाहनों, गोदाम रोबोट और ड्रोन डिलीवरी सिस्टम के लिए महत्वपूर्ण हो सकती है।
विस्तारित वास्तविकता (एआर) और आभासी सहायक
मेटा ने ऑडियो विश्लेषण को एकीकृत करके और एआर चश्मा और आभासी सहायकों के लिए वीडियो समझ का विस्तार करके वी-जेईपीए 2 के कार्यों का विस्तार करने की योजना बनाई है।
खुला स्रोत उपलब्धता और अनुसंधान संवर्धन
मेटा ने वैश्विक एआई अनुसंधान को बढ़ावा देने के लिए एक खुले स्रोत के रूप में सीसी-बाय-एनसी लाइसेंस के तहत वी-जेईपीए 2 जारी किया है। मॉडल कोड GitHub पर उपलब्ध है और इसे Google Colab और Kaggle जैसे प्लेटफार्मों पर निष्पादित किया जा सकता है। यह खुलापन कई अन्य बड़े एआई मॉडल के विपरीत है और इसका उद्देश्य रोबोटिक्स और सन्निहित एआई में विश्व मॉडल के विकास को बढ़ावा देना है।
एआई विकास में एक प्रतिमान बदलाव
V-JEPA 2 भौतिक दुनिया की गहरी समझ के लिए शुद्ध भाषा प्रसंस्करण से एक मौलिक प्रतिमान बदलाव का प्रतिनिधित्व करता है। जबकि अधिकांश एआई कंपनियां जेनेरिक मॉडल पर भरोसा करती हैं, मेटा अपने विश्व मॉडल दृष्टिकोण के साथ कृत्रिम बुद्धिमत्ता के भविष्य के लिए एक वैकल्पिक दृष्टि का अनुसरण करती है। न्यूनतम डेटा से सीखने और शून्य-शॉट रोबोट नियंत्रण को सक्षम करने की क्षमता बुद्धिमान प्रणालियों की एक नई पीढ़ी के लिए मार्ग प्रशस्त कर सकती है जो न केवल समझती है, बल्कि वास्तविक दुनिया में भी कार्य कर सकती है।
के लिए उपयुक्त:
आपका वैश्विक विपणन और व्यवसाय विकास भागीदार
☑️ हमारी व्यावसायिक भाषा अंग्रेजी या जर्मन है
☑️ नया: आपकी राष्ट्रीय भाषा में पत्राचार!
मुझे निजी सलाहकार के रूप में आपकी और मेरी टीम की सेवा करने में खुशी होगी।
संपर्क फ़ॉर्म भरकर मुझसे संपर्क कर सकते हैं +49 89 89 674 804 (म्यूनिख) पर कॉल कर सकते हैं । मेरा ईमेल पता है: वोल्फेंस्टीन ∂ xpert.digital
मैं हमारी संयुक्त परियोजना की प्रतीक्षा कर रहा हूं।