اختيار اللغة 📢


Google Gemini 2.0 ، The Motictail Intelligence and Robotics: Gemini Robotics and Gemini Robotics-er

تم النشر على: 20 مارس 2025 / تحديث من: 20 مارس 2025 - المؤلف: Konrad Wolfenstein

Google Gemini 2.0 ، The Motictail Intelligence and Robotics: Gemini Robotics and Gemini Robotics-er

Google Gemini 2.0 ، الذكاء الاصطناعي والروبوتات: الروبوتات الجوزاء والروبوتات الجوزاء-صورة إبداعية: Xpert.Digital

يعرض DeepMind الجوزاء: يبدأ العصر القادم من الروبوتات

الجوزاء الروبوتات: اندماج Google التحويلي للذكاء الاصطناعي والروبوتات

في 12 مارس 2025 ، قدمت Google Deepmind أحدث مشروع Gemini Robotics ، وهي تقنية رائعة تجمع بين نموذج لغة Gemini 2.0 القوي مع الروبوتات المتقدمة. يمثل هذا الابتكار علامة فارقة مهمة في تطوير أنظمة الروبوت الذكية التي يمكن أن تفهم اللغة الطبيعية وتؤدي مهام مادية معقدة.

Google DeepMind هي شركة أبحاث رائدة للذكاء الاصطناعي (AI) ، والتي تأسست في عام 2010 وتولى Google في عام 2014. إنه يركز على تطوير تقنيات الذكاء الاصطناعى المتقدمة ، والتي تتميز بالشبكات العصبية مع التخزين على المدى القصير والذاكرة الاصطناعية. حقق DeepMind اختراقات كبيرة ، بما في ذلك الدفاع عن اللاعبين البشر في اللعبة "GO" وتطوير Alphafold ، وهو نظام للتنبؤ بهياكل البروتين. تُستخدم تقنيات DeepMind في مجالات مثل الروبوتات والطب وكفاءة الطاقة ومعالجة اللغة.

الأسس التكنولوجية لروبوتات الجوزاء

تم تصميم Gemini Robotics كطول رؤية تقدمي لنموذج النموذج (VLA) ، والذي يعتمد على Gemini 2.0 القوي بالفعل. الابتكار المركزي هو أن النظام لا يمكنه فقط معالجة البيانات الرقمية مثل النصوص أو الصور أو مقاطع الفيديو ، ولكن يمكن أيضًا إجراء إجراءات مادية في العالم الحقيقي لأول مرة.

تستخدم التكنولوجيا الفهم متعدد الوسائط لـ Gemini 2.0 وتوسيعه بطريقة جديدة حاسمة: الإجراءات البدنية. يمكّن هذا الروبوتات من سد العالم الرقمي والمادي بطريقة لم تكن ممكنة بعد.

مناسب ل:

مهارات الوظيفة والإدراك

يكمن الاختراق التكنولوجي لروبوتات الجوزاء في قدرتها على إدراك المحيط من خلال الكاميرات ، والتعرف على الأشياء والتقاط أبعادها المكانية. ثم يتم تحويل هذه المعلومات إلى عالم ثلاثي الأبعاد مع إحداثيات فنية دقيقة.

يمكن للنظام أيضًا:

  • فهم أوامر اللغة الطبيعية وتنفيذها في الإجراءات المادية
  • فهم العلاقات المكانية المعقدة بين الأشياء
  • التكيف مع حالات جديدة غير معروفة
  • توليد أنواع مختلفة من الروبوت

النموذجان التكميليان: الجوزاء الروبوتات والروبوتات الجوزاء

لم تقدم Google DeepMind سوى بنموذج متخصص يعالجان جوانب مختلفة من AI Robotics AI.

الجوزاء الروبوتات

يجمع النموذج الرئيسي Robotics Gemini بين مهارات معالجة اللغة Gemini 2.0 والتحكم المادي. يمكّن الروبوتات من الرد على أوامر اللغة الطبيعية ، وفهم البيئات المعقدة وتنفيذ الإجراءات التكيفية.

الجوزاء الروبوتات

يركز النموذج الثاني ، Gemini Robotics-ER (حيث يركز على "التفكير المجسد" أو "المنطق المعدل") ، على تحسين التفكير المكاني. هذه القدرة هي أمر بالغ الأهمية بالنسبة للروبوتات التي يجب أن تعمل في بيئات ديناميكية ثلاثية الأبعاد.

على سبيل المثال ، يمكن لـ Gemini Robotics-ER التعرف بشكل حدسي على كيفية استخدام الكائن بشكل أفضل. إذا تم عرض فنجان القهوة على الطراز ، فيمكنه اختيار مقبض ملبع مناسب لرفع الكوب على المقبض وحساب حركة آمنة.

إظهار المهارات والتطبيقات العملية

في مقاطع الفيديو التوضيحية المثيرة للإعجاب ، تعرض Google DeepMind المهارات العملية لنماذج الذكاء الاصطناعى الجديدة. يمكن أن تقوم أنظمة الروبوت بتنفيذ مجموعة متنوعة من المهام المعقدة ، بما في ذلك:

  • طيات الأوريغامي والورق
  • فرز وتنظيم الكائنات بناءً على التعليمات اللفظية
  • أجساد دقيق وتحريك كائنات هشة
  • إدراج دقيق للنظارات في etui
  • النرد والتلاعب بالأشياء الصغيرة
  • إغلاق سحاب معًا
  • التفاف كابلات سماعة الرأس
  • تنفيذ المهام الدقيقة مثل كرة السلة

تجدر الإشارة بشكل خاص إلى أن الروبوتات تؤدي هذه المهام بشكل مستقل بعد أن تلقوا تعليمات فقط. يكتشف النظام بشكل مستقل الكائنات ، ويحددها ، ويستمد الخطوات الفردية الضرورية ويتحكم في أذرع الروبوت وفقًا لذلك.

الشراكات الاستراتيجية لمزيد من التطوير

من أجل فتح الإمكانات الكاملة لهذه التكنولوجيا ، تعمل Google Deepmind مع الشركات الرائدة من صناعة الروبوتات:

  • AppTronik ، شركة ناشئة في تكساس التي طورت الروبوت البشري "Apollo" ، وهو مصمم لمهام الخدمات اللوجستية والتصنيع مثل الرفع والتحرك وتكديس الصناديق
  • Boston Dynamics ، وهي شركة روبوتات معروفة تم شراؤها من قبل Google وبيعها مرة أخرى لاحقًا
  • روبوتات الرشاقة والروبوتات الرشيقة كشركاء آخرين لتطوير واختبار الروبوتات الجوزاء

يوضح هذا التعاون استراتيجية Google لتنفيذ واختبار التكنولوجيا على منصات الروبوت المختلفة لضمان قابلية تطبيقها الواسعة.

مناسب ل:

معنى لمستقبل الروبوتات

وقال مدير الروبوتات في Deepmind ، Kanishka Rao ، خلال مؤتمر صحفي ، أحد أكبر التحديات في الروبوتات تتكون من أن الروبوتات تعمل بشكل جيد في السيناريوهات المعروفة ، لكنها تفشل في مواقف غير معروفة. يجب أن تحل الجوزاء الروبوتات هذه المشكلة بالضبط.

مناسب ل:

يعد دمج نماذج اللغة الكبيرة (LLMS) في الآلية جزءًا من الاتجاه المتزايد ، ويمكن أن يكون نهج الجوزاء أحد أكثر الأمثلة إثارة للإعجاب على ذلك. يؤكد جان ليبهارت ، أستاذ الهندسة الحيوية في جامعة ستانفورد ومؤسس شركة OpenMind ، على أن هذا "أحد الأمثلة الأولى لاستخدام الذكاء الاصطناعي والنماذج اللغوية الكبيرة على الآثار المتقدمة" و "مفتاح تطوير مساعدي الروبوت ورفاق الروبوت".

يذهب جنسن هوانغ ، الرئيس التنفيذي لشركة NVIDIA ، إلى أبعد من ذلك ويشير إلى أن استخدام الذكاء الاصطناعى التوليدي لتوفير الروبوتات يمكن أن يكون إمكانات في السوق لعدة تريليون دولار أمريكي على نطاق واسع.

الجوزاء والروبوتات: نقطة تحول للأنظمة الذكية؟

على الرغم من التقدم المثير للإعجاب ، لا تزال هناك تحديات. يصف كين جولدبرغ ، أستاذ الروبوتات في جامعة كاليفورنيا في بيركلي ، أنظمة الذكاء الاصطناعى بأنها "تطور مثير في مجال الروبوتات" ، لكنه يشير إلى أنه "لا يزال هناك الكثير مما يجب القيام به قبل أن تكون الروبوتات المتعددة الأغراض جاهزة للاستخدام في الحياة اليومية".

تخطط Google لإعطاء المزيد من الأفكار حول إمكانيات هذه التكنولوجيا حول مؤتمر Google I/O القادم. بفضل سنوات اهتمامه بالروبوتات والآن مع Gemini كمكون مناسب للبرامج ، يمكن لـ Google فتح فصل جديد في تطوير الروبوتات الذكية.

من لغة إلى أخرى: تضع Google معايير جديدة في الروبوتات

مع Robotics Gemini ، اتخذت Google Deepmind خطوة مهمة نحو دمج الذكاء الاصطناعي والروبوتات. يمكن أن تحدث القدرة على فهم اللغة الطبيعية ، وإدراك البيئات المعقدة وتنفيذ الإجراءات البدنية ثورة في الطريقة التي سيتم بها استخدام الروبوتات في المستقبل.

تمثل هذه التكنولوجيا الانتقال من تطبيقات الذكاء الاصطناعي الرقمي البحت إلى الأنظمة التي يمكن أن يكون لها تأثير مباشر على العالم المادي. على الرغم من أن هذا قد يؤدي إلى مخاوف مع بعض المتشككين في الذكاء الاصطناعي ، فإن التركيز الرئيسي لـ Google DeepMind هو تطوير أنظمة روبوت مفيدة ومفيدة يمكنها إدارة المهام المعقدة مع تدريب أقل.

ستوضح السنوات القادمة كيف تتطور هذه التكنولوجيا والتطبيقات العملية التي ستجدها في مجالات مختلفة ، من الصناعة إلى الحياة اليومية.

مناسب ل:

 

شريكك العالمي في التسويق وتطوير الأعمال

☑️ لغة العمل لدينا هي الإنجليزية أو الألمانية

☑️ جديد: المراسلات بلغتك الوطنية!

 

الرائد الرقمي - كونراد ولفنشتاين

كونراد ولفنشتاين

سأكون سعيدًا بخدمتك وفريقي كمستشار شخصي.

يمكنك الاتصال بي عن طريق ملء نموذج الاتصال أو ببساطة اتصل بي على +49 89 89 674 804 (ميونخ) . عنوان بريدي الإلكتروني هو: ولفنشتاين xpert.digital

إنني أتطلع إلى مشروعنا المشترك.

 

 

☑️ دعم الشركات الصغيرة والمتوسطة في الإستراتيجية والاستشارات والتخطيط والتنفيذ

☑️ إنشاء أو إعادة تنظيم الإستراتيجية الرقمية والرقمنة

☑️ توسيع عمليات البيع الدولية وتحسينها

☑️ منصات التداول العالمية والرقمية B2B

☑️ رائدة تطوير الأعمال / التسويق / العلاقات العامة / المعارض التجارية


⭐️ الذكاء الاصطناعي (AI) - مدونة الذكاء الاصطناعي ونقطة الاتصال ومركز المحتوى ⭐️ الروبوتات/الروبوتات ⭐️ XPaper