تم نشره على: 17 أبريل 2025 / تحديث من: 17 أبريل 2025 - المؤلف: Konrad Wolfenstein
يصبح ChatGPT عميلًا رائعًا: تفكر نماذج الذكاء الاصطناعى الجديد من Openai O3 و O4-Mini الآن! - الصورة: xpert.digital
أكثر ذكاءً من أي وقت مضى: أعجبت سلسلة Openaai's O بالمهارات الجديدة
الرياضيات والبرمجة والمزيد: Openai's O4-Mini هو الطفل الجديد AI Wonder! - يفهم Openai's O3 الصور ويحل مشاكل لم يسبق له مثيل!
في 16 أبريل 2025 ، قدم Openai نموذجين جديدين لمنظمة العفو الدولية في سلسلته O3 و O4-Mini. ويشار إلى هذه النماذج الأكثر ذكاء وأقوى للشركة. تتميز الأنظمة الجديدة بمهارات التفكير المحسنة ويمكنها استخدام جميع الأدوات المتوفرة ودمجها في Chatt لأول مرة. لقد تم تدريبهم بشكل خاص على التفكير لفترة أطول قبل توليد الإجابة ، مما يجعلها فعالة بشكل خاص في المهام المعقدة مثل البرمجة والرياضيات والتحليل البصري.
مناسب ل:
نماذج السلسلة O الجديدة في لمحة
الخصائص والمهارات الأساسية
تمثل السلسلة O من Openai تحولًا نموذجًا في تطوير الذكاء الاصطناعي. تم تدريب النماذج باستخدام التعلم التعزيز من أجل إجراء عمليات تفكير أطول قبل توليد الإجابة. يمكّن هذا النهج النماذج من تجربة استراتيجيات الحلول المختلفة ، والتعرف على الأخطاء وتفكيك المشكلات المعقدة إلى خطوات فرعية أبسط.
هناك ابتكار مهم على O3 و O4-MINI هو القدرة على استخدام جميع أدوات Chattt المتاحة بشكل مستقل وعملية. يتضمن ذلك البحث على الويب ، وتحليل البيانات المستندة إلى Python ، ومعالجة الصور ، وتوليد الصور ، والقطن ، والأتمتة ، والبحث عن الملفات ووظائف الذاكرة. يتم دمج هذه الأدوات مباشرة في عملية التفكير في النماذج من أجل توسيع مهاراتها وإدارة المهام الأكثر تعقيدًا.
يمكن أن تقرر النماذج بأنفسهم متى وكيف تستخدم هذه الأدوات بشكل أفضل وعادة ما تقدم إجابات في أقل من دقيقة واحدة ، حتى مع وجود مشاكل أكثر تعقيدًا. هذا يمثل خطوة مهمة نحو تشات القائم على الوكيل يمكنه تنفيذ المهام بشكل مستقل.
الفهم البصري والمهارات متعددة الوسائط
خاصية رائعة بشكل خاص للنماذج الجديدة هي قدرتها على "التفكير" مع الصور. وفقًا لـ Openaai ، هذا يعني أنه لا يمكنك إدراك البيانات المرئية فحسب ، بل يمكنك أيضًا الاندماج مباشرة في عملية تفكيرك. يمكن للنماذج فهم وتحليل الصور التي تم تحميلها مثل الألواح البيضاء والرسومات والرسوم البيانية ، حتى لو كانت أقل جودة.
هذه المهارات متعددة الوسائط تتجاوز معالجة الصور النقية. يمكن للموديلات تقليص الصور أو تحويلها ، ودمجها مع أدوات أخرى وإدراجها في قطار الفكر في استخلاص استنتاجات جيدة. يمثل هذا التكامل للبيانات المرئية في عملية التفكير تقدمًا كبيرًا مقارنة بنماذج الذكاء الاصطناعى السابقة.
الأداء والمعايير
O3 كنموذج رئيسي
يوصف Openai O3 بأنه أقوى نموذج للتفكير في الشركة ، والذي يحدد معايير جديدة في مجالات مثل البرمجة والرياضيات والعلوم الطبيعية والإدراك البصري. في التقييمات التي أجراها الخبراء الخارجيون ، يرتكب O3 حوالي 20 في المائة من الأخطاء الأقل خطورة من سابقتها O1 في مهام حقيقية معقدة.
في المعايير المختلفة ، يظهر O3 نتائج رائعة:
- إنه يحقق أفضل القيم الجديدة لـ Codeforces و Swe-Bench
- يضع معايير جديدة في معيار MMMU لفهم الفهم متعدد الوسائط
- في المعايير العلمية مثل GPQA Diamond ، والتي تقيس الأسئلة على مستوى الدكتوراه ، يحقق O3 دقة 87.7 ٪ مقارنة بـ 78 ٪ في O1
يوضح النموذج نقاط قوة خاصة في البرمجة ، وفي منطقة الاستشارات والمهام الإبداعية. أكد المختبرين في وقت مبكر صارمًا تحليليًا كشريك تفكير وأكد قدرته على توليد وتقييم الفرضيات الجديدة بشكل نقدي - وخاصة في السياقات البيولوجية والرياضية والتقنية.
O4-MINI كبديل فعال من حيث التكلفة
يعد O4-Mini نموذجًا أصغر تم تحسينه للمعالجة السريعة والفعالة من حيث التكلفة. على الرغم من انخفاض حجمها ، فإنه يحقق إنجازات رائعة ، وخاصة في مجالات الرياضيات والبرمجة والمهام المرئية.
إنه أقوى نموذج في AIME 2024 و 2025 القياس. في AIME 2025 ، وصلت إلى دقة مثيرة للإعجاب بنسبة 99.5 في المئة مع الوصول إلى مترجم بيثون. في تقييمات الخبراء ، فإنه يتجاوز أيضًا سابقتها O3-MINI في المناطق غير النخاعية وفي علوم البيانات.
بفضل كفاءتها ، تدعم O4-MINI حدود استخدام أعلى بكثير من O3 ، مما يجعلها خيارًا قويًا للتطبيقات ذات الحجم الكبير والإنتاجية التي تستفيد من التفكير المنطقي.
مجالات التطبيق والتوافر
الاستخدامات المحتملة
مع مهاراتهم المحسنة ، تفتح النماذج الجديدة مجموعة متنوعة من التطبيقات:
- حلول المشكلات المعقدة في العلوم والتكنولوجيا ، حيث تكون قدرتها على تفكيك المشكلات في خطوات جزئية ذات قيمة خاصة
- مهام البرمجة وتطوير البرمجيات ، حيث يمكنك دعم codegenization واستكشاف الأخطاء وإصلاحها
- التحليلات الرياضية والعلمية على مستوى عال
- التحليل البصري للمخططات والرسومات والصور
- التطبيقات المستندة إلى الوكيل والتي تستخدم فيها الذكاء الاصطناعى بشكل مستقل أدوات مختلفة لحل المهام
توافر المستخدمين
يتم توفير النماذج الجديدة تدريجياً لمجموعات المستخدمين المختلفة:
- يمكن لمستخدمي ChatGpt Plus و Pro و Team إمكانية الوصول إلى O3 و O4-Mini و O4-Mini في محدد النماذج منذ 16 أبريل 2025 ، حيث
- يتلقى ChatGpt Enterprise ومستخدم EDU الوصول خلال أسبوع بعد النشر
- يمكن للمستخدمين الأحرار تجربة O4-Mini عن طريق اختيار "Think" في الملحن قبل إرسال طلبك
- تظل حدود المعدل لجميع الخطط دون تغيير مقارنة بالنماذج السابقة
مناسب ل:
الجوانب الأمنية ومزيد من التطوير
الأمن والمتانة: نظرة خلف نماذج Openai الجديدة
يؤكد Openai على أن كلا النموذجين قد تعرضوا لاختبارات أمنية واسعة النطاق - وفقًا للشركة ، إنه برنامج الأمان الأكثر شمولاً حتى الآن. توفر مهارات التفكير التدريجي للنماذج طرقًا جديدة لتحسين الأمن والمتانة. على وجه الخصوص ، يمكن أن تفكر النماذج في إرشادات الأمان الخاصة بـ Openai إذا كانت رد فعلها على استفسارات غير آمنة - وهو مفهوم يسمى "المحاذاة التداولية".
يحدث المنشور بموجب الإصدار 2 من "إطار التأهب" من قبل Openaai. فحصت المجموعة الاستشارية للسلامة للشركة (SAG) نتائج تقييمات الاستعداد وتوصلت إلى أن O3 و O4-MINI في لا من الفئات الثلاثة التي يتم مراقبتها (المهارات البيولوجية والكيميائية ، ومقاومة الإلكترونية والتحسين الذاتي منظمة العفو الدولية) تحقق العتبة "عالية".
معنى للمناظر الطبيعية من الذكاء الاصطناعي
يعد إدخال O3 و O4-MINI خطوة مهمة في تطور أنظمة الذكاء الاصطناعى. من خلال قدرتها المحسنة على التفكير بشكل منطقي ودمج أدوات مختلفة ، تتعامل هذه النماذج مع نظام قائم على الوكيل يمكنه حل المهام المعقدة بشكل مستقل.
مع هذه النماذج ، تواصل Openaai وضع نفسها على رأس Development Development ، والتي تم التأكيد عليها أيضًا من خلال الجولة الأخيرة من التمويل ، والتي بلغت الشركة 300 مليار دولار. يمكن أن يوسع مزيج التصحيح المحسّن وتكامل الأدوات والمهارات المتعددة الوسائط بشكل كبير من مجال تطبيق الذكاء الاصطناعي وفتح مجالات جديدة للتطبيق.
O3 و O4-MINI: نماذج قوية من الذكاء الاصطناعي لتحديات معقدة
مع O3 و O4-MINI ، قدمت Openai نماذج جديدة لمنظمة العفو الدولية ، والتي ، بفضل قدرات رد الفعل المحسنة وتكامل الأدوات المختلفة ، هي تقدم كبير في تطوير الذكاء الاصطناعي. تتميز النماذج بقدرتها على التفكير من خلال المشكلات المعقدة واستخدام أدوات مختلفة للعثور على الحل. في حين يتم وضع O3 كنموذج رئيسي للمهام الصعبة ، فإن O4-MINI يقدم بديلاً فعالًا من حيث التكلفة ، على الرغم من انخفاض حجمه ، يحقق أداءً مثيرًا للإعجاب.
النماذج الجديدة متاحة بالفعل لمجموعات مستخدمي الثرثرة المختلفة ويمكنها توسيع نطاق تطبيقات الذكاء الاصطناعي بفضل مهاراتها المحسنة. في الوقت نفسه ، يؤكد Openai على أهمية الجوانب الأمنية وأوضح النماذج لاختبارات واسعة لتقليل المخاطر المحتملة. يمثل تطوير O3 و O4-MINI خطوة مهمة نحو أنظمة الذكاء الاصطناعى القائمة على الوكيل ، والتي يمكن أن تتقن مهام معقدة بشكل متزايد بشكل مستقل.
مناسب ل:
شريكك العالمي في التسويق وتطوير الأعمال
☑️ لغة العمل لدينا هي الإنجليزية أو الألمانية
☑️ جديد: المراسلات بلغتك الوطنية!
سأكون سعيدًا بخدمتك وفريقي كمستشار شخصي.
يمكنك الاتصال بي عن طريق ملء نموذج الاتصال أو ببساطة اتصل بي على +49 89 89 674 804 (ميونخ) . عنوان بريدي الإلكتروني هو: ولفنشتاين ∂ xpert.digital
إنني أتطلع إلى مشروعنا المشترك.