تم نشره على: 15 أبريل 2025 / تحديث من: 15 أبريل 2025 - المؤلف: Konrad Wolfenstein
تصنيف بحث الذكاء الاصطناعي: نماذج الذكاء الاصطناعى من السونار الحيرة تتصدر في صورة المناظر الطبيعية للبحث عن الذكاء الاصطناعي: xpert.digital
السونار-موسمي-عالي: قفزة الحيرة إلى قمة بحث الذكاء الاصطناعي
تغيير في نظام البحث من الذكاء الاصطناعي: معلم الحيرة في التطوير
حققت نماذج السونار في Perplexity نتائج مثيرة للإعجاب في أحدث تقييم لعلاج البحث عن LM ، حيث يعتبر Sonar-Reseasoning-Pro-High بعد Gemini-2.5 من Google رائدًا. يمثل هذا التقييم علامة فارقة مهمة في تطور أنظمة البحث من الذكاء الاصطناعى ويؤكد الوضع الرائد في الحيرة في هذا المجال التنافسي.
مناسب ل:
- Perplexity Sonar Pro API كمحرك بحث يعمل بالذكاء الاصطناعي في التطبيقات والأدوات الخارجية - للتطبيقات الذكية والبحث المخصص
تقييم LM Search Arena
يعد LM Search Arena منصة تقييم جديدة تم تطويرها بواسطة LM Arena لتقييم أنظمة الذكاء الاصطناعي المعقدة للبحث على أساس التفضيلات البشرية. على عكس المعايير السابقة مثل SimpleQA ، والتي ركزت على الدقة الواقعة الوثيقة ، تقوم ساحة البحث بتقييم كيفية قطع النماذج من استفسارات المستخدم الحقيقية في مجالات مثل البرمجة والكتابة والبحث والتوصيات.
تم التقييم في الفترة ما بين 18 مارس و 13 أبريل 2025 وجمع أكثر من 10000 صوت تفضيل بشري لـ 11 نموذجًا. طُلب من المستخدمين طلب الاستفسارات ثم تقييم الاستجابة النموذجية التي تحتاجها معلوماتهم بشكل أفضل.
الأداء المتميز لنماذج السونار
وصلت إلى درجة حرارة السونار-بيرو-برو إلى درجة 1136 (± 21/−19) ، وهو ما يعادل إحصائياً مع عملية Google -2.5 (1142 +14/-17) ، وبالتالي يعني وجود موقع أعلى مشترك. تجدر الإشارة بشكل خاص إلى أنه مع مقارنات مباشرة ، تجاوزت Gemini-2.5-Pro-roghing في 53 ٪ من الحالات.
يتم توضيح هيمنة الحيرة في التقييم من خلال الترتيب التالي:
- Gemini-2.5-Pro-Grounding (1142 نقطة)
- السونار-موسمي-ارتفاع (1136 نقطة)
- سونار-موسعة (1097 نقطة)
- السونار (1072 نقطة)
- سونار برو العالي (1071 نقطة)
- سونار برو (1066 نقطة)
أخذت جميع نماذج الحيرة الرتب العليا وتجاوزت نماذج مختلفة بشكل كبير من Google (Gemini 2.0-Flash Grounding) و Openai (GPT-4O Search).
العوامل الرئيسية للنجاح
حددت ساحة البحث ثلاثة عوامل ترتبط بقوة مع التفضيل البشري:
إجابات أكثر شمولاً
تم تفضيل الإجابات الأطول من قبل المستخدمين (معامل 0.255 ، P <0.05). توفر نماذج Sonar معلومات مفصلة مفصلة عن مجموعة متنوعة من الموضوعات ، مما يؤدي إلى رضا المستخدم الأعلى.
التفوق في المصادر
يرتبط عدد أكبر من الاقتباسات بقوة مع تفضيل المستخدم (معامل 0.234 ، P <0.05). تنفذ نماذج السونار بحثًا أعمق وتبادل في المتوسط من مصادر 2-3 مرات أكثر من نماذج الجوزاء المماثلة. يضمن استخدام المصدر الشامل هذا أن المعلومات المقدمة موثقة بشكل جيد وجديرة بالثقة.
استخدام مصادر مختلفة
أظهر التقييم أن اقتباسات من مصادر الويب المجتمعية كانت ذات قيمة خاصة. تتميز نماذج السونار بالاستخدام الفعال لمصادر مختلفة ، بما في ذلك YouTube ومنصات المجتمع والمصادر الموثوقة.
أكدت تجارب التحكم هذه النتائج وأظهرت أن عمق البحث هو فرق أساسي في الأداء بين النماذج. عند التحقق من عروض الأسعار ، تتقارب تصنيفات النموذج ، مما يشير إلى أن عمق البحث هو عامل تمايز حاسم.
مناسب ل:
التكنولوجيا وراء السونار
يعتمد نموذج السونار في Perplexity على LAMA 3.3 70B وتم تطويره خصيصًا لتحسين جودة الإجابة وتجربة المستخدم. تم تدريبه على تحسين الإخلاص وقابلية الإجابات.
السرعة والأداء
الدافع وراء السونار بالبنية التحتية لخير الدماغ ويوفر إجابات في الرمز المميز لـ SPEED-1200 المثير للإعجاب في الثانية ، مما يتيح توليد الاستجابة الفورية تقريبًا. هذه السرعة أسرع 10 مرات تقريبًا من نماذج مماثلة مثل Gemini 2.0 Flash.
تفضيل المستخدم ومقارنة الأداء
أظهرت اختبارات A/B واسعة النطاق أن Sonar يتجاوز بوضوح نماذج مثل GPT-4O Mini و Claude 3.5 Haiku وحتى يحقق أداء النماذج العليا مثل GPT-4O و Claude 3.5 Bonnet عندما يتعلق الأمر برضا المستخدم.
API Sonar: إمكانية الوصول للمطورين
تقدم Perplexity أيضًا تقنية Sonar عبر واجهات برمجة التطبيقات ، والتي تمكن المطورين من دمج وظائف البحث المستندة إلى الذكاء الاصطناعي في تطبيقاتهم. هناك نسختان رئيسيتان من واجهة برمجة التطبيقات:
API السونار
واجهة برمجة تطبيقات Sonar القياسية خفيفة الوزن وغير مكلفة وسريعة وسهلة الاستخدام. لقد تم تصميمه للشركات التي تحتاج إلى وظائف غير معقدة في الإجابة على الأسئلة وتم تحسينها للسرعة.
Sonar Pro API
بالنسبة للشركات التي تحتاج إلى وظائف أكثر تقدمًا ، توفر Sonar Pro API الفرصة لمعالجة استفسارات أكثر تعقيدًا ومتعددة المراحل. في المتوسط ، يولد ضعف عدد المصادر لكل بحث مثل الإصدار القياسي ولديه نافذة سياق أكبر لاستعلامات البحث أطول وأكثر دقة.
يعكس هيكل الأسعار هذه الاختلافات: يكلف السونار القياسي 5 دولارات لكل 1000 دولار بالإضافة إلى 1 دولار لكل 750،000 كلمة (المدخلات والمخرجات مجتمعة). يحتفظ Sonar Pro بنفس عمليات البحث عن 5 دولارات ، ولكنها تحسب كلمة مدخلات بقيمة 750،000 دولار و 15 دولارًا لكل 750،000 دولار تم إنشاؤها.
من عوامل الدقة إلى اتجاه المستخدم: اقتنع سونار الحيرة
تؤكد النتائج المعلقة في تقييم LM Search Arena أن نماذج Sonar الخاصة بالحيرة هي من بين أنظمة البحث الرائدة في الذكاء الاصطناعي. مع مزيج من الإخلاص ومعلومات المصدر الواسعة وقدرة البحث العميق ، فإنها توفر تجربة مستخدم فائقة.
تؤكد هذه النجاحات على موقف الحيرة كمبدع في مجال البحث المستند إلى الذكاء الاصطناعي وتوفير المعلومات. يشير التحسين المستمر للنماذج القائمة على ملاحظات المستخدم إلى مزيد من الإمكانات للتطورات المستقبلية.
بالنسبة للمستخدمين الحيرة ، تعني هذه النتائج أن لديهم إمكانية الوصول إلى دقة من الدرجة الأولى ، وإسناد المصدر الواسع والإجابات عالية الجودة لمجموعة واسعة من الموضوعات. يمكن للمستخدمين المحترفين الاستمرار في الاستفادة من هذه النماذج القوية من خلال تحديد السونار كنموذج قياسي في الإعدادات.
لا يؤكد الأداء القوي للسونار في تقييم ساحة البحث فقط على الكفاءة التكنولوجية للحيرة ، ولكنه يوضح أيضًا الطريق لمستقبل البحث عن الذكاء الاصطناعي: بدقة أكثر شمولاً وبفهم أعمق لاحتياجات المعلومات للمستخدمين.
مناسب ل:
تحول الذكاء الاصطناعي ، وتكامل الذكاء الاصطناعى وخبير صناعة منصة الذكاء الاصطناعى
☑️ لغة العمل لدينا هي الإنجليزية أو الألمانية
☑️ جديد: المراسلات بلغتك الوطنية!
سأكون سعيدًا بخدمتك وفريقي كمستشار شخصي.
يمكنك الاتصال بي عن طريق ملء نموذج الاتصال أو ببساطة اتصل بي على +49 89 89 674 804 (ميونخ) . عنوان بريدي الإلكتروني هو: ولفنشتاين ∂ xpert.digital
إنني أتطلع إلى مشروعنا المشترك.