פורסם ב: 15 באפריל, 2025 / עדכון מאת: 15 באפריל 2025 - מחבר: קונרד וולפנשטיין
סונאר-אימון-פרו-גבוה: הקפיצה של מבולבל לחיפוש AI
שינוי במערכת החיפוש AI: אבן הדרך של מבולבל בפיתוח
דגמי הסונאר של Proplexity השיגו תוצאות מרשימות בהערכת הזירת החיפוש האחרונה של LM, לפיה סונאר-אייבוש-גבוה-גבוה לאחר ש- Gemini-2.5-קרקע של גוגל היא מנהיג. הערכה זו מייצגת אבן דרך חשובה בהתפתחות מערכות חיפוש AI ומדגישה את עמדתו המובילה של המבוכה בתחום תחרותי זה.
מתאים לכך:
הערכת זירת החיפוש LM
זירת החיפוש LM היא פלטפורמת הערכה חדשה שפותחה על ידי LM Arena כדי להעריך מערכות AI מחוזקות בחיפוש על בסיס העדפות אנושיות. בניגוד למדדים קודמים כמו SimpleQA, שהתרכזו בדיוק עובדתי קרוב, זירת החיפוש מעריכה כיצד מודלים מנותקים לבירורי משתמשים אמיתיים בתחומים כמו תכנות, כתיבה, מחקר והמלצות.
ההערכה התקיימה בין 18 במרץ ל -13 באפריל 2025 ואספה למעלה מ -10,000 קולות העדפה אנושית ל -11 דגמים. המשתמשים התבקשו לשאול פניות ואז להעריך איזו תגובה של מודל מתגב על צרכי המידע שלהם.
ביצועים מצטיינים של דגמי הסונאר
הסונאר-סונאר-סונאר-סונאר-פרו-גבוה של Proplexity הגיע לציון זירה של 1136 (± 21/−19), וזה שווה סטטיסטית לתהליך של Gemini-2.5 של גוגל (1142 +14/-17) ובכך פירושו מיקום עליון משותף. ראוי לציין במיוחד כי עם השוואה ישירה של סונאר-סונאר-אימון-פרו-גבוהים-גובה-גובה-קרקעית חרגה ב 53% מהמקרים.
הדומיננטיות של נבכה בהערכה ממחישה על ידי הדירוג הבא:
- GEMINI-2.5-PROO-CRONDOR (1142 נקודות)
- סונאר-אימון-פרו-גבוה (1136 נקודות)
- סונאר-סיבוב (1097 נקודות)
- סונאר (1072 נקודות)
- Sonar-Pro-High (1071 נקודות)
- סונאר-פרו (1066 נקודות)
כל דגמי ה- Proplexity לקחו את הדרגות העליונות וחרגו מדגמים מדורגים שונים באופן משמעותי מ- Google (Gemini 2.0-Flash הארקה) ו- OpenAI (חיפוש GPT-4O).
גורמי מפתח להצלחה
זירת החיפוש זיהתה שלושה גורמים שמתואמים חזק עם העדפה אנושית:
תשובות מקיפות יותר
תשובות ארוכות יותר העדיפו משתמשים (מקדם 0.255, p <0.05). דגמי הסונאר מספקים מידע מפורט ומפורט על מגוון נושאים, מה שמוביל לשביעות רצון משתמשים גבוהה יותר.
עליונות במקורות
מספר גבוה יותר של ציטוטים מתואם חזק עם העדפת המשתמש (מקדם 0.234, p <0.05). דגמי הסונאר מבצעים חיפוש עמוק יותר ומצטט בממוצע פי 2-3 יותר מקורות מאשר דגמי תאומים דומים. שימוש מקור מקיף זה מבטיח שהמידע המסופק מתועד היטב ואמין.
שימוש במקורות שונים
ההערכה הראתה כי ציטוטים ממקורות האינטרנט הקהילתיים היו מוערכים במיוחד. דגמי הסונאר מאופיינים בשימוש יעיל במקורות שונים, כולל יוטיוב, פלטפורמות קהילתיות ומקורות סמכותיים.
ניסויי בקרה אישרו ממצאים אלה והראו כי עומק החיפוש הוא הבדל מהותי בביצועים בין הדגמים. כאשר נבדקים אם יש הצעות מחיר, דירוג המודל התכנסו, מה שמצביע על כך שעומק החיפוש הוא גורם בידול מכריע.
מתאים לכך:
הטכנולוגיה שמאחורי סונאר
מודל הסונאר של Proplexity מבוסס על LLAMA 3.3 70B והוא פותח באופן ספציפי לאופטימיזציה של איכות התשובה וחוויית המשתמש. זה הוכשר לשפר את הנאמנות והקריאות של התשובות.
מהירות וביצועים
סונאר מונע על ידי תשתית Cerebras ומספק תשובות באסימון מרשים-1200 מרשים לשנייה, המאפשר יצירת תגובה כמעט מיידית. מהירות זו מהירה כמעט פי 10 מאשר עם דגמים דומים כמו פלאש Gemini 2.0.
העדפת משתמש והשוואת ביצועים
בדיקות A/B נרחבות הראו כי סונאר עולה בבירור על דגמים כמו GPT-4O Mini ו- Claude 3.5 Haiku ואף משיגים את הביצועים של הדגמים המובילים כמו GPT-4O ו- Claude 3.5 Bonnet בכל מה שקשור לשביעות רצון המשתמשים.
API לסונאר: נגישות למפתחים
Proplexity מציעה גם את טכנולוגיית הסונאר שלה באמצעות ממשקי API, המאפשרת למפתחים לשלב פונקציות חיפוש מבוססות AI ביישומים שלהם. ישנן שתי גרסאות עיקריות של ה- API:
סונאר API
ממשק ה- API הסונאר הרגיל הוא קל משקל, לא יקר, מהיר וקל לשימוש. זה תוכנן לחברות הזקוקות לפונקציות תשובות לשאלות לא מסובכות ומותאמות למהירות.
Sonar Pro API
עבור חברות הזקוקות לפונקציות מתקדמות יותר, ה- Sonar Pro API מציע אפשרות לעבד פניות מורכבות יותר ורב -שלביות. בממוצע, הוא מייצר כפליים מקורות רבים לכל חיפוש כמו הגרסה הסטנדרטית ויש לו חלון הקשר גדול יותר לשאילתות חיפוש ארוכות ויותר ניואנסות.
מבנה המחירים משקף את ההבדלים הללו: סונאר סטנדרטיים עולה 5 $ לאלף פלוס 1 $ לכל 750,000 מילים (קלט ותפוקה בשילוב). Sonar Pro שומר על אותם 5 $ 1,000 חיפושים, אך מחשב 750,000 $ מילות קלט ו -15 $ לכל 750,000 $ מילים שנוצרו.
מגורמי דיוק ועד אוריינטציה של המשתמש: הסונאר של מבולבל משוכנע
התוצאות הבולטות בהערכת זירת החיפוש של LM מאששות כי דגמי הסונאר של Proplexity הם בין מערכות החיפוש המובילות ב- AI. עם השילוב של נאמנות, מידע מקור נרחב ויכולת חיפוש עמוקה, הם מציעים חווית משתמש מעולה.
הצלחות אלה מדגישות את עמדת המבוכה כחדשן בתחום חיפוש מבוסס AI ומתן מידע. השיפור המתמיד של הדגמים על בסיס משוב של משתמשים מציין פוטנציאל נוסף להתפתחויות עתידיות.
עבור משתמשי מבולבל, תוצאות אלה פירושן שיש להן גישה לדיוק מהשורה הראשונה, ייחוס מקור נרחב ותשובות באיכות גבוהה למגוון רחב של נושאים. משתמשי מקצוענים יכולים להמשיך ליהנות מהדגמים החזקים הללו על ידי קביעת הסונאר כמודל הסטנדרטי שלהם בהגדרות.
הביצועים החזקים של סונאר בהערכת זירת החיפוש לא רק מדגישים את היכולת הטכנולוגית של מבוכה, אלא גם מראה את הדרך לעתיד לחפש AI: ליתר דיוק, מקיף יותר ובהבנה עמוקה יותר של צרכי המידע של המשתמשים.
מתאים לכך:
טרנספורמציית AI שלך, שילוב AI ומומחה לתעשיית הפלטפורמה AI
☑️ השפה העסקית שלנו היא אנגלית או גרמנית
☑️ חדש: התכתבויות בשפה הלאומית שלך!
אני שמח להיות זמין לך ולצוות שלי כיועץ אישי.
אתה יכול ליצור איתי קשר על ידי מילוי טופס יצירת הקשר או פשוט להתקשר אליי בטלפון +49 89 674 804 (מינכן) . כתובת הדוא"ל שלי היא: וולפנשטיין ∂ xpert.digital
אני מצפה לפרויקט המשותף שלנו.