Available in 27 languages 📢
Предпочитайте Xpert.Digital в Google

Класиране на AI търсенето: AI моделите на Perplexity Sonar са лидери в пейзажа на AI търсенето

Публикувано на: 15 април 2025 г. / Актуализирано на: 15 април 2025 г. – Автор: Konrad Wolfenstein

Класиране на AI търсенето: AI моделите на Perplexity Sonar са лидери в пейзажа на AI търсенето

Класация на AI търсенето: AI моделите на Perplexity Sonar са лидери в пейзажа на AI търсенето – Изображение: Xpert.Digital

Sonar Reasoning Pro-High: Скокът на Perplexity към върха на търсенето с изкуствен интелект

Системи за търсене с изкуствен интелект в преход: важен етап в развитието на Perplexity

Моделите Sonar на Perplexity постигнаха впечатляващи резултати в последната оценка на LM Search Arena, като Sonar-Reasoning-Pro-High се класира редом с Gemini-2.5-Pro-Grounding на Google. Тази класация представлява важен етап в еволюцията на системите за търсене с изкуствен интелект и подчертава водещата позиция на Perplexity в тази силно конкурентна област.

Свързано с това:

Оценка на арената за търсене на LM

LM Search Arena е новаторска платформа за оценка, разработена от LM Arena, за да се оценят системи с изкуствен интелект, подобрени при търсене, въз основа на човешките предпочитания. За разлика от предишни бенчмаркове като SimpleQA, които се фокусираха върху тясна фактическа точност, Search Arena оценява как моделите се представят при реални потребителски заявки в области като програмиране, писане, изследвания и препоръки.

Оценката се проведе между 18 март и 13 април 2025 г. и събра над 10 000 човешки гласа за предпочитания за 11 модела. Потребителите бяха помолени да изпратят запитвания и след това да оценят кой отговор на модела отговаря по-добре на техните информационни нужди.

Изключително представяне на моделите сонар

Класиране на AI търсене: Изключително представяне на моделите сонар

Класация на AI Search: Изключителна производителност на сонарните модели – Изображение: Perplexity

Sonar-Reasoning-Pro-High на Perplexity постигна резултат от 1136 (±21/−19) в Arena, което е статистически еквивалентно на Gemini-2.5-Pro-Grounding на Google (1142 +14/-17), като по този начин си осигури споделена челна позиция. Особено забележително е, че при директни сравнения Sonar-Reasoning-Pro-High превъзхожда Gemini-2.5-Pro-Grounding в 53% от случаите.

Доминирането на Perplexity в оценката е илюстрирано от следното класиране:

  1. Заземяване на Gemini 2.5 Pro (1142 точки)
  2. Sonar Reasoning Pro-High (1136 точки)
  3. Сонарно разсъждение (1097 точки)
  4. Сонар (1072 точки)
  5. Sonar-Pro-High (1071 точки)
  6. Sonar-Pro (1066 точки)

Всички модели на Perplexity заеха челните места, значително превъзхождайки други оценявани модели от Google (Gemini-2.0-Flash-Grounding) и OpenAI (GPT-4o Search).

Ключови фактори за успех

Search Arena идентифицира три фактора, които силно корелират с човешките предпочитания:

По-изчерпателни отговори

По-дългите отговори бяха предпочитани от потребителите (коефициент 0,255, p<0,05). Моделите Sonar предоставят изчерпателна и подробна информация по широк кръг от теми, което води до по-висока удовлетвореност на потребителите.

Превъзходство в цитирането на източници

По-големият брой цитати корелира силно с предпочитанията на потребителите (коефициент 0,234, p <0,05). Моделите Sonar извършват по-задълбочено търсене и цитират средно 2-3 пъти повече източници от сравнимите модели Gemini. Това всеобхватно използване на източници гарантира, че предоставената информация е добре документирана и надеждна.

Използване на различни източници

Оценката показа, че цитатите от обществени уеб източници са особено ценени. Моделите Sonar се характеризират с ефективното използване на различни източници, включително YouTube, обществени платформи и авторитетни източници.

Контролните експерименти потвърдиха тези открития и показаха, че дълбочината на търсене е значителна разлика в производителността между моделите. При контролиране на цитатите, класирането на моделите се сближи, което предполага, че дълбочината на търсене е ключов диференциращ фактор.

Свързано с това:

Технологията зад сонара

Сонарният модел на Perplexity е базиран на Llama 3.3 70B и е специално подобрен, за да оптимизира качеството на отговорите и потребителското изживяване. Той е обучен да подобри фактическата точност и четимостта на отговорите.

Скорост и производителност

Sonar се захранва от инфраструктурата за инференциален анализ на Cerebras и предоставя отговори с впечатляваща скорост – 1200 токена в секунда, което позволява генериране на почти мигновени отговори. Тази скорост е почти 10 пъти по-бърза от сравними модели като Gemini 2.0 Flash.

Сравнение на потребителските предпочитания и производителността

Обширни A/B тестове показаха, че Sonar значително превъзхожда модели като GPT-4o mini и Claude 3.5 Haiku и дори достига или надминава производителността на топ модели като GPT-4o и Claude 3.5 Sonnet по отношение на удовлетвореността на потребителите.

Sonar API: Достъпност за разработчици

Perplexity предлага своята сонарна технология и чрез API, което позволява на разработчиците да интегрират възможности за търсене, задвижвани от изкуствен интелект, в своите приложения. Има две основни версии на API:

API на сонар

Стандартният Sonar API е лек, рентабилен, бърз и лесен за използване. Той е проектиран за бизнеси, които се нуждаят от ясна функционалност за въпроси и отговори и са оптимизирани за скорост.

Sonar Pro API

За бизнеси, изискващи по-разширени функции, Sonar Pro API предлага възможност за обработка на по-сложни, многоетапни заявки. Той генерира средно два пъти повече цитати на източници на търсене в сравнение със стандартната версия и разполага с по-голям контекстен прозорец за по-дълги и по-нюансирани заявки.

Ценовата структура отразява тези разлики: Standard Sonar струва $5 на 1000 търсения плюс $1 на 750 000 думи (комбиниран вход и изход). Sonar Pro запазва същата цена от $5 на 1000 търсения, но таксува $3 на 750 000 входни думи и $15 на 750 000 генерирани думи.

От фактори за точност до лекота на използване: Сонарът на Perplexity впечатлява

Изключителните резултати в оценката на LM Search Arena потвърждават, че моделите Sonar на Perplexity са сред водещите системи за търсене с изкуствен интелект. Чрез комбиниране на фактическа точност, обширни цитати от източници и възможности за задълбочено търсене, те предлагат превъзходно потребителско изживяване.

Тези успехи подчертават позицията на Perplexity като новатор в областта на търсенето и предоставянето на информация, задвижвани от изкуствен интелект. Непрекъснатото усъвършенстване на моделите ѝ, базирано на обратна връзка от потребителите, показва по-нататъшен потенциал за бъдещи разработки.

За потребителите на Perplexity тези резултати означават, че имат достъп до най-висока точност, изчерпателно посочване на източника и висококачествени отговори по широк кръг от теми. Pro потребителите могат допълнително да се възползват от тези мощни модели, като зададат Sonar като модел по подразбиране в настройките.

Силното представяне на Sonar в Search Arena Evaluation не само подчертава технологичния опит на Perplexity, но и посочва пътя за бъдещето на търсенето с изкуствен интелект: по-точно, по-изчерпателно и с по-дълбоко разбиране на информационните нужди на потребителите.

Свързано с това:

 

Вашият експерт в индустрията за трансформация, интеграция и платформи с изкуствен интелект

☑️ Нашият бизнес език е английски или немски

☑️ НОВО: Кореспонденция на родния ви език!

 

Дигитален пионер - Konrad Wolfenstein

Konrad Wolfenstein

Аз и моят екип с удоволствие ще бъдем на ваше разположение като ваш личен съветник.

Можете да се свържете с мен, като попълните формата за контакт тук или просто ми се обадите на +49 89 89 674 804 ( Мюнхен) . Моят имейл адрес е: [email protected]

Очаквам с нетърпение нашия съвместен проект.

 

 

☑️ Подкрепа за МСП в стратегията, консултирането, планирането и внедряването

☑️ Създаване или пренасочване на стратегията за ИИ

☑️ Pioneer Business Development


⭐️ Изкуствен интелект (ИИ) - Блог за ИИ, гореща точка и център за съдържание ⭐️ Дигитален интелект ⭐️ Дигитална трансформация ⭐️ XPaper