Избор језика 📢


Рангирање вештачке интелигенције у претрази: Perplexity Sonar-ови вештачки модели су лидери у претрази помоћу вештачке интелигенције

Објављено: 15. априла 2025. / Ажурирано: 15. априла 2025. – Аутор: Konrad Wolfenstein

Рангирање вештачке интелигенције у претрази: Perplexity Sonar-ови вештачки модели су лидери у претрази помоћу вештачке интелигенције

Рангирање вештачке интелигенције у претрази: Perplexity Sonar-ови вештачки модели су лидери у окружењу вештачке интелигенције у претрази – Слика: Xpert.Digital

Sonar Reasoning Pro-High: Perplexity-јев скок на врх AI претраге

Системи за претрагу са вештачком интелигенцијом у транзицији: Перплекситијева прекретница у развоју

Перплекситијеви Сонар модели су постигли импресивне резултате у најновијој евалуацији LM Search Arena, са Sonar-Reasoning-Pro-High рангом, заједно са Google-овим Gemini-2.5-Pro-Grounding. Овај ранг представља значајну прекретницу у еволуцији AI система за претрагу и наглашава водећу позицију Перплекситија у овој веома конкурентној области.

У вези са овим:

Евалуација арене за претрагу ЛМ-а

LM Search Arena је нова платформа за евалуацију коју је развила LM Arena за процену система вештачке интелигенције побољшаних претрагом на основу људских преференција. За разлику од претходних бенчмаркова као што је SimpleQA, који се фокусирао на уску чињеничну тачност, Search Arena процењује како модели функционишу на упитима корисника из стварног света у областима као што су програмирање, писање, истраживање и препоруке.

Евалуација је спроведена између 18. марта и 13. априла 2025. године и прикупљено је преко 10.000 људских гласова за 11 модела. Од корисника је затражено да пошаљу упите, а затим оцене који одговор модела боље задовољава њихове информативне потребе.

Изузетне перформансе сонарних модела

Рангирање вештачке интелигенције у претрази: Изузетне перформансе сонарних модела

Рангирање вештачке интелигенције у претрази: Изузетне перформансе сонарних модела – Слика: Perplexity

Перплекситијев Sonar-Reasoning-Pro-High је постигао Арена резултат од 1136 (±21/−19), што је статистички еквивалентно Гугловом Gemini-2.5-Pro-Grounding (1142 +14/-17), чиме је обезбедио заједничку водећу позицију. Посебно је вредно напоменути да је у директним поређењима Sonar-Reasoning-Pro-High надмашио Gemini-2.5-Pro-Grounding у 53% случајева.

Доминација Збуњености у евалуацији илустрована је следећим рангирањем:

  1. Gemini 2.5 Pro уземљење (1142 поена)
  2. Sonar Reasoning Pro-High (1136 поена)
  3. Сонарно резоновање (1097 поена)
  4. Сонар (1072 поена)
  5. Sonar-Pro-High (1071 поен)
  6. Сонар-Про (1066 поена)

Сви Perplexity модели су заузели водеће позиције, значајно надмашујући друге оцењене моделе од стране Google-а (Gemini-2.0-Flash-Grounding) и OpenAI-а (GPT-4o Search).

Кључни фактори успеха

Search Arena је идентификовала три фактора која су снажно повезана са људским преференцијама:

Свеобухватнији одговори

Корисници су преферирали дуже одговоре (коефицијент 0,255, p<0,05). Сонар модели пружају свеобухватне, детаљне информације о широком спектру тема, што доводи до већег задовољства корисника.

Супериорност у навођењу извора

Већи број цитата је снажно корелирао са преференцијама корисника (коефицијент 0,234, p<0,05). Sonar модели врше дубљу претрагу и цитирају, у просеку, 2-3 пута више извора него упоредиви Gemini модели. Ова свеобухватна употреба извора осигурава да су дате информације добро документоване и поуздане.

Коришћење различитих извора

Евалуација је показала да су цитати из веб извора заједнице посебно цењени. Модели Sonar карактеришу ефикасно коришћење различитих извора, укључујући YouTube, платформе заједнице и ауторитативне изворе.

Контролни експерименти су потврдили ове налазе и показали да дубина претраге представља значајну разлику у перформансама између модела. Када се контролишу цитати, рангирање модела је конвергирало, што сугерише да је дубина претраге кључни фактор разликовања.

У вези са овим:

Технологија која стоји иза сонара

Перплекситијев сонарни модел је базиран на Llama 3.3 70B и посебно је побољшан како би се оптимизовао квалитет одговора и корисничко искуство. Обучен је да побољша чињеничну тачност и читљивост одговора.

Брзина и перформансе

Сонар се покреће инферентном инфраструктуром Cerebras и пружа одговоре импресивном брзином – 1200 токена у секунди, омогућавајући готово тренутно генерисање одговора. Ова брзина је скоро 10 пута већа од упоредивих модела као што је Gemini 2.0 Flash.

Поређење корисничких преференција и учинка

Опсежни А/Б тестови су показали да Sonar значајно надмашује моделе попут GPT-4o mini и Claude 3.5 Haiku, па чак и да се по питању задовољства корисника поклапа са перформансама врхунских модела попут GPT-4o и Claude 3.5 Sonnet или чак превазилази тешке моделе.

Sonar API: Приступачност за програмере

Перплексити такође нуди своју сонарну технологију путем АПИ-ја, омогућавајући програмерима да интегришу могућности претраживања засноване на вештачкој интелигенцији у своје апликације. Постоје две главне верзије АПИ-ја:

Сонар АПИ

Стандардни Sonar API је лаган, исплатив, брз и једноставан за коришћење. Дизајниран је за предузећа којима је потребна једноставна функционалност питања и одговора и оптимизована су за брзину.

Сонар Про АПИ

За предузећа којима су потребне напредније функције, Sonar Pro API нуди могућност обраде сложенијих, вишестепених упита. Генерише, у просеку, двоструко више цитата извора по претрази него стандардна верзија и има већи контекстуални прозор за дуже и нијансираније упите.

Структура цена одражава ове разлике: Стандардни Сонар кошта 5 долара по 1.000 претрага плус 1 долар по 750.000 речи (комбиновани улаз и излаз). Сонар Про задржава истих 5 долара по 1.000 претрага, али наплаћује 3 долара по 750.000 унетих речи и 15 долара по 750.000 генерисаних речи.

Од фактора тачности до једноставности коришћења: Перплекситијев сонар импресионира

Изузетни резултати у евалуацији LM Search Arena потврђују да су Perplexity-јеви Sonar модели међу водећим AI системима за претрагу. Комбиновањем чињеничне тачности, опсежних цитата извора и могућности дубоке претраге, они нуде врхунско корисничко искуство.

Ови успеси подвлачују позицију компаније Perplexity као иноватора у области претраживања и пружања информација заснованих на вештачкој интелигенцији. Континуирано унапређење њених модела на основу повратних информација корисника указује на даљи потенцијал за будући развој.

За кориснике Perplexity-ја, ови резултати значе да имају приступ врхунској тачности, свеобухватном навођењу извора и висококвалитетним одговорима на широк спектар тема. Про корисници могу додатно имати користи од ових моћних модела тако што ће подесити Sonar као подразумевани модел у подешавањима.

Сонаров снажан учинак у Search Arena Evaluation не само да подвлачи технолошку стручност компаније Perplexity, већ и указује на пут за будућност вештачке интелигенције: прецизније, свеобухватније и са дубљим разумевањем информационих потреба корисника.

У вези са овим:

 

Ваш стручњак за трансформацију вештачке интелигенције, интеграцију вештачке интелигенције и индустрију платформи за вештачку интелигенцију

☑️ Наш пословни језик је енглески или немачки

☑️ НОВО: Преписка на вашем матерњем језику!

 

Дигитални пионир - Konrad Wolfenstein

Konrad Wolfenstein

Ја и мој тим смо срећни што вам можемо бити на располагању као ваш лични саветник.

Можете ме контактирати попуњавањем контакт форме овде [email protected]:или ме једноставно позовите на +49 7348 4088 965. Моја имејл адреса је

Радујем се нашем заједничком пројекту.

 

 

☑️ Подршка малим и средњим предузећима у стратегији, консултацијама, планирању и имплементацији

☑️ Креирање или преусмеравање стратегије вештачке интелигенције

☑️ Пионирски развој пословања


⭐️ Вештачка интелигенција (ВИ) - Блог о ВИ, жариште и центар за садржај  ⭐️ Дигитална интелигенција  ⭐️ Дигитална трансформација  ⭐️ XPaper