Hangválasztás 📢


MI keresési rangsor: A Perplexity Sonar MI-modelljei vezető szerepet töltenek be a MI keresési környezetében

Megjelent: 2025. április 15. / Frissítve: 2025. április 15. – Szerző: Konrad Wolfenstein

MI keresési rangsor: A Perplexity Sonar MI-modelljei vezető szerepet töltenek be a MI keresési környezetében

AI keresési rangsor: A Perplexity Sonar AI-modelljei vezetők az AI keresési környezetben – Kép: Xpert.Digital

Sonar Reasoning Pro-High: A Perplexity ugrása a mesterséges intelligencia keresésének élére

AI keresőrendszerek átmeneti időszakban: A Perplexity mérföldköve a fejlesztésben

A Perplexity Sonar modelljei lenyűgöző eredményeket értek el a legfrissebb LM Search Arena értékelésben, a Sonar-Reasoning-Pro-High helyezést elérve a Google Gemini-2.5-Pro-Grounding helyezésével együtt. Ez a helyezés jelentős mérföldkövet jelent a mesterséges intelligencia által biztosított keresőrendszerek fejlődésében, és aláhúzza a Perplexity vezető pozícióját ezen a rendkívül versenyképes területen.

Alkalmas:

Az LM Search Arena értékelése

Az LM Search Arena egy újszerű értékelő platform, amelyet az LM Arena fejlesztett ki a keresést támogató mesterséges intelligenciarendszerek emberi preferenciákon alapuló értékelésére. A korábbi, szűk tényszerű pontosságra összpontosító benchmarkokkal, például a SimpleQA-val ellentétben a Search Arena azt értékeli, hogy a modellek hogyan teljesítenek valós felhasználói lekérdezésekben olyan területeken, mint a programozás, az írás, a kutatás és az ajánlások.

Az értékelés 2025. március 18. és április 13. között zajlott, és több mint 10 000 emberi preferenciaszavazatot gyűjtöttek 11 modellre. A felhasználókat arra kérték, hogy küldjenek be kérdéseket, majd értékeljék, hogy melyik modellválasz felelt meg jobban információigényüknek.

A szonár modellek kiemelkedő teljesítménye

AI keresési rangsor: A szonár modellek kiemelkedő teljesítménye

AI keresési rangsor: A szonármodellek kiemelkedő teljesítménye – Kép: Perplexity

A Perplexity Sonar-Reasoning-Pro-High tesztje 1136-os (±21/−19) Arena pontszámot ért el, ami statisztikailag megegyezik a Google Gemini-2.5-Pro-Grounding tesztjével (1142 +14/-17), így megosztott első helyet szerzett magának. Különösen figyelemre méltó, hogy közvetlen összehasonlításokban a Sonar-Reasoning-Pro-High az esetek 53%-ában felülmúlta a Gemini-2.5-Pro-Grounding tesztet.

A Perplexitás dominanciáját az értékelésben a következő rangsor szemlélteti:

  1. Gemini 2.5 Pro Grounding (1142 pont)
  2. Sonar Reasoning Pro-High (1136 pont)
  3. Szonáros érvelés (1097 pont)
  4. Szonár (1072 pont)
  5. Sonar-Pro-High (1071 pont)
  6. Sonar-Pro (1066 pont)

Minden Perplexity modell az élmezőnyben végzett, jelentősen felülmúlva a Google (Gemini-2.0-Flash-Grounding) és az OpenAI (GPT-4o Search) többi értékelt modelljét.

A siker kulcstényezői

A Search Arena három olyan tényezőt azonosított, amelyek szorosan összefüggenek az emberi preferenciákkal:

Átfogóbb válaszok

A felhasználók a hosszabb válaszokat részesítették előnyben (együttható 0,255, p<0,05). A Sonar modellek átfogó, részletes információkat nyújtanak a témák széles köréről, ami magasabb felhasználói elégedettséghez vezet.

Felsőbbség a forráshivatkozásokban

A magasabb hivatkozási szám szorosan korrelált a felhasználói preferenciákkal (együttható 0,234, p<0,05). A Sonar modellek mélyebb keresést végeznek, és átlagosan 2-3-szor több forrást idéznek, mint a hasonló Gemini modellek. A források ilyen átfogó felhasználása biztosítja, hogy a megadott információk jól dokumentáltak és megbízhatóak legyenek.

Különböző források használata

Az értékelés kimutatta, hogy a közösségi webes forrásokból származó hivatkozásokat különösen értékelték. A Sonar modelleket a különféle források, többek között a YouTube, a közösségi platformok és a hiteles források hatékony használata jellemzi.

Kontrollkísérletek megerősítették ezeket az eredményeket, és kimutatták, hogy a keresési mélység jelentős teljesítménybeli különbség a modellek között. Az idézések kontrollálásakor a modellek rangsorolása konvergált, ami arra utal, hogy a keresési mélység kulcsfontosságú megkülönböztető tényező.

Alkalmas:

A szonár mögött álló technológia

A Perplexity szonármodellje a Llama 3.3 70B-n alapul, és kifejezetten a válaszok minőségének és a felhasználói élmény optimalizálása érdekében lett továbbfejlesztve. A modellt a válaszok tényszerű pontosságának és olvashatóságának javítására képezték ki.

Sebesség és teljesítmény

A Sonar a Cerebras következtetési infrastruktúrájára épül, és lenyűgöző sebességgel – másodpercenként 1200 tokennel – ad válaszokat, lehetővé téve a szinte azonnali válaszadást. Ez a sebesség majdnem tízszer gyorsabb, mint a hasonló modellek, például a Gemini 2.0 Flash esetében.

Felhasználói preferenciák és teljesítmény-összehasonlítás

Kiterjedt A/B tesztek kimutatták, hogy a Sonar jelentősen felülmúlja az olyan modelleket, mint a GPT-4o mini és a Claude 3.5 Haiku, sőt, a felhasználói elégedettség tekintetében eléri vagy meghaladja a csúcsmodellek, például a GPT-4o és a Claude 3.5 Sonnet teljesítményét.

Sonar API: Akadálymentesítés fejlesztők számára

A Perplexity API-kon keresztül is kínálja szonár technológiáját, lehetővé téve a fejlesztők számára, hogy mesterséges intelligencián alapuló keresési képességeket integráljanak alkalmazásaikba. Az API-nak két fő verziója létezik:

Sonar API

A szabványos Sonar API könnyűsúlyú, költséghatékony, gyors és könnyen használható. Olyan vállalkozások számára tervezték, amelyeknek egyszerű kérdés-felelet funkciókra van szükségük, és amelyek a sebességre vannak optimalizálva.

Sonar Pro API

A fejlettebb funkciókat igénylő vállalkozások számára a Sonar Pro API lehetővé teszi az összetettebb, többlépcsős lekérdezések kezelését. Átlagosan kétszer annyi forráshivatkozást generál keresésenként, mint a standard verzió, és nagyobb kontextusablakkal rendelkezik a hosszabb és árnyaltabb lekérdezésekhez.

Az árképzési struktúra tükrözi ezeket a különbségeket: a standard Sonar ára 5 dollár 1000 keresésenként, plusz 1 dollár 750 000 szónként (kombinált bemenet és kimenet). A Sonar Pro ára változatlanul 5 dollár 1000 keresésenként, de 3 dollárt számít fel 750 000 bemeneti szónként és 15 dollárt 750 000 generált szónként.

A pontossági tényezőktől a felhasználóbarát jellegig: A Perplexity szonárja lenyűgöző

Az LM Search Arena értékelésében elért kiemelkedő eredmények megerősítik, hogy a Perplexity Sonar modelljei a vezető mesterséges intelligencia alapú keresőrendszerek közé tartoznak. A tényszerű pontosság, a kiterjedt forráshivatkozások és a mélyreható keresési képességek ötvözésével kiváló felhasználói élményt nyújtanak.

Ezek a sikerek alátámasztják a Perplexity innovátori pozícióját a mesterséges intelligencia alapú keresés és információszolgáltatás területén. A felhasználói visszajelzéseken alapuló modelljeinek folyamatos fejlesztése további fejlesztési lehetőségeket jelez.

A Perplexity felhasználói számára ezek az eredmények azt jelentik, hogy a lehető legpontosabb adatokhoz, átfogó forrásmegjelöléshez és kiváló minőségű válaszokhoz férhetnek hozzá számos témában. A profi felhasználók további előnyöket élvezhetnek, ha a beállításokban a Sonar-t állítják be alapértelmezett modellként.

A Sonar erős teljesítménye a Search Arena Evaluation teszten nemcsak a Perplexity technológiai szakértelmét hangsúlyozza, hanem utat mutat a mesterséges intelligencia alapú keresés jövője számára is: pontosabb, átfogóbb és a felhasználók információs igényeit mélyebben megértő lesz.

Alkalmas:

 

Az Ön mesterséges intelligencia-átalakítási, mesterséges intelligencia-integrációs és mesterséges intelligencia-platform iparági szakértője

☑️ Üzleti nyelvünk angol vagy német

☑️ ÚJ: Levelezés az Ön nemzeti nyelvén!

 

Digitális úttörő - Konrad Wolfenstein

Konrad Wolfenstein

Szívesen szolgálok Önt és csapatomat személyes tanácsadóként.

Felveheti velem a kapcsolatot az itt található kapcsolatfelvételi űrlap kitöltésével , vagy egyszerűen hívjon a +49 89 89 674 804 (München) . Az e-mail címem: wolfenstein xpert.digital

Nagyon várom a közös projektünket.

 

 

☑️ KKV-k támogatása stratégiában, tanácsadásban, tervezésben és megvalósításban

☑️ Az AI stratégia létrehozása vagy átrendezése

☑️ Úttörő vállalkozásfejlesztés


⭐️ Mesterséges Intelligencia (MI) - MI Blog, Hotspot és Tartalomközpont ⭐️ Digitális Intelligencia ⭐️ Digitális Átalakulás ⭐️ XPaper