Available in 27 languages 📢
Preferujte Xpert.Digital na Googlu

Hodnocení vyhledávání AI: Modely AI od Sonar z zmatení vedou v krajině AI Search

Publikováno: 15. dubna 2025 / Aktualizováno: 15. dubna 2025 – Autor: Konrad Wolfenstein

Hodnocení vyhledávání AI: Modely AI od Sonar z zmatení vedou v krajině AI Search

Žebříček vyhledávání s využitím umělé inteligence: Modely umělé inteligence od Perplexity Sonar jsou lídry v oblasti vyhledávání s využitím umělé inteligence – Obrázek: Xpert.Digital

Sonar Reasoning Pro-High: Perplexity se dostala na vrchol vyhledávání s umělou inteligencí

Vyhledávací systémy s umělou inteligencí v přechodu: Milník ve vývoji Perplexity

Modely Sonar od společnosti Perplexity dosáhly v nejnovějším hodnocení LM Search Arena působivých výsledků, přičemž Sonar-Reasoning-Pro-High se umístily vedle hodnocení Google Gemini-2.5-Pro-Grounding. Toto hodnocení představuje významný milník ve vývoji vyhledávacích systémů s umělou inteligencí a podtrhuje vedoucí pozici společnosti Perplexity v tomto vysoce konkurenčním oboru.

Vhodné pro:

Hodnocení arény vyhledávání LM

LM Search Arena je nová hodnotící platforma vyvinutá společností LM Arena pro posouzení systémů umělé inteligence s vylepšeným vyhledáváním na základě lidských preferencí. Na rozdíl od předchozích benchmarků, jako je SimpleQA, které se zaměřovaly na úzkou faktickou přesnost, Search Arena hodnotí, jak si modely vedou v reálných uživatelských dotazech v oblastech, jako je programování, psaní, výzkum a doporučování.

Hodnocení probíhalo mezi 18. březnem a 13. dubnem 2025 a shromáždilo přes 10 000 lidských hlasů pro 11 modelů. Uživatelé byli požádáni, aby zadali dotazy a poté ohodnotili, která odpověď modelu lépe odpovídá jejich informačním potřebám.

Vynikající výkon sonarových modelů

Hodnocení vyhledávání pomocí umělé inteligence: Vynikající výkon modelů sonaru

Hodnocení vyhledávání AI: Vynikající výkon sonarových modelů – Obrázek: Perplexity

Test Sonar-Reasoning-Pro-High od společnosti Perplexity dosáhl v aréně skóre 1136 (±21/−19), což je statisticky ekvivalentní testu Gemini-2.5-Pro-Grounding od společnosti Google (1142 +14/-17), a zajistil si tak sdílené první místo. Zvláště pozoruhodné je, že v přímém srovnání Sonar-Reasoning-Pro-High překonal Gemini-2.5-Pro-Grounding v 53 % případů.

Dominanci zmatku v hodnocení ilustruje následující pořadí:

  1. Uzemnění Gemini 2.5 Pro (1142 bodů)
  2. Sonar Reasoning Pro-High (1136 bodů)
  3. Sonarové uvažování (1097 bodů)
  4. Sonar (1072 bodů)
  5. Sonar-Pro-High (1071 bodů)
  6. Sonar-Pro (1066 bodů)

Všechny modely Perplexity obsadily nejvyšší příčky a výrazně překonaly ostatní hodnocené modely od společností Google (Gemini-2.0-Flash-Grounding) a OpenAI (GPT-4o Search).

Klíčové faktory úspěchu

Search Arena identifikovala tři faktory, které silně korelovaly s lidskými preferencemi:

Komplexnější odpovědi

Uživatelé preferovali delší odpovědi (koeficient 0,255, p < 0,05). Modely Sonar poskytují komplexní a podrobné informace o široké škále témat, což vede k vyšší spokojenosti uživatelů.

Převaha v citování zdrojů

Vyšší počet citací silně koreloval s preferencí uživatelů (koeficient 0,234, p < 0,05). Modely Sonar provádějí hlubší vyhledávání a citují v průměru 2–3krát více zdrojů než srovnatelné modely Gemini. Toto komplexní využití zdrojů zajišťuje, že poskytované informace jsou dobře zdokumentované a důvěryhodné.

Používání různých zdrojů

Hodnocení ukázalo, že citace z komunitních webových zdrojů byly obzvláště ceněny. Modely Sonar se vyznačují efektivním využitím různých zdrojů, včetně YouTube, komunitních platforem a autoritativních zdrojů.

Kontrolní experimenty tyto poznatky potvrdily a ukázaly, že hloubka vyhledávání představuje významný rozdíl ve výkonnosti mezi modely. Při kontrole citací se pořadí modelů sblížilo, což naznačuje, že hloubka vyhledávání je klíčovým rozlišovacím faktorem.

Vhodné pro:

Technologie stojící za sonarem

Sonarový model Perplexity je založen na Llama 3.3 70B a byl speciálně vylepšen pro optimalizaci kvality odezvy a uživatelského prostředí. Byl natrénován ke zlepšení faktické přesnosti a čitelnosti odpovědí.

Rychlost a výkon

Sonar je poháněn inferenční infrastrukturou Cerebras a poskytuje odpovědi působivou rychlostí – 1200 tokenů za sekundu, což umožňuje téměř okamžité generování odpovědí. Tato rychlost je téměř 10krát rychlejší než u srovnatelných modelů, jako je Gemini 2.0 Flash.

Porovnání preferencí uživatelů a výkonu

Rozsáhlé A/B testy ukázaly, že Sonar výrazně překonává modely jako GPT-4o mini a Claude 3.5 Haiku a dokonce se vyrovná nebo překonává výkon špičkových modelů, jako jsou GPT-4o a Claude 3.5 Sonnet, pokud jde o spokojenost uživatelů.

Sonar API: Přístupnost pro vývojáře

Společnost Perplexity také nabízí svou sonarovou technologii prostřednictvím API, což vývojářům umožňuje integrovat do svých aplikací vyhledávací funkce založené na umělé inteligenci. Existují dvě hlavní verze API:

API sonaru

Standardní rozhraní Sonar API je lehké, cenově dostupné, rychlé a snadno použitelné. Bylo navrženo pro firmy, které potřebují přímočarou funkcionalitu otázek a odpovědí a jsou optimalizovány pro rychlost.

API Sonar Pro

Pro firmy, které vyžadují pokročilejší funkce, nabízí rozhraní Sonar Pro API možnost zpracovávat složitější vícestupňové dotazy. Generuje v průměru dvakrát více citací zdrojů na jedno vyhledávání než standardní verze a nabízí větší kontextové okno pro delší a podrobnější dotazy.

Cenová struktura tyto rozdíly odráží: Standardní Sonar stojí 5 dolarů za 1 000 vyhledávání plus 1 dolar za každých 750 000 slov (kombinovaný vstup a výstup). Sonar Pro si zachovává stejných 5 dolarů za 1 000 vyhledávání, ale účtuje 3 dolary za 750 000 vstupních slov a 15 dolarů za každých 750 000 vygenerovaných slov.

Od faktorů přesnosti po uživatelskou přívětivost: Sonar Perplexity ohromuje

Vynikající výsledky v hodnocení LM Search Arena potvrzují, že modely Sonar od společnosti Perplexity patří mezi přední vyhledávací systémy s umělou inteligencí. Kombinací faktické přesnosti, rozsáhlých citací zdrojů a možností hloubkového vyhledávání nabízejí vynikající uživatelský zážitek.

Tyto úspěchy podtrhují pozici společnosti Perplexity jako inovátora v oblasti vyhledávání a poskytování informací s využitím umělé inteligence. Neustálé vylepšování jejích modelů na základě zpětné vazby od uživatelů naznačuje další potenciál pro budoucí vývoj.

Pro uživatele Perplexity tyto výsledky znamenají přístup k špičkové přesnosti, komplexnímu uvedení zdroje a vysoce kvalitním odpovědím na širokou škálu témat. Uživatelé Pro mohou tyto výkonné modely dále využívat nastavením modelu Sonar jako výchozího v nastavení.

Silný výkon Sonaru v hodnocení Search Arena nejen podtrhuje technologické znalosti společnosti Perplexity, ale také ukazuje cestu do budoucnosti vyhledávání s využitím umělé inteligence: přesnější, komplexnější a s hlubším pochopením informačních potřeb uživatelů.

Vhodné pro:

 

Váš expert v oblasti transformace, integrace a platform umělé inteligence

☑️ Naším obchodním jazykem je angličtina nebo němčina

☑️ NOVINKA: Korespondence ve vašem národním jazyce!

 

Digitální průkopník - Konrad Wolfenstein

Konrad Wolfenstein

Rád vám a mému týmu posloužím jako osobní poradce.

Kontaktovat mě můžete vyplněním kontaktního formuláře nebo mi jednoduše zavolejte na číslo +49 89 89 674 804 (Mnichov) . Moje e-mailová adresa je: wolfenstein xpert.digital

Těším se na náš společný projekt.

 

 

☑️ Podpora MSP ve strategii, poradenství, plánování a implementaci

☑️ Vytvoření nebo úprava strategie AI

☑️ Pioneer Business Development


⭐️ Umělá inteligence (AI) - Blog o AI, hotspot a centrum obsahu ⭐️ Digitální inteligence ⭐️ Digitální transformace ⭐️ XPaper