Hodnocení vyhledávání AI: Modely AI od Sonar z zmatení vedou v krajině AI Search

Publikováno dne: 15. dubna 2025 / Aktualizace od: 15. dubna 2025 - Autor: Konrad Wolfenstein

Hodnocení vyhledávání AI: Modely AI od Sonar z zmatení vedou v AI Search Landscape-Image: Xpert.Digital

Sonar-Reasocing-Pro-High: Skok zmatení na vrchol hledání AI

Změna v vyhledávacím systému AI: Milník zmatenosti ve vývoji

Modely Sonar společnosti Snar společnosti Snar dosáhly působivých výsledků v nejnovějším hodnocení LM Search Arena, přičemž vůdcem Google Gemini-2,5 je vůdcem Google-22.5. Toto hodnocení představuje důležitý milník ve vývoji systémů vyhledávání AI a zdůrazňuje vedoucí postavení zmatenosti v této konkurenční oblasti.

Vhodné pro:

Perplexity Sonar Pro API jako vyhledávač AI v externích aplikacích a nástrojích – pro chytré aplikace a přizpůsobené vyhledávání

Hodnocení LM Search Arena

LM Search Arena je nová platforma pro hodnocení vyvinutá společností LM Arena pro vyhodnocení AI systémů posílených vyhledáváním založené na preferencích člověka. Na rozdíl od předchozích benchmarků, jako je Simpleqa, které se soustředily na úzce faktickou přesnost, vyhledávací aréna vyhodnocuje, jak modely odříznuté pro skutečné dotazy uživatelů v oblastech, jako je programování, psaní, výzkum a doporučení.

Hodnocení se konalo mezi 18. březnem a 13. dubnem 2025 a shromáždilo více než 10 000 hlasů pro preference lidských preferencí pro 11 modelů. Uživatelé byli požádáni, aby se zeptali dotazů a poté vyhodnotili, která model reakce jejich informací je třeba lépe splnit.

Vynikající výkon sonarových modelů

Shonar-Reasocing-Pro-High, dosáhl skóre arény 1136 (± 21/−19), což je statisticky ekvivalentní s Google Gemini-2,5 procesem (1142 +14/-17), a tedy znamená společnou nejvyšší polohu. Je obzvláště pozoruhodné, že s přímým srovnáním sonar-reasong-pro-vysoko-gemini-2,5-promocí překročilo v 53% případů.

Dominance zmatenosti v hodnocení je ilustrována následujícím hodnocením:

Gemini-2,5-promocí (1142 bodů)
Sonar-Reasocing-Pro-High (1136 bodů)
Sonar-Reasoning (1097 bodů)
Sonar (1072 bodů)
Sonar-Pro-High (1071 bodů)
Sonar-Pro (1066 bodů)

Všechny modely zmatení vzaly horní řady a překročily výrazně odlišné hodnocené modely z Google (Gemini 2.0-Flash Grounding) a OpenAI (GPT-4o Search).

Klíčové faktory úspěchu

Vyhledávací aréna identifikovala tři faktory, které silně korelovaly s lidskou preference:

Komplexnější odpovědi

Uživatelé upřednostňovali delší odpovědi (koeficient 0,255, p <0,05). Sonarové modely poskytují podrobné, podrobné informace o různých tématech, což vede k vyšší spokojenosti uživatelů.

Převaha ve zdrojích

Vyšší počet citací silně koreloval s preferencí uživatele (koeficient 0,234, p <0,05). Sonarové modely provádějí hlubší vyhledávání a citují průměrně 2-3krát více zdrojů než srovnatelné gemini modely. Toto komplexní využití zdroje zajišťuje, že poskytnuté informace jsou dobře zdokumentované a důvěryhodné.

Použití různých zdrojů

Hodnocení ukázalo, že citace z komunitních webových zdrojů byly obzvláště ceněny. Modely Sonar se vyznačují účinným využíváním různých zdrojů, včetně YouTube, komunitních platforem a autoritativních zdrojů.

Kontrolní experimenty tyto zjištění potvrdily a ukázaly, že hloubka vyhledávání je nezbytným rozdílem ve výkonu mezi modely. Při kontrole citátů se hodnocení modelu sblížilo, což naznačuje, že hloubka vyhledávání je rozhodujícím faktorem diferenciace.

Vhodné pro:

AI integrace nezávislé platformy AI pro všechny společnosti pro všechny společnosti pro všechny společnosti

Technologie za sonarem

Sonarový model společnosti Snar je založen na Llama 3.3 70b a byl speciálně vyvinut pro optimalizaci kvality odpovědí a uživatelského prostředí. Byl vyškolen ke zlepšení věrnosti a čitelnosti odpovědí.

Rychlost a výkon

Sonar je poháněn infrastrukturou Cerebras a poskytuje odpovědi na působivou tokenu Speed-1200 za sekundu, což umožňuje téměř okamžité generování odpovědí. Tato rychlost je téměř 10krát rychlejší než u srovnatelných modelů, jako je Gemini 2.0 Flash.

Uživatelské preference a srovnání výkonu

Rozsáhlé testy A/B ukázaly, že Sonar jasně překračuje modely, jako jsou GPT-4o Mini a Claude 3.5 Haiku, a dokonce dosáhne výkonu nejlepších modelů, jako jsou GPT-4o a Claude 3.5 Bonnet, pokud jde o spokojenost uživatelů.

Sonar API: Přístupnost pro vývojáře

Zmatenost také nabízí svou sonarovou technologii prostřednictvím API, která umožňuje vývojářům integrovat do svých aplikací vyhledávací funkce založené na AI. Existují dvě hlavní verze API:

Sonar API

Standardní API Sonar API je lehké, levné, rychlé a snadno použitelné. Byl navržen pro společnosti, které potřebují nekomplikované funkce otázek a odpovědí a jsou optimalizovány pro rychlost.

Sonar Pro API

Pro společnosti, které potřebují pokročilejší funkce, nabízí API Sonar Pro API příležitost zpracovávat složitější vícestupňové dotazy. V průměru generuje dvakrát tolik zdrojů na vyhledávání než standardní verze a má větší kontextové okno pro delší a více nuanční dotazy vyhledávání.

Struktura cen odráží tyto rozdíly: Standardní sonar stojí 5 $ za 1 000 plus 1 $ za 750 000 slov (vstup a výstup kombinovaný). Sonar Pro ponechává stejných 5 $ 1 000 vyhledávání, ale počítá vstupní slova 750 000 $ a 15 USD za vygenerovaná slova.

Od faktorů přesnosti po orientaci uživatele: Sonar zmatený přesvědčen

Vynikající výsledky v hodnocení LM Search Arena potvrzují, že modely sonar zmatenosti patří mezi přední systémy vyhledávání AI. S kombinací věrnosti, rozsáhlých informací o zdroji a schopnosti hlubokého vyhledávání nabízejí vynikající uživatelský zážitek.

Tyto úspěchy podtrhují pozici zmatenosti jako inovátora v oblasti vyhledávání AI a poskytování informací. Neustálé zlepšování modelů založených na zpětné vazbě uživatelů ukazuje další potenciál pro budoucí vývoj.

Pro uživatele zmatenosti tyto výsledky znamenají, že mají přístup k prvotřídní přesnosti, rozsáhlému přiřazení zdroje a vysoce kvalitní odpovědi na širokou škálu témat. Uživatelé Pro mohou z těchto výkonných modelů i nadále využít určení Sonaru jako svého standardního modelu v nastavení.

Silná výkonnost Sonaru v hodnocení vyhledávání arény nejen zdůrazňuje technologickou kompetence zmatenosti, ale také ukazuje cestu pro budoucnost hledání AI: přesněji, komplexnější a s hlubším pochopením informačních potřeb uživatelů.

Vhodné pro: