Publicerad: 15 april 2025 / UPDATE Från: 15 april 2025 - Författare: Konrad Wolfenstein
Sonar-Reasoning-Pro-High: Perplexity's Jump till toppen av AI-sökningen
Förändring i AI -söksystemet: Perplexity's Milestone in Development
Perplexitys Sonar-modeller har uppnått imponerande resultat i den senaste utvärderingen av LM-sökarenan, varigenom Sonar-Reshearch-Pro-High efter Googles Gemini-2,5-marking är ledare. Denna bedömning representerar en viktig milstolpe i utvecklingen av AI -söksystem och understryker förvirringens ledande position inom detta konkurrenskraftiga område.
Lämplig för detta:
- Perplexity Sonar Pro API som AI-sökmotor i externa applikationer och verktyg-för smarta appar och skräddarsydd sökning
LM -sökarenautvärderingen
LM Search Arena är en ny utvärderingsplattform utvecklad av LM Arena för att utvärdera sökstyrka AI-system baserat på mänskliga preferenser. Till skillnad från tidigare riktmärken som SimpleQA, som koncentrerade sig på nära faktisk noggrannhet, utvärderar sökarenan hur modeller avstänger för verkliga användarförfrågningar inom områden som programmering, skrivning, forskning och rekommendationer.
Utvärderingen ägde rum mellan 18 mars och 13 april 2025 och samlade över 10 000 röster för mänskliga preferenser för 11 modeller. Användare ombads att fråga förfrågningar och sedan utvärdera vilken modellsvar deras information behöver bättre uppfyllas.
SONAR -modellernas enastående prestanda
Perplexitys Sonar-Recendering-Pro-High nådde en Arena-poäng på 1136 (± 21/−19), vilket är statistiskt ekvivalent med Googles Gemini-2,5-process (1142 +14/-17) och betyder således en gemensam toppposition. Det är särskilt anmärkningsvärt att Sonar-Reconing-Pro-Gemini-2,5-pro-grundläggande med direkta jämförelser överskred i 53% av fallen.
Dominansen av förvirring i utvärderingen illustreras av följande ranking:
- Tvillingarna i Gemini-2,5-Pro (1142 poäng)
- Sonar-Recening-Pro-High (1136 poäng)
- Sonar-REASONING (1097 poäng)
- Sonar (1072 poäng)
- Sonar-Pro-High (1071 poäng)
- Sonar-Pro (1066 poäng)
Alla perplexitetsmodeller tog de övre ledarna och överskred betydligt olika nominella modeller från Google (Gemini 2.0-Flash-grunden) och OpenAI (GPT-4O-sökning).
Nyckelfaktorer för framgång
Sökarenan identifierade tre faktorer som korrelerade starkt med mänsklig preferens:
Mer omfattande svar
Längre svar föredrogs av användare (koefficient 0,255, p <0,05). Sonar -modellerna tillhandahåller detaljerad, detaljerad information om olika ämnen, vilket leder till högre användartillfredsställelse.
Överlägsenhet i källor
Ett högre antal citat korrelerade starkt med användarens preferens (koefficient 0,234, p <0,05). Sonar-modellerna utför en djupare sökning och citerar i genomsnitt 2-3 gånger fler källor än jämförbara Gemini-modeller. Denna omfattande källanvändning säkerställer att informationen är väl dokumenterad och pålitlig.
Användning av olika källor
Utvärderingen visade att citat från gemenskapens webbkällor var särskilt värderade. Sonar -modellerna kännetecknas av effektiv användning av olika källor, inklusive YouTube, samhällsplattformar och auktoritativa källor.
Kontrollexperiment bekräftade dessa resultat och visade att sökdjupet är en väsentlig skillnad i prestanda mellan modellerna. När de kontrollerades för citat konvergerade modellrankningen, vilket indikerar att sökdjupet är en avgörande differentieringsfaktor.
Lämplig för detta:
Tekniken bakom sonar
Perplexitys sonarmodell är baserad på Llama 3.3 70B och utvecklades specifikt för optimering av svarskvaliteten och användarupplevelsen. Det utbildades för att förbättra tronskapen och läsbarheten hos svar.
Hastighet och prestanda
Sonar drivs av Cerebras-infrastrukturen och ger svar på imponerande hastighet-1200 token per sekund, vilket möjliggör nästan omedelbar svar. Denna hastighet är nästan 10 gånger snabbare än med jämförbara modeller som Gemini 2.0 Flash.
Användarpreferens och prestandajämförelse
Omfattande A/B-test visade att Sonar tydligt överskrider modeller som GPT-4O Mini och Claude 3,5 haiku och till och med uppnår prestanda för toppmodeller som GPT-4O och Claude 3,5 motorhuven när det gäller användarnöjdhet.
Sonar API: Tillgänglighet för utvecklare
Perplexity erbjuder också sin sonarteknologi via API: er, vilket gör det möjligt för utvecklare att integrera AI-baserade sökfunktioner i sina applikationer. Det finns två huvudversioner av API:
Sonar -API
Standard Sonar API är lätt, billig, snabb och enkel att använda. Det var utformat för företag som behöver okomplicerade frågeformationer och är optimerade för hastighet.
Sonar Pro API
För företag som behöver mer avancerade funktioner erbjuder Sonar Pro API möjlighet att bearbeta mer komplexa, flera scenundersökningar. I genomsnitt genererar det dubbelt så många källor per sökning som standardversionen och har ett större sammanhangsfönster för längre och mer nyanserade sökfrågor.
Prisstrukturen återspeglar dessa skillnader: Standard Sonar kostar $ 5 per 1 000 plus $ 1 per 750 000 ord (input och utgång tillsammans). Sonar Pro behåller samma 5 $ 1 000 sökningar, men beräknar $ 750 000 inputord och $ 15 per $ 750 000 genererade ord.
Från faktorer för noggrannhet till användarorientering: Perplexitys sonar övertygad
De enastående resultaten i utvärderingen av LM -sökarenan bekräftar att förvirringens sonarmodeller är bland de ledande AI -söksystemen. Med kombinationen av trohet, omfattande källinformation och djup sökförmåga erbjuder de en överlägsen användarupplevelse.
Dessa framgångar understryker Perplexitys position som en innovatör inom området AI-baserad sökning och tillhandahållande av information. Den kontinuerliga förbättringen av modellerna baserade på användaråterkoppling indikerar ytterligare potential för framtida utveckling.
För förvirringsanvändare innebär dessa resultat att de har tillgång till förstklassig noggrannhet, omfattande källattribut och högkvalitativa svar på ett brett spektrum av ämnen. Pro -användare kan fortsätta att dra nytta av dessa kraftfulla modeller genom att bestämma Sonar som sin standardmodell i inställningarna.
Sonarens starka prestanda i utvärderingen av sökarenan understryker inte bara den tekniska kompetensen i förvirring, utan visar också vägen för framtiden att leta efter AI: mer exakt, mer omfattande och med en djupare förståelse av användarnas informationsbehov.
Lämplig för detta:
Din AI -omvandling, AI -integration och AI -plattformsindustrin Expert
☑ Vårt affärsspråk är engelska eller tyska
☑ Nytt: korrespondens på ditt nationella språk!
Jag är glad att vara tillgänglig för dig och mitt team som personlig konsult.
Du kan kontakta mig genom att fylla i kontaktformuläret eller helt enkelt ringa mig på +49 89 674 804 (München) . Min e -postadress är: Wolfenstein ∂ xpert.digital
Jag ser fram emot vårt gemensamma projekt.