公開:2025年4月15日 /更新:2025年4月15日 - 著者: Konrad Wolfenstein
SONAR-REASONING-PRO-HIGH:PerplexityがAI検索の上部にジャンプする
AI検索システムの変化:開発における困惑のマイルストーン
Perplexityのソナーモデルは、GoogleのGemini-2.5-Groundingがリーダーである後、Sonar-Reasoning-Pro-Highである最新のLM Search Arena評価で印象的な結果を達成しました。この評価は、AI検索システムの進化における重要なマイルストーンを表しており、この競争分野での困惑の主要な位置を強調しています。
に適し:
LM検索アリーナの評価
LM Search Arenaは、人間の好みに基づいて検索強化されたAIシステムを評価するために、LMアリーナによって開発された新しい評価プラットフォームです。 Search Arenaは、密接な事実の正確性に集中しているSimpleQAなどの以前のベンチマークとは対照的に、プログラミング、執筆、研究、推奨事項などの分野での実際のユーザーの問い合わせのモデルがどのように遮断されるかを評価します。
この評価は、2025年3月18日から4月13日の間に行われ、11モデルの10,000以上の人間優先投票を収集しました。ユーザーは、問い合わせを求めてから、情報が必要なモデル応答をよりよく満たすかを評価するように求められました。
ソナーモデルの優れたパフォーマンス
PerplexityのSonar Reasoning-Pro-Highは、GoogleのGemini-2.5プロセス(1142 +14/-17)と統計的に同等の1136(±21/-19)のアリーナスコアに達し、したがって共通のトップ位置を意味します。直接比較することで、ソナーリアンリング - ハイハイジェミニ-2.5プログラウンドが53%の症例で超えたことは特に注目に値します。
評価における困惑の支配は、次のランキングによって示されています。
- gemini-2.5-pro-grounding(1142ポイント)
- ソナーリアーズリングプロハイ(1136ポイント)
- ソナーリアーズ(1097ポイント)
- ソナー(1072ポイント)
- Sonar-Pro-High(1071ポイント)
- Sonar-Pro(1066ポイント)
すべての浸透モデルは、Google(Gemini 2.0-Flash Grounding)およびOpenai(GPT-4O検索)から、上位のランクを獲得し、大幅に異なる定格モデルを超えました。
成功のための重要な要因
検索アリーナは、人間の好みと強く相関する3つの要因を特定しました。
より包括的な回答
ユーザーが長い回答を好みました(係数0.255、p <0.05)。ソナーモデルは、さまざまなトピックに関する詳細な詳細情報を提供し、ユーザーの満足度が高くなります。
ソースの優位性
より多くの引用符は、ユーザーの好みと強く相関しています(係数0.234、p <0.05)。ソナーモデルは、同等のジェミニモデルよりも平均2〜3倍のソースをより深く検索し、引用します。この包括的なソースの使用により、提供される情報が十分に文書化され、信頼できることが保証されます。
さまざまなソースの使用
評価は、コミュニティのWebソースからの引用が特に評価されていることを示しました。ソナーモデルは、YouTube、コミュニティプラットフォーム、権威あるソースなど、さまざまなソースの効果的な使用によって特徴付けられます。
コントロール実験により、この発見が確認され、検索の深さがモデル間のパフォーマンスの本質的な違いであることが示されました。見積もりをチェックすると、モデルのランキングが収束し、検索の深さが決定的な分化係数であることを示します。
に適し:
ソナーの背後にある技術
PerplexityのソナーモデルはLlama 3.3 70bに基づいており、回答の品質とユーザーエクスペリエンスの最適化のために特別に開発されました。回答の忠実さと読みやすさを改善するために訓練されました。
速度とパフォーマンス
ソナーは、セレブラスインフラストラクチャによって推進されており、印象的なスピード1200トークンあたりの回答を提供します。これにより、ほぼ即時の応答生成が可能になります。この速度は、Gemini 2.0 Flashのような同等のモデルよりもほぼ10倍高速です。
ユーザーの好みとパフォーマンスの比較
広範なA/Bテストは、SONARがGPT-4O MiniやClaude 3.5 Haikuなどのモデルを明らかに超えており、ユーザーの満足度に関してはGPT-4oやClaude 3.5ボンネットなどのトップモデルのパフォーマンスを達成することさえ示しています。
ソナーAPI:開発者のアクセシビリティ
Perplexityは、APIを介してソナーテクノロジーも提供しているため、開発者はAIベースの検索機能をアプリケーションに統合できます。 APIには2つの主要なバージョンがあります。
ソナーAPI
標準のソナーAPIは、軽量で、安価で、迅速で使いやすいです。それは、単純な質問回答機能を必要とし、速度のために最適化されている企業向けに設計されています。
Sonar Pro API
より高度な機能を必要とする企業の場合、Sonar Pro APIは、より複雑でマルチステージの問い合わせを処理する機会を提供します。平均して、検索ごとの2倍のソースを標準バージョンの2倍のソースを生成し、より長くより微妙な検索クエリのためにより大きなコンテキストウィンドウを備えています。
価格構造はこれらの違いを反映しています。標準のソナーは、1,000あたり5ドルに加えて、750,000ワードあたり1ドル(入力と出力を組み合わせて)かかります。 Sonar Proは同じ5ドルの検索を保持しますが、750,000ドルの入力語と750,000ドルの生成された単語あたり15ドルを計算します。
精度の要因からユーザーオリエンテーションまで:Prplexityのソナーは納得します
LM検索アリーナの評価における優れた結果は、Perplexityのソナーモデルが主要なAI検索システムの1つであることを確認しています。忠実度、広範なソース情報、深い検索能力の組み合わせにより、優れたユーザーエクスペリエンスを提供します。
これらの成功は、AIベースの検索と情報の提供の分野におけるイノベーターとしてのPerplexityの立場を強調しています。ユーザーのフィードバックに基づいたモデルの継続的な改善は、将来の開発の可能性をさらに示しています。
困惑ユーザーにとって、これらの結果は、一流の精度、広範なソースの帰属、幅広いトピックへの高品質の回答にアクセスできることを意味します。 Proユーザーは、SonARを設定の標準モデルとして決定することにより、これらの強力なモデルから引き続き恩恵を受けることができます。
検索アリーナの評価におけるソナーの強力なパフォーマンスは、困惑の技術的能力を強調するだけでなく、AIを探すことの将来の方法を示しています。
に適し:
AIの変革、AI統合、AIプラットフォーム業界の専門家
☑️ 私たちのビジネス言語は英語またはドイツ語です
☑️ NEW: 母国語での通信!
喜んで個人アドバイザーとしてあなたと私のチームにお役に立ちたいと思っています。
お問い合わせフォームにご記入 +49 89 89 674 804 (ミュンヘン)までお電話ください。私のメールアドレスは: wolfenstein ∂ xpert.digital
私たちの共同プロジェクトを楽しみにしています。