发表于:2025年4月15日 /更新:2025年4月15日 - 作者: Konrad Wolfenstein
Sonar-Reoning-Pro-High:困惑的跳跃到AI搜索的顶部
更改AI搜索系统:发展中的里程碑
《困惑》的声纳模型在最新的LM搜索竞技场评估中取得了令人印象深刻的成绩,在Google的Gemini-2.5-Groundering之后,Sonar-Rounowing-Pro-High是领导者。这项评估是AI搜索系统发展的重要里程碑,并强调了困惑在该竞争领域的领先地位。
适合:
LM搜索竞技场评估
LM搜索竞技场是由LM Arena开发的新型评估平台,可根据人类偏好评估搜索加强的AI系统。与以前的基准(例如SimpleQA)相比,该基准集中在近距离事实准确性上,搜索领域评估了如何在编程,写作,研究和建议等领域中切断的实际用户查询模型。
该评估发生在2025年3月18日至4月13日之间,并为11种模型收集了10,000多张人类偏好投票。要求用户询问查询,然后评估他们的信息需求更高的模型响应。
声纳模型的出色表现
困惑的Sonar-Rounowing-Pro-High达到1136(±21/-19)的竞技场得分,在统计学上与Google的Gemini-2.5-Process(1142 +14/-17)相等,因此意味着共同的最高位置。尤其值得注意的是,通过直接比较声纳 - 策略 - pro-high-high-2.5-pro-ground在53%的案件中超过了。
以下排名说明了困惑性在评估中的优势:
- GEMINI-2.5-PRO-GOUNDRING(1142分)
- Sonar-Reoning-Pro-High(1136分)
- Sonar-Rounowing(1097分)
- 声纳(1072分)
- Sonar-Pro-High(1071分)
- Sonar-Pro(1066分)
与Google(Gemini 2.0-Flash接地)和OpenAI(GPT-4O搜索)相比,所有困惑模型都占据了高级的排名,并超过了额定额定模型。
成功的关键因素
搜索领域确定了与人类偏爱密切相关的三个因素:
更全面的答案
用户首选更长的答案(系数0.255,p <0.05)。声纳模型提供了有关各种主题的详细详细信息,从而提高了用户满意度。
来源的优势
更高数量的报价与用户偏好密切相关(系数0.234,p <0.05)。声纳模型进行更深入的搜索,并引用了比可比的双子座模型的平均源头多2-3倍。这种全面的来源使用可确保所提供的信息已得到充分记录和值得信赖。
使用各种来源
评估表明,社区网络来源的报价特别有价值。声纳模型的特征是有效使用不同来源,包括YouTube,社区平台和权威来源。
控制实验证实了这一发现,并表明搜索深度是模型之间性能的本质差异。当检查引号时,模型排名会收敛,表明搜索深度是决定性的分化因子。
适合:
Sonar背后的技术
Pelplexity的声纳模型基于Llama 3.3 70B,专门为优化答案质量和用户体验而开发。它经过培训,以提高答案的忠诚度和可读性。
速度和性能
Sonar受脑力基础设施的驱动,并以令人印象深刻的速度为1200代币每秒提供答案,这几乎可以立即产生响应。这种速度的速度几乎是Gemini 2.0 Flash(例如Gemini 2.0)的速度快10倍。
用户偏好和性能比较
广泛的A/B测试表明,Sonar显然超过了GPT-4O MINI和Claude 3.5 Haiku等模型,甚至达到了诸如GPT-4O和Claude 3.5 Bonnet等顶级模型的性能。
声纳API:开发人员的可访问性
困惑还通过API提供其声纳技术,这使开发人员能够将基于AI的搜索功能集成到其应用程序中。 API有两个主要版本:
声纳API
标准的声纳API轻巧,便宜,快速且易于使用。它是为需要简单的提问函数并针对速度进行了优化的公司而设计的。
Sonar Pro API
对于需要更高级功能的公司,Sonar Pro API提供了处理更复杂,多阶段查询的机会。平均而言,它每次搜索的来源生成的源是标准版本的两倍,并且具有更长和更细微的搜索查询的更大上下文窗口。
价格结构反映了这些差异:标准声纳的费用为每1,000美元$ 5,加上每750,000个单词$ 1(输入和输出的总和)。 Sonar Pro保留了相同的5美元搜索,但计算$ 750,000的输入单词和每$ 750,000的单词$ 15。
从准确的因素到用户取向:困惑的声纳说服
LM搜索竞技场评估的出色结果证实,困惑的声纳模型是领先的AI搜索系统。通过忠诚度,广泛的来源信息和深层搜索能力的结合,它们提供了卓越的用户体验。
这些成功强调了困惑在基于AI的搜索和提供信息的领域的创新者的立场。基于用户反馈的模型的持续改进表明了未来发展的进一步潜力。
对于困惑用户,这些结果意味着他们可以访问一流的准确性,广泛的源归因和对广泛主题的高质量答案。 PRO用户可以通过确定声纳作为其设置中的标准模型来继续从这些强大的模型中受益。
声纳在搜索领域评估中的强劲表现不仅强调了困惑的技术能力,而且还为寻找AI的未来展示了道路:更精确,更全面,更深入地了解用户的信息需求。
适合:
您的AI转换,AI集成和AI平台行业专家
☑️我们的业务语言是英语或德语
☑️ 新:用您的国家语言进行通信!
我很乐意作为个人顾问为您和我的团队提供服务。
您可以通过填写此处的联系表,或者直接致电+49 89 89 674 804 (慕尼黑)。我的电子邮件地址是: wolfenstein ∂ xpert.digital
我很期待我们的联合项目。