게시일: 2025년 4월 15일 / 업데이트일: 2025년 4월 15일 – 저자: Konrad Wolfenstein
Sonar Reasoning Pro-High: Perplexity, AI 검색 분야 정상으로 도약
변화하는 AI 검색 시스템: Perplexity의 개발 이정표
퍼플렉시티의 소나(Sonar) 모델이 최신 LM Search Arena 평가에서 인상적인 결과를 달성했습니다. 소나-리저닝-프로-하이(Sonar-Reasoning-Pro-High)는 구글의 제미니-2.5-프로-그라운딩(Grounding)과 어깨를 나란히 했습니다. 이러한 순위는 AI 검색 시스템 발전의 중요한 이정표이며, 경쟁이 치열한 이 분야에서 퍼플렉시티의 선도적인 위치를 더욱 확고히 합니다.
이와 관련된 내용:
LM 검색 영역 평가
LM Search Arena는 LM Arena에서 개발한 혁신적인 평가 플랫폼으로, 인간의 선호도를 기반으로 검색 기능이 강화된 AI 시스템을 평가합니다. 단순한 사실적 정확도에만 초점을 맞췄던 SimpleQA와 같은 기존 벤치마크와 달리, Search Arena는 프로그래밍, 글쓰기, 연구, 추천 등 다양한 분야에서 실제 사용자 쿼리에 대한 모델의 성능을 평가합니다.
이번 평가는 2025년 3월 18일부터 4월 13일까지 진행되었으며, 11개 모델에 대한 1만 건 이상의 사용자 선호도 투표를 수집했습니다. 사용자들은 질의를 제출한 후, 어떤 모델의 응답이 자신의 정보 요구를 더 잘 충족하는지 평가하도록 요청받았습니다.
소나 모델의 뛰어난 성능
Perplexity의 Sonar-Reasoning-Pro-High는 Arena 점수 1136점(±21/-19)을 기록했는데, 이는 Google의 Gemini-2.5-Pro-Grounding(1142점, ±14/-17)과 통계적으로 동등한 수준으로, 공동 1위를 차지했습니다. 특히 주목할 만한 점은 직접 비교에서 Sonar-Reasoning-Pro-High가 53%의 경우에서 Gemini-2.5-Pro-Grounding보다 우수한 성능을 보였다는 것입니다.
평가에서 Perplexity의 우위는 다음 순위에서 확인할 수 있습니다
- 제미니 2.5 프로 접지 (1142점)
- 소나 추론 프로-하이(1136점)
- 소나 추론 (1097점)
- 소나 (1072점)
- 소나-프로-하이(1071점)
- 소나-프로 (1066점)
Perplexity의 모든 모델은 상위권을 차지했으며, Google(Gemini-2.0-Flash-Grounding) 및 OpenAI(GPT-4o Search)에서 평가한 다른 모델들을 크게 능가했습니다.
성공의 핵심 요소
Search Arena는 인간의 선호도와 강한 상관관계를 보이는 세 가지 요인을 확인했습니다
보다 포괄적인 답변
사용자들은 더 자세한 답변을 선호했습니다(상관계수 0.255, p<0.05). Sonar 모델은 광범위한 주제에 대해 포괄적이고 상세한 정보를 제공하여 사용자 만족도를 높였습니다.
출처 인용의 우수성
인용 횟수가 많을수록 사용자 선호도가 높은 것으로 나타났습니다(상관계수 0.234, p<0.05). Sonar 모델은 더 심층적인 검색을 수행하며, 유사한 Gemini 모델보다 평균 2~3배 더 많은 출처를 인용합니다. 이처럼 출처를 포괄적으로 활용함으로써 제공되는 정보의 신뢰성과 근거를 확보할 수 있습니다.
다양한 출처를 사용하여
평가 결과, 커뮤니티 웹 소스에서 인용한 내용이 특히 가치 있게 여겨졌습니다. Sonar 모델은 YouTube, 커뮤니티 플랫폼, 권위 있는 출처 등 다양한 소스를 효과적으로 활용하는 것이 특징입니다.
대조 실험을 통해 이러한 결과가 확인되었으며, 검색 깊이가 모델 간 성능 차이를 유발하는 중요한 요소임을 보여주었습니다. 인용 횟수를 통제 변수로 고려했을 때 모델 순위가 수렴하는 것을 통해 검색 깊이가 중요한 차별화 요소임을 알 수 있었습니다.
이와 관련된 내용:
소나 기술의 핵심
Perplexity의 소나 모델은 Llama 3.3 70B를 기반으로 하며, 응답 품질과 사용자 경험을 최적화하기 위해 특별히 개선되었습니다. 이 모델은 응답의 사실적 정확성과 가독성을 향상시키도록 훈련되었습니다.
속도 및 성능
Sonar는 Cerebras 추론 인프라를 기반으로 하며 초당 1200개의 토큰이라는 놀라운 속도로 응답을 제공하여 거의 즉각적인 응답 생성을 가능하게 합니다. 이 속도는 Gemini 2.0 Flash와 같은 유사 모델보다 거의 10배 빠릅니다.
사용자 선호도 및 성능 비교
광범위한 A/B 테스트 결과, Sonar는 GPT-4o mini 및 Claude 3.5 Haiku와 같은 모델보다 훨씬 뛰어난 성능을 보였으며, 사용자 만족도 측면에서는 GPT-4o 및 Claude 3.5 Sonnet과 같은 최고급 모델과 동등하거나 그 이상의 성능을 보여주었습니다.
Sonar API: 개발자를 위한 접근성
Perplexity는 API를 통해 자사의 음파 탐지 기술을 제공하여 개발자가 AI 기반 검색 기능을 애플리케이션에 통합할 수 있도록 합니다. API에는 크게 두 가지 버전이 있습니다
소나 API
Sonar 표준 API는 가볍고 비용 효율적이며 빠르고 사용하기 쉽습니다. 간단한 질문과 답변 기능을 필요로 하는 기업을 위해 설계되었으며 속도에 최적화되어 있습니다.
Sonar Pro API
고급 기능을 필요로 하는 기업을 위해 Sonar Pro API는 더욱 복잡하고 다단계적인 쿼리를 처리할 수 있는 기능을 제공합니다. 이 API는 표준 버전보다 검색당 평균 두 배 더 많은 출처 정보를 생성하며, 더 길고 미묘한 쿼리를 위해 더 넓은 컨텍스트 창을 제공합니다.
가격 구조는 이러한 차이를 반영합니다. 스탠다드 소나(Standard Sonar)는 검색 1,000회당 5달러에 입력 및 출력 단어 750,000개당 1달러가 추가됩니다. 소나 프로(Sonar Pro)는 검색 1,000회당 5달러의 동일한 요금을 유지하면서 입력 단어 750,000개당 3달러, 생성된 단어 750,000개당 15달러를 부과합니다.
정확도부터 사용자 편의성까지: Perplexity의 소나 시스템은 인상적입니다
LM Search Arena 평가에서 거둔 탁월한 결과는 Perplexity의 Sonar 모델이 최고의 AI 검색 시스템 중 하나임을 입증합니다. 사실적 정확성, 광범위한 출처 인용, 심층 검색 기능을 결합하여 우수한 사용자 경험을 제공합니다.
이러한 성공은 Perplexity가 AI 기반 검색 및 정보 제공 분야의 혁신 기업으로서의 입지를 확고히 하고 있음을 보여줍니다. 사용자 피드백을 기반으로 지속적으로 개선되는 모델은 향후 더욱 큰 발전 가능성을 시사합니다.
Perplexity 사용자에게 이러한 결과는 최고 수준의 정확도, 포괄적인 출처 표기, 그리고 광범위한 주제에 걸쳐 고품질 답변을 이용할 수 있음을 의미합니다. 프로 사용자는 설정에서 Sonar를 기본 모델로 지정하여 이러한 강력한 모델의 이점을 더욱 극대화할 수 있습니다.
Sonar가 Search Arena 평가에서 보여준 뛰어난 성과는 Perplexity의 기술적 전문성을 입증할 뿐만 아니라, 더욱 정확하고 포괄적이며 사용자의 정보 니즈를 더욱 깊이 이해하는 미래 AI 검색의 방향을 제시합니다.
이와 관련된 내용:
귀사의 AI 전환, AI 통합 및 AI 플랫폼 분야 전문가
☑️ 저희 업무 언어는 영어 또는 독일어입니다
☑️ 신규 기능: 모국어로 소통하세요!
저와 저희 팀은 여러분의 개인 자문가로서 기꺼이 도움을 드릴 준비가 되어 있습니다.
여기 있는 문의 양식을 작성하시거나 +49 89 89 674 804 ( 뮌헨) 으로 전화 주시면 연락 [email protected] 입니다.
저는 우리의 공동 프로젝트를 기대하고 있습니다.















