Publicado el 15 de abril de 2025 / Actualización del: 15 de abril de 2025 - Autor: Konrad Wolfenstein
Ranking de búsqueda de IA: Los modelos de IA de la sonda de perplejidad están liderando en la búsqueda del paisaje de búsqueda de IA: xpert.digital
Sonar-Razoning-Pro-High: el salto de perplejidad a la cima de la búsqueda de IA
Cambio en el sistema de búsqueda de IA: hito de perplejidad en el desarrollo
Los modelos de sonar de Perplexity han logrado resultados impresionantes en la última evaluación de la arena de búsqueda de LM, mediante la cual el líder de la sonar-Rasioning-Pro-High después de la tierra Gemini-2.5-tierra de Google es un líder. Esta evaluación representa un hito importante en la evolución de los sistemas de búsqueda de IA y subraya la posición principal de la perplejidad en esta área competitiva.
Adecuado para:
- Perplexity Sonar Pro API como motor de búsqueda de IA en aplicaciones y herramientas externas, para aplicaciones inteligentes y búsqueda personalizada
La evaluación de la arena de búsqueda de LM
El LM Search Arena es una nueva plataforma de evaluación desarrollada por LM Arena para evaluar los sistemas de IA fortalecidos por la búsqueda basados en preferencias humanas. A diferencia de los puntos de referencia anteriores como SimpleQA, que se concentró en una precisión objetiva cercana, el campo de búsqueda evalúa cómo los modelos se cortan para consultas reales de los usuarios en áreas como programación, escritura, investigación y recomendaciones.
La evaluación tuvo lugar entre el 18 de marzo y el 13 de abril de 2025 y recolectó más de 10,000 votos de preferencia humana para 11 modelos. Se pidió a los usuarios que solicitaran consultas y luego evaluaran qué respuesta del modelo se necesita mejor su información.
Excelente rendimiento de los modelos de sonar
La redonda de sonar de Perplejity alcanzó un puntaje de arena de 1136 (± 21/−19), que es estadísticamente equivalente con el proceso Gemini-2.5 de Google (1142 +14/-17) y, por lo tanto, significa una posición superior común. Es particularmente digno de mención que con comparaciones directas-Rasonamiento de sonar-Pro-High Gemini-2.5 Profunding excedió en el 53% de los casos.
El dominio de la perplejidad en la evaluación se ilustra mediante la siguiente clasificación:
- Gemini-2.5-Pro-Grounding (1142 puntos)
- Sonar-Razoning-Pro-High (1136 puntos)
- Razonamiento de sonar (1097 puntos)
- Sonar (1072 puntos)
- Sonar-Pro-High (1071 puntos)
- Sonar-Pro (1066 puntos)
Todos los modelos de perplejidad tomaron las rangos superiores y excedieron los modelos calificados significativamente diferentes de Google (Gemini 2.0-Flash Grounding) y OpenAI (búsqueda GPT-4O).
Factores clave para el éxito
La arena de búsqueda identificó tres factores que se correlacionaron fuertemente con la preferencia humana:
Respuestas más completas
Los usuarios prefirieron las respuestas más largas (coeficiente 0.255, p <0.05). Los modelos SONAR proporcionan información detallada y detallada sobre una variedad de temas, lo que conduce a una mayor satisfacción del usuario.
Superioridad en fuentes
Un mayor número de citas se correlacionó fuertemente con la preferencia del usuario (coeficiente 0.234, p <0.05). Los modelos de sonar llevan a cabo una búsqueda más profunda y citan un promedio de 2-3 veces más fuentes que los modelos Géminis comparables. Este uso integral de la fuente garantiza que la información proporcionada esté bien documentada y confiable.
Uso de varias fuentes
La evaluación mostró que las citas de fuentes web comunitarias fueron particularmente valoradas. Los modelos de sonar se caracterizan por el uso efectivo de diferentes fuentes, incluidas YouTube, plataformas comunitarias y fuentes autorizadas.
Los experimentos de control confirmaron estos hallazgos y mostraron que la profundidad de búsqueda es una diferencia esencial en el rendimiento entre los modelos. Cuando se verifica las cotizaciones, las clasificaciones del modelo convergieron, lo que indica que la profundidad de búsqueda es un factor de diferenciación decisivo.
Adecuado para:
- La integración de la IA de una plataforma de IA de origen independiente y de datos cruzados para todos los asuntos de la compañía
La tecnología detrás de Sonar
El modelo de sonar de Perplexity se basa en Llama 3.3 70b y se desarrolló específicamente para la optimización de la calidad de la respuesta y la experiencia del usuario. Fue entrenado para mejorar la fidelidad y la legibilidad de las respuestas.
Velocidad y rendimiento
La sonar es impulsada por la infraestructura de las cerebras y proporciona respuestas a una impresionante velocidad de velocidad-1200 por segundo, lo que permite la generación de respuesta casi inmediata. Esta velocidad es casi 10 veces más rápida que con modelos comparables como Gemini 2.0 Flash.
Preferencia de usuario y comparación de rendimiento
Extensas pruebas A/B mostraron que SONAR supera claramente modelos como GPT-4O Mini y Claude 3.5 Haiku e incluso logra el rendimiento de los principales modelos como GPT-4O y Claude 3.5 Gonnet cuando se trata de satisfacción del usuario.
API de Sonar: accesibilidad para desarrolladores
La perplejidad también ofrece su tecnología de sonar a través de API, que permite a los desarrolladores integrar las funciones de búsqueda basadas en IA en sus aplicaciones. Hay dos versiones principales de la API:
API de sonar
La API de sonar estándar es liviana, económica, rápida y fácil de usar. Fue diseñado para empresas que necesitan funciones de respuesta sin complicaciones y están optimizadas para la velocidad.
Sonar Pro API
Para las empresas que necesitan funciones más avanzadas, la API de Sonar Pro ofrece la oportunidad de procesar consultas más complejas y de múltiples etapas. En promedio, genera el doble de fuentes por búsqueda que la versión estándar y tiene una ventana de contexto más amplia para consultas de búsqueda más largas y más matizadas.
La estructura de precios refleja estas diferencias: la sonda estándar cuesta $ 5 por 1,000 más $ 1 por 750,000 palabras (entrada y salida combinada). Sonar Pro mantiene las mismas 5 $ 1,000 de búsquedas, pero calcula las palabras de entrada de $ 750,000 y $ 15 por $ 750,000 palabras generadas.
De los factores de precisión a la orientación del usuario: sonar de perplejidad convencida
Los resultados sobresalientes en la evaluación de la arena de búsqueda de LM confirman que los modelos de sonar de Perplexity se encuentran entre los principales sistemas de búsqueda de IA. Con la combinación de fidelidad, información de origen extensa y capacidad de búsqueda profunda, ofrecen una experiencia de usuario superior.
Estos éxitos subrayan la posición de la perplejidad como innovador en el campo de la búsqueda basada en la IA y la provisión de información. La mejora continua de los modelos basados en la retroalimentación del usuario indica un mayor potencial para futuros desarrollos.
Para los usuarios de perplejidad, estos resultados significan que tienen acceso a la precisión de primera clase, una extensa atribución de origen y respuestas de alta calidad a una amplia gama de temas. Los usuarios de Pro pueden continuar beneficiándose de estos poderosos modelos determinando a Sonar como su modelo estándar en la configuración.
El fuerte desempeño de la sonar en la evaluación del campo de búsqueda no solo subraya la competencia tecnológica de la perplejidad, sino que también muestra el camino para el futuro de buscar IA: más precisamente, más integral y con una comprensión más profunda de las necesidades de información de los usuarios.
Adecuado para:
Su transformación de IA, integración de IA y experto en la industria de la plataforma de IA
☑️ Nuestro idioma comercial es inglés o alemán.
☑️ NUEVO: ¡Correspondencia en tu idioma nacional!
Estaré encantado de servirle a usted y a mi equipo como asesor personal.
Puedes ponerte en contacto conmigo rellenando el formulario de contacto o simplemente llámame al +49 89 89 674 804 (Múnich) . Mi dirección de correo electrónico es: wolfenstein ∂ xpert.digital
Estoy deseando que llegue nuestro proyecto conjunto.