Pubblicato il: 15 aprile 2025 / Aggiornamento da: 15 aprile 2025 - Autore: Konrad Wolfenstein
Classifica della ricerca AI: i modelli AI del sonar perplessità sono in testa all'immagine del paesaggio di ricerca AI: Xpert.Digital
Sonar-ragionamento-pro-alto: perplessità di salto in cima alla ricerca dell'IA
Cambiamento nel sistema di ricerca AI: la pietra miliare perplessità nello sviluppo
I modelli sonar di perplessità hanno ottenuto risultati impressionanti nell'ultima valutazione dell'arena di ricerca LM, per cui il Sonar-Reason-Pro-High-High dopo il Grounding Gemini-2.5 di Google è un leader. Questa valutazione rappresenta una pietra miliare importante nell'evoluzione dei sistemi di ricerca AI e sottolinea la posizione di leader della perplessità in questa area competitiva.
Adatto a:
- Perplexity Sonar Pro API come motore di ricerca AI in applicazioni e strumenti esterni - per app intelligenti e ricerca su misura
La valutazione dell'arena di ricerca LM
LM Search Arena è una nuova piattaforma di valutazione sviluppata da LM Arena per valutare i sistemi di intelligenza artificiale in termini di ricerca basati sulle preferenze umane. Contrariamente ai precedenti benchmark come Simpleqa, che si sono concentrati su una stretta precisione fattuale, l'arena di ricerca valuta come i modelli si sono interrotti per le indagini degli utenti reali in settori come la programmazione, la scrittura, la ricerca e le raccomandazioni.
La valutazione è avvenuta tra il 18 marzo e il 13 aprile 2025 e ha raccolto oltre 10.000 voti di preferenza umana per 11 modelli. Agli utenti è stato chiesto di chiedere richieste e quindi valutare quale risposta del modello le loro informazioni necessitano meglio.
Performance eccezionali dei modelli Sonar
La perplessità di Sonar-Reason-Pro-High ha raggiunto un punteggio arena di 1136 (± 21/−19), che è statisticamente equivalente con il Process Gemini-2.5 di Google (1142 +14/-17) e quindi significa una posizione alta comune. È particolarmente degno di nota il fatto che, con confronti diretti, il Sonar-Reason-Pro-High-High-2.5-Grounding ha superato nel 53% dei casi.
Il dominio della perplessità nella valutazione è illustrato dalla seguente classifica:
- Gemini-2.5-gunding (1142 punti)
- Sonar-ragionamento-pro-alto (1136 punti)
- Sonar-Reasoning (1097 punti)
- Sonar (1072 punti)
- Sonar-Pro-High (1071 punti)
- Sonar-Pro (1066 punti)
Tutti i modelli di perplessità hanno preso i ranghi superiori e hanno superato i modelli nominali significativamente diversi da Google (messa a terra Gemini 2.0-Flash) e OpenAI (ricerca GPT-4O).
Fattori chiave per il successo
L'arena di ricerca ha identificato tre fattori correlati fortemente con la preferenza umana:
Risposte più complete
Le risposte più lunghe sono state preferite dagli utenti (coefficiente 0,255, p <0,05). I modelli Sonar forniscono informazioni dettagliate e dettagliate su una varietà di argomenti, che portano a una maggiore soddisfazione dell'utente.
Superiorità nelle fonti
Un numero maggiore di citazioni è stato fortemente correlato alla preferenza dell'utente (coefficiente 0,234, p <0,05). I modelli Sonar effettuano una ricerca più profonda e citano una media di 2-3 volte più fonti rispetto ai modelli gemelli comparabili. Questo uso completo della fonte garantisce che le informazioni fornite siano ben documentate e affidabili.
Uso di varie fonti
La valutazione ha mostrato che le citazioni di fonti web della comunità erano particolarmente apprezzate. I modelli Sonar sono caratterizzati dall'uso efficace di diverse fonti, tra cui YouTube, piattaforme di comunità e fonti autorevoli.
Gli esperimenti di controllo hanno confermato questi risultati e hanno mostrato che la profondità della ricerca è una differenza essenziale nelle prestazioni tra i modelli. Se verificati per le citazioni, le classifiche del modello convergevano, indicando che la profondità di ricerca è un fattore di differenziazione decisivo.
Adatto a:
La tecnologia dietro il sonar
Il modello sonar di perplessità si basa sul Llama 3.3 70B ed è stato specificamente sviluppato per l'ottimizzazione della qualità di risposta e dell'esperienza dell'utente. È stato addestrato per migliorare la fedeltà e la leggibilità delle risposte.
Velocità e prestazioni
Il sonar è guidato dall'infrastruttura Cerebras e fornisce risposte a un token di velocità-1200 impressionante al secondo, che consente una generazione di risposta quasi immediata. Questa velocità è quasi 10 volte più veloce rispetto a modelli comparabili come Gemini 2.0 Flash.
Preferenza dell'utente e confronto delle prestazioni
Estesi test A/B hanno mostrato che Sonar supera chiaramente i modelli come GPT-4O Mini e Claude 3.5 Haiku e raggiunge persino le prestazioni di modelli migliori come GPT-4o e Claude 3.5 Connet quando si tratta di soddisfazione dell'utente.
Sonar API: accessibilità per gli sviluppatori
La perplessità offre anche la sua tecnologia Sonar tramite API, che consente agli sviluppatori di integrare le funzioni di ricerca basate sull'intelligenza artificiale nelle loro applicazioni. Esistono due versioni principali dell'API:
Sonar API
L'API Sonar standard è leggera, economica, rapida e facile da usare. È stato progettato per le aziende che necessitano di funzioni di risparmio non complicate e sono ottimizzate per la velocità.
Sonar Pro API
Per le aziende che necessitano di funzioni più avanzate, l'API Sonar Pro offre l'opportunità di elaborare domande più complesse e multiple. In media, genera il doppio delle fonti per ricerca della versione standard e ha una finestra di contesto più ampia per query di ricerca più lunghe e più sfumate.
La struttura dei prezzi riflette queste differenze: il sonar standard costa $ 5 per 1.000 più $ 1 per 750.000 parole (input e output combinati). Sonar Pro mantiene le stesse ricerche da 5 $ 1.000, ma calcola parole di input di $ 750.000 e $ 15 per $ 750.000 parole generate.
Dai fattori di precisione all'orientamento dell'utente: il sonar perplessità convinto
I risultati in sospeso nella valutazione dell'arena di ricerca LM confermano che i modelli di sonar di perplessità sono tra i principali sistemi di ricerca AI. Con la combinazione di fedeltà, informazioni di fonte estese e capacità di ricerca profonda, offrono un'esperienza utente superiore.
Questi successi sottolineano la posizione della perplessità come innovatore nel campo della ricerca basata sull'intelligenza artificiale e la fornitura di informazioni. Il miglioramento continuo dei modelli in base al feedback degli utenti indica un ulteriore potenziale per sviluppi futuri.
Per gli utenti di perplessità, questi risultati significano che hanno accesso a precisione di prima classe, attribuzione della fonte estesa e risposte di alta qualità a una vasta gamma di argomenti. Gli utenti professionisti possono continuare a beneficiare di questi potenti modelli determinando il sonar come modello standard nelle impostazioni.
La forte performance del sonar nella valutazione dell'arena di ricerca non solo sottolinea la competenza tecnologica della perplessità, ma mostra anche la strada per il futuro della ricerca dell'IA: più precisamente, più completa e con una comprensione più profonda delle esigenze di informazione degli utenti.
Adatto a:
- Cerca agente con intelligenza artificiale: la cometa del browser Web dalla perplessità come trasformazione basata su AI della navigazione web
- Ricerca agente: "Ricerca agente" SEO con perplessità: è il browser Web AI un agente di intelligenza artificiale o un semplice assistente di intelligenza artificiale?
La tua trasformazione AI, l'integrazione dell'IA ed esperto del settore della piattaforma AI
☑️ La nostra lingua commerciale è l'inglese o il tedesco
☑️ NOVITÀ: corrispondenza nella tua lingua nazionale!
Sarei felice di servire te e il mio team come consulente personale.
Potete contattarmi compilando il modulo di contatto o semplicemente chiamandomi al numero +49 89 89 674 804 (Monaco) . Il mio indirizzo email è: wolfenstein ∂ xpert.digital
Non vedo l'ora di iniziare il nostro progetto comune.