Yayınlanan: 15 Nisan 2025 / Güncelleme: 15 Nisan 2025 - Yazar: Konrad Wolfenstein
AI Arama Sıralaması: Düşünürlük Sonar'dan AI modelleri AI Arama Peyzajı'nda liderlik ediyor: Xpert.digital
Sonar kurgusal-profesyonel-yüksek: şaşkınlığın AI aramasının tepesine sıçraması
Yapay zeka arama sisteminde değişiklik: gelişmede şaşkınlığın kilometre taşı
Perplexity'nin sonar modelleri, en son LM arama arenası değerlendirmesinde etkileyici sonuçlar elde etti, böylece Google'ın İkizler 2.5 topraklamasının bir lider olduğu sonar mantıksız-profesyonel. Bu değerlendirme, AI arama sistemlerinin evriminde önemli bir kilometre taşını temsil eder ve şaşkınlığın bu rekabetçi alandaki önde gelen konumunu altını çizmektedir.
İçin uygun:
- Akıllı uygulamalar ve özel arama için harici uygulamalarda ve araçlarda yapay zeka arama motoru olarak Perplexity Sonar Pro API
LM Arama Arena Değerlendirmesi
LM Search Arena, insan tercihlerine dayalı arama güçlendirilmiş AI sistemlerini değerlendirmek için LM Arena tarafından geliştirilen yeni bir değerlendirme platformudur. Yakın olgusal doğruluk üzerine yoğunlaşan Simpleqa gibi önceki kriterlerin aksine, arama arenası, programlama, yazma, araştırma ve öneriler gibi alanlarda gerçek kullanıcı soruları için modellerin nasıl kesilmesini değerlendirir.
Değerlendirme 18 Mart ve 13 Nisan 2025 arasında gerçekleşti ve 11 model için 10.000'den fazla insan tercihi oyu topladı. Kullanıcılardan soru sormaları ve ardından hangi model yanıtının bilgilerinin daha iyi karşılanması gerektiğini değerlendirmeleri istendi.
Sonar modellerinin olağanüstü performansı
Perplexity'nin sonar kurgusal-Pro-High, Google'ın İkizler-2.5 süreci (1142 +14/-17) ile istatistiksel olarak eşdeğer olan 1136 (± 21/−19) arena skoruna ulaştı ve bu nedenle ortak bir üst pozisyon anlamına geliyor. Doğrudan karşılaştırmalarla sonar-deneme-en yüksek gemini-2.5-pro-pro-pro-pro-pro-pro-pre-pre-pre-pre-pre-pre-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-GÜN
Değerlendirmede şaşkınlığın egemenliği aşağıdaki sıralama ile gösterilmiştir:
- İkizler 2.5-PRO-PRO-GÜNLÜK (1142 puan)
- Sonar mantıklı profesyonel (1136 puan)
- Sonar Deneyimi (1097 puan)
- Sonar (1072 puan)
- Sonar-Pro-High (1071 puan)
- Sonar-Pro (1066 puan)
Tüm şaşkınlık modelleri üst safları aldı ve Google (Gemini 2.0-flash topraklama) ve Openai'den (GPT-4O arama) önemli ölçüde farklı derecelendirilmiş modelleri aştı.
Başarı için temel faktörler
Arama arenası, insan tercihi ile güçlü bir şekilde ilişkili olan üç faktör belirledi:
Daha kapsamlı cevaplar
Daha uzun cevaplar kullanıcılar tarafından tercih edildi (katsayı 0.255, p <0.05). Sonar modelleri, daha yüksek kullanıcı memnuniyetine yol açan çeşitli konular hakkında ayrıntılı, ayrıntılı bilgi sağlar.
Kaynaklarda üstünlük
Daha fazla sayıda alıntı, kullanıcı tercihi ile güçlü bir şekilde ilişkilidir (katsayı 0.234, p <0.05). Sonar modelleri daha derin bir arama yapar ve karşılaştırılabilir Gemini modellerinden ortalama 2-3 kat daha fazla kaynak teklif eder. Bu kapsamlı kaynak kullanımı, sağlanan bilgilerin iyi belgelenmiş ve güvenilir olmasını sağlar.
Çeşitli kaynakların kullanımı
Değerlendirme, topluluk web kaynaklarından alıntıların özellikle değerli olduğunu göstermiştir. Sonar modelleri, YouTube, topluluk platformları ve yetkili kaynaklar dahil olmak üzere farklı kaynakların etkili kullanımı ile karakterizedir.
Kontrol deneyleri bu bulguları doğruladı ve arama derinliğinin modeller arasındaki performansta önemli bir fark olduğunu gösterdi. Tırnaklar için kontrol edildiğinde, model sıralamaları birleşti, bu da arama derinliğinin belirleyici bir farklılaşma faktörü olduğunu gösterir.
İçin uygun:
- Tüm şirket konuları için bağımsız ve veriler arası bir kaynak çapında AI platformunun yapay zeka entegrasyonu
Sonar'ın arkasındaki teknoloji
Perplexity'nin Sonar Modeli Lama 3.3 70B'ye dayanmaktadır ve cevap kalitesi ve kullanıcı deneyiminin optimizasyonu için özel olarak geliştirilmiştir. Cevapların sadakatini ve okunabilirliğini artırmak için eğitildi.
Hız ve performans
Sonar, serebralar altyapısı tarafından yönlendirilir ve saniyede etkileyici hız-1200 jetonunda cevaplar sağlar, bu da neredeyse hemen yanıt üretimi sağlar. Bu hız, Gemini 2.0 Flash gibi karşılaştırılabilir modellerden neredeyse 10 kat daha hızlıdır.
Kullanıcı tercihi ve performans karşılaştırması
Kapsamlı A/B testleri, Sonar'ın GPT-4O Mini ve Claude 3.5 Haiku gibi modelleri açıkça aştığını ve hatta kullanıcı memnuniyeti söz konusu olduğunda GPT-4O ve Claude 3.5 Bonnet gibi en iyi modellerin performansına ulaştığını gösterdi.
Sonar API: Geliştiriciler için erişilebilirlik
Şaşkınlık ayrıca, geliştiricilerin AI tabanlı arama işlevlerini uygulamalarına entegre etmelerini sağlayan API'ler aracılığıyla sonar teknolojisini de sunar. API'nın iki ana sürümü vardır:
Sonar API
Standart Sonar API hafif, ucuz, hızlı ve kullanımı kolaydır. Karmaşık olmayan soru-cevap fonksiyonlarına ihtiyaç duyan ve hız için optimize edilen şirketler için tasarlanmıştır.
Sonar Pro API
Daha gelişmiş işlevlere ihtiyaç duyan şirketler için Sonar Pro API, daha karmaşık, çok aşamalı soruları işleme fırsatı sunar. Ortalama olarak, standart sürümden iki kat daha fazla kaynak üretir ve daha uzun ve daha nüanslı arama sorguları için daha geniş bir bağlam penceresine sahiptir.
Fiyat yapısı bu farklılıkları yansıtır: Standart Sonar'ın maliyeti 1.000 başına 5 $ artı 750.000 kelime başına 1 $ (giriş ve çıktı birleşik). Sonar Pro aynı 5 $ 'lık aramayı koruyor, ancak 750.000 $ giriş kelimesini ve 750.000 $' lık üretilen kelimeler başına 15 $ hesaplıyor.
Doğruluk faktörlerinden kullanıcı yönelime kadar: şaşkınlıktan sonar ikna oldu
LM arama arenası değerlendirmesinde olağanüstü sonuçlar, şaşkınlığın sonar modellerinin önde gelen AI arama sistemleri arasında olduğunu doğrulamaktadır. Sadakat, kapsamlı kaynak bilgileri ve derin arama yeteneği kombinasyonu ile üstün bir kullanıcı deneyimi sunarlar.
Bu başarılar, AI tabanlı arama ve bilgi sağlanması alanında şaşkınlığın bir yenilikçi olarak konumunun altını çizmektedir. Modellerin kullanıcı geri bildirimlerine dayanan sürekli iyileştirilmesi, gelecekteki gelişmeler için daha fazla potansiyel olduğunu göstermektedir.
Şaşkınlık kullanıcıları için bu sonuçlar, birinci sınıf doğruluk, kapsamlı kaynak ilişkilendirme ve çok çeşitli konulara yüksek kaliteli cevaplara eriştikleri anlamına gelir. Pro kullanıcıları, sonarları ayarlarda standart model olarak belirleyerek bu güçlü modellerden yararlanmaya devam edebilir.
Sonar'ın arama arenası değerlendirmesindeki güçlü performansı sadece şaşkınlığın teknolojik yeterliliğinin altını çizmekle kalmaz, aynı zamanda AI aramanın geleceğinin yolunu gösterir: daha kesin, daha kapsamlı ve kullanıcıların bilgi ihtiyaçlarını daha iyi anlayarak.
İçin uygun:
AI dönüşümünüz, AI entegrasyonu ve AI platformu endüstri uzmanınız
☑️İş dilimiz İngilizce veya Almancadır
☑️ YENİ: Ulusal dilinizde yazışmalar!
Size ve ekibime kişisel danışman olarak hizmet etmekten mutluluk duyarım.
iletişim formunu doldurarak benimle iletişime geçebilir +49 89 89 674 804 (Münih) numaralı telefondan beni arayabilirsiniz . E-posta adresim: wolfenstein ∂ xpert.digital
Ortak projemizi sabırsızlıkla bekliyorum.