Publié le: 19 avril 2025 / mise à jour de: 19 avril 2025 - Auteur: Konrad Wolfenstein
KI Open Source Alternative: ensemble AI publie la «recherche en profondeur ouverte» de la source pour la recherche Web détaillée-Image: Xpert.Digital
Structuré, source, puissant: ensemble, l'IA apporte une recherche approfondie à un nouveau niveau
Ensemble, l'IA introduit une «recherche en profondeur ouverte»: une alternative open source à la recherche profonde d'Openais
Le 16 avril 2025, ensemble, l'IA a publié «Open Deep Research» - un système d'Open d'Open de source pour la recherche Web structurée, qui a été conçu comme une alternative à la recherche en profondeur OpenAIS. L'outil peut répondre à des questions complexes grâce à des recherches Web en plusieurs étapes et créer des rapports complets basés sur la source. Contrairement aux solutions propriétaires, ensemble, l'IA fournit publiquement le code complet, les enregistrements de données et l'architecture du système pour promouvoir le développement communautaire.
Convient à:
- Openai Deep Research: Pour les utilisateurs, une approche hybride est recommandée: IA Deep Research comme outil de dépistage initial
L'architecture de la recherche profonde ouverte
Open Deep Research travaille avec un flux de travail à quatre étages qui imite le processus de recherche humaine. Le processus commence par une étape de planification dans laquelle un modèle d'IA crée une liste de requêtes de recherche pertinentes. Le contenu approprié du Web est ensuite collecté via l'API de recherche Tavily. Un modèle d'évaluation vérifie ensuite s'il y a des lacunes de connaissances avant qu'un modèle d'écriture ne crée enfin le rapport final.
L'approche spéciale de l'IA ensemble réside dans l'utilisation de différents modèles spécialisés pour différentes tâches dans l'approche du flux de travail - une approche «mélange d'agent» (MOA). Les modèles d'IA suivants sont utilisés pour la mise en œuvre:
- Planificateur: Qwen2.5-72b Instruisez Turbo d'Alibaba pour les compétences de planification et de raisonnement
- Résumé: LLAMA 3.3-70B instruire Turbo de Meta pour résumer le contenu Web long
- Extracteur JSON: LLAMA 3.1-70B instruiter Turbo de Meta pour l'extraction d'informations structurées
- Fabricant de rapports: Deepseek-V3 pour l'agrégation de l'information et la création de rapports de recherche de haute qualité
Afin de pouvoir faire face à des textes plus longs, le modèle de résumé résume compact le contenu et évalue sa pertinence. Cela empêche les fenêtres de contexte des modèles vocaux de déborder.
Pile technique et intégration
En tant que base technique, les modèles sont fournis via leur propre plate-forme IA Cloud ensemble. La requête de recherche Web et de contenu se déroule via Tavily, selon laquelle un avantage particulier est que la recherche et la recherche du contenu du site Web peuvent être appelées dans un seul appel API.
Le temps de traitement d'une demande typique se situe entre 2 et 5 minutes, selon la complexité de la demande et le nombre de boucles d'évaluation et de réflexion.
Éditions multimodales et fonctions étendues
La recherche en profondeur ouverte n'est pas seulement limitée aux éditions de texte, mais propose également un certain nombre de fonctions multimodales:
- Édition HTML: Les résultats sont présentés dans un format HTML structuré, le texte et les éléments visuels sont combinés
- Diagrammes: Création automatique de diagrammes via la sirène JavaScript de la bibliothèque JS
- Images de couverture: Génération d'images thématiques appropriées à l'aide des modèles de flux de Black Forest Labs
- Fonction du podcast: Création automatique d'un podcast audio compact qui résume les principaux points du rapport à l'aide des modèles de langage sonore de Cartésie
Ces formats de sortie multimodaux permettent une présentation plus complète et attrayante des informations recherchées.
Évaluation des performances et références
Ensemble, AI a évalué les performances de la recherche profonde ouverte en utilisant trois repères populaires:
- Frames: tester des conclusions logiques multi-étages
- SimpleQA: examen des connaissances factuelles
- Hotpotqa: évaluation des questions multi-HOP qui nécessitent plusieurs étapes de conclusion
Dans les trois repères, des recherches en profondeur ouvertes ont bien mieux coupé les modèles de base sans outils de recherche. Également comparés à des systèmes ouverts similaires tels que les Langchains Open Deep Research (LDR) et les faces de câlin Smolagen (SearchCodeAgent), le système a généralement obtenu une meilleure qualité de réponse.
Un résultat particulièrement important de l'évaluation a été la prise de conscience que plusieurs étapes de recherche consécutives améliorent considérablement la qualité des réponses. Lorsqu'il est limité à une seule recherche, la précision a considérablement baissé.
Restrictions et défis connus
Malgré les progrès, ensemble, l'IA indique diverses restrictions sur son système:
- Contenue d'erreur: les erreurs dans les premières étapes du flux de travail peuvent se poursuivre pendant l'ensemble du pipeline et conduire à des résultats finaux incorrects
- Hallucinations: Les hallucinations peuvent se produire lors de l'interprétation des sources, en particulier avec des informations ambiguës ou contradictoires
- Distorsions structurelles: les biais dans les données de formation ou les indices de recherche peuvent influencer les résultats
- Topularité: les sujets avec des besoins élevés à dates ou une couverture Web basse sont un défi spécial
- Problème de mise en cache: la mise en cache mise en œuvre peut réduire les coûts, mais conduit à la livraison d'informations obsolètes sans un temps d'expiration approprié
Ces restrictions sont typiques des outils de recherche en IA actuels et représentent des défis importants pour les améliorations futures.
Convient à:
- Gemini Deep Research 2.0-Google Ki-Modell Information-Information sur Gemini 2.0 Flash, Flash Thinking et Pro (expérimental)
Recherche profonde ouverte par rapport aux autres offres
Le développement de fonctions de recherche approfondie est actuellement une tendance parmi les fournisseurs d'IA. OpenAai a initialement introduit le concept, mais maintenant Google, Grok et Perplexity offrent également des fonctions similaires. Anthropic a récemment présenté une fonction de recherche basée sur des agents pour son modèle Claude.
Hugging Face avait déjà présenté une alternative à l'ouvre source peu de temps après la publication d'Openai, mais ne l'a pas développée davantage. En tant que moteur de recherche d'IA, Perplexity offre une alternative gratuite à la recherche approfondie des chattes, par laquelle les utilisateurs peuvent effectuer jusqu'à cinq recherches avec une «recherche profonde» chaque jour.
Contrairement à des systèmes fermés et payants tels que OpenAIS Deep Research (la partie de l'abonnement Chatgpt Pro est d'environ 200 $ par mois), ensemble AI offre une alternative complètement ouverte et ouverte.
Focus et extensibilité de la communauté
Ensemble, l'IA a délibérément conçu des recherches en profondeur ouvertes comme une plate-forme ouverte qui peut être élargie et améliorée par la communauté. L'architecture a été conçue pour qu'elle puisse être facilement élargie - les développeurs peuvent intégrer leurs propres modèles, ajuster les sources de données ou ajouter de nouveaux formats de sortie.
Le code complet et la documentation ont été publiés sur GitHub, ainsi qu'un ensemble de données d'évaluation et des explications détaillées dans le blog de l'entreprise. Ensemble, l'IA considère son système comme la base de nouvelles expériences et améliorations de la communauté open source.
Cette ouverture contraste avec les approches fermées d'autres grandes sociétés d'IA et reflète ensemble un engagement plus large des AIS pour l'IA open source, qui a également été exprimé dans des projets précédents, tels que la publication récente d'un modèle de codage ouvert à la source au niveau d'O3-MinI, mais avec beaucoup moins de paramètres que la concurrence fermée.
Signification pour le paysage de recherche sur l'IA
La publication d'Open Deep Research par l'IA ensemble marque une étape importante dans la démocratisation des outils de recherche avancés de l'IA. Avec la combinaison de modèles d'IA puissants, de recherche Web à plusieurs niveaux structurés et de formats de sortie multimodale, le système offre une alternative prometteuse aux solutions propriétaires.
L'approche ouverte permet aux développeurs et aux chercheurs d'adapter, de développer et d'améliorer le système à leurs besoins. Cela pourrait conduire à des applications plus innovantes et diverses à long terme que ce qui ne serait possible avec les systèmes fermés.
Bien qu'il y ait encore des défis, en particulier en ce qui concerne les hallucinations, les préjugés et la topique, les recherches en profondeur ouvertes sur l'AIS montrent que de puissants outils de recherche d'IA ne doivent pas être limités aux plateformes propriétaires. L'initiative promeut non seulement l'accès ouvert à la technologie AI avancée, mais contribue également aux facteurs de transparence et de traçabilité pour la confiance dans les résultats de la recherche soutenus par l'IA.
Convient à:
Votre transformation d'IA, l'intégration de l'IA et l'expert de l'industrie de la plate-forme d'IA
☑️ Notre langue commerciale est l'anglais ou l'allemand
☑️ NOUVEAU : Correspondance dans votre langue nationale !
Je serais heureux de vous servir, vous et mon équipe, en tant que conseiller personnel.
Vous pouvez me contacter en remplissant le formulaire de contact ou simplement m'appeler au +49 89 89 674 804 (Munich) . Mon adresse e-mail est : wolfenstein ∂ xpert.digital
J'attends avec impatience notre projet commun.