Publié le : 19 avril 2025 / Mis à jour le : 19 avril 2025 – Auteur : Konrad Wolfenstein

Alternative open source à l'IA : Together AI lance « Open Deep Research », une solution open source pour la recherche web approfondie – Image : Xpert.Digital
Structurée, open source et puissante : Together AI propulse la recherche approfondie vers de nouveaux sommets
Together AI présente « Open Deep Research » : une alternative open source à Deep Research d'OpenAI
Le 16 avril 2025, Together AI a lancé « Open Deep Research », un système open source de recherche web structurée conçu comme une alternative à Deep Research d'OpenAI. Cet outil permet de répondre à des questions complexes grâce à une recherche web en plusieurs étapes et de générer des rapports complets basés sur les sources. Contrairement aux solutions propriétaires, Together AI met à disposition du public l'intégralité du code, des jeux de données et de l'architecture du système afin d'encourager le développement collaboratif.
Convient à:
- Openai Deep Research: Pour les utilisateurs, une approche hybride est recommandée: IA Deep Research comme outil de dépistage initial
L'architecture de la recherche en profondeur ouverte
Open Deep Research utilise un flux de travail en quatre étapes qui imite le processus de recherche humain. Ce processus débute par une phase de planification, durant laquelle un modèle d'IA génère une liste de requêtes de recherche pertinentes. Ensuite, le contenu correspondant est collecté sur le web grâce à l'API de recherche Tavily. Un modèle d'évaluation vérifie alors l'absence de lacunes dans les connaissances avant qu'un modèle de rédaction ne génère le rapport final.
L'approche unique de Together AI réside dans l'utilisation de différents modèles spécialisés pour les diverses tâches du flux de travail – une approche dite de « mixte d'agents » (MoA). Les modèles d'IA suivants sont utilisés pour la mise en œuvre :
- Planificateur : Qwen2.5-72B-Instruct-Turbo d’Alibaba pour les compétences en planification et en raisonnement
- Résumé : Llama-3.3-70B-Instruct-Turbo par Meta pour résumer du contenu web long
- Extracteur JSON : Llama-3.1-70B-Instruct-Turbo de Meta pour l'extraction d'informations structurées
- Créateur du rapport : DeepSeek-V3 pour l’agrégation d’informations et la création de rapports de recherche de haute qualité
Pour traiter les textes longs, le modèle de résumé synthétise le contenu et évalue sa pertinence. Cela évite la saturation des fenêtres de contexte des modèles de langage.
Architecture technique et intégration
Les modèles sont fournis via la plateforme cloud propriétaire de Together AI. La recherche web et l'extraction de contenu sont gérées par Tavily, avec l'avantage particulier de pouvoir effectuer ces deux opérations en un seul appel API.
Le temps de traitement d'une requête typique est compris entre 2 et 5 minutes, en fonction de la complexité de la requête et du nombre de boucles d'évaluation et de réflexion.
Sorties multimodales et fonctions étendues
Open Deep Research ne se limite pas à la production de texte, mais offre toute une gamme de fonctions multimodales :
- Sortie HTML : Les résultats sont présentés dans un format HTML structuré qui combine texte et éléments visuels
- Graphiques : Création automatique de graphiques via la bibliothèque JavaScript Mermaid JS
- Images de couverture : Génération d’images thématiquement appropriées à l’aide des modèles Flux de Black Forest Labs
- Fonction podcast : Création automatique d'un podcast audio compact résumant les points principaux du rapport, à l'aide des modèles vocaux Sonic de Cartesia
Ces formats de sortie multimodaux permettent une présentation plus complète et attrayante des informations recherchées.
Évaluation des performances et points de référence
Together AI a évalué les performances d'Open Deep Research à l'aide de trois benchmarks populaires :
- FRAMES : Test de raisonnement logique à plusieurs étapes
- SimpleQA : Test des connaissances factuelles
- HotPotQA : Évaluation des questions à plusieurs sauts nécessitant plusieurs étapes de raisonnement
Dans les trois tests de performance, Open Deep Research a obtenu des résultats nettement supérieurs aux modèles de base sans outils de recherche. Comparé à des systèmes ouverts similaires tels que Open Deep Research (LDR) de LangChain et SmolAgents (SearchCodeAgent) de Hugging Faces, le système a également généralement atteint une meilleure qualité de réponse.
L'une des conclusions les plus importantes de l'évaluation a été que la réalisation de plusieurs recherches consécutives améliore significativement la qualité des réponses. En revanche, lorsqu'une seule recherche est effectuée, la précision diminue sensiblement.
Limites et défis connus
Malgré les progrès réalisés, Together AI souligne plusieurs limites de son système :
- Propagation des erreurs : les erreurs survenant aux premières étapes du flux de travail peuvent se propager tout au long du processus et conduire à des résultats finaux erronés
- Hallucinations : Des hallucinations peuvent survenir lors de l'interprétation de sources, notamment en présence d'informations ambiguës ou contradictoires
- Biais structurels : Les biais dans les données d’entraînement ou les index de recherche peuvent influencer les résultats
- Actualité : Les sujets exigeant une forte actualité ou bénéficiant d'une faible couverture web présentent un défi particulier
- Problème de mise en cache : Bien que la mise en place d’un système de cache puisse réduire les coûts, sans délai d’expiration adéquat, elle conduit à la diffusion d’informations obsolètes
Ces limitations sont typiques des outils de recherche en IA actuels et représentent des défis importants pour les améliorations futures.
Convient à:
- Gemini Deep Research 2.0 – Mise à jour du modèle d'IA de Google – Informations sur Gemini 2.0 Flash, Flash Thinking et Pro (expérimental)
Open Deep Research comparé à d'autres offres
Le développement de capacités de recherche approfondie est actuellement une tendance chez les fournisseurs d'IA. OpenAI a été le premier à introduire ce concept, mais Google, Grok et Perplexity proposent désormais des fonctionnalités similaires. Anthropic a récemment intégré une fonction de recherche multi-agents à son modèle Claude.
Peu après la sortie d'OpenAI, Hugging Face avait déjà proposé une alternative open source, mais n'a pas poursuivi son développement. Perplexity, un moteur de recherche basé sur l'IA, offre une alternative gratuite à la recherche approfondie de ChatGPT, permettant aux utilisateurs d'effectuer jusqu'à cinq recherches approfondies par jour.
Contrairement aux systèmes fermés et payants tels que Deep Research d'OpenAI (qui fait partie de l'abonnement ChatGPT Pro pour environ 200 dollars par mois), Together AI offre une alternative entièrement ouverte et open source.
Orientation communautaire et évolutivité
Together AI a délibérément conçu Open Deep Research comme une plateforme ouverte, extensible et améliorable par la communauté. Son architecture a été pensée pour être facilement extensible : les développeurs peuvent intégrer leurs propres modèles, adapter les sources de données ou ajouter de nouveaux formats de sortie.
Le code source complet et la documentation sont disponibles sur GitHub, ainsi qu'un jeu de données d'évaluation et des explications détaillées sur le blog de l'entreprise. Together AI considère son système comme une base pour de futures expérimentations et améliorations par la communauté open source.
Cette ouverture contraste avec les approches fermées d'autres grandes entreprises d'IA et reflète l'engagement plus large de Together AI envers l'IA open source, qui s'est également exprimé dans des projets précédents, tels que la récente publication d'un modèle de codage open source au niveau d'o3-mini, mais avec beaucoup moins de paramètres que ses concurrents fermés.
Importance pour le paysage de la recherche en IA
Le lancement d'Open Deep Research par Together AI marque une étape importante dans la démocratisation des outils de recherche avancés en IA. En combinant des modèles d'IA performants, une recherche web structurée en plusieurs étapes et des formats de sortie multimodaux, ce système offre une alternative prometteuse aux solutions propriétaires.
L'approche ouverte permet aux développeurs et aux chercheurs d'adapter, d'étendre et d'améliorer le système selon leurs besoins. À terme, cela pourrait mener à des applications plus innovantes et diversifiées qu'avec des systèmes fermés.
Malgré les défis persistants, notamment en matière d'hallucinations, de biais et de délais, l'initiative Open Deep Research de Together AI démontre que les puissants outils de recherche en IA ne sont pas l'apanage des plateformes propriétaires. Cette initiative favorise non seulement l'accès libre aux technologies d'IA avancées, mais contribue également à la transparence et à la reproductibilité, facteurs essentiels pour instaurer la confiance dans la recherche basée sur l'IA.
Convient à:
Votre transformation d'IA, l'intégration de l'IA et l'expert de l'industrie de la plate-forme d'IA
☑️ Notre langue commerciale est l'anglais ou l'allemand
☑️ NOUVEAU : Correspondance dans votre langue nationale !
Je serais heureux de vous servir, vous et mon équipe, en tant que conseiller personnel.
Vous pouvez me contacter en remplissant le formulaire de contact ou simplement m'appeler au +49 89 89 674 804 (Munich) . Mon adresse e-mail est : wolfenstein ∂ xpert.digital
J'attends avec impatience notre projet commun.













