Gepubliceerd op: 19 april 2025 / UPDATE VAN: 19 april 2025 - Auteur: Konrad Wolfenstein
Ki Open Source Alternative: Samen publiceert AI de bron-open "Open Deep Research" voor gedetailleerd webonderzoek: Xpert.Digital
Gestructureerd, bron, krachtig: samen brengt AI diep onderzoek naar een nieuw niveau
Samen introduceert AI "Open Deep Research": een open source alternatief voor Openais Deep Research
Op 16 april 2025 bracht AI samen "Open Deep Research" uit - een bron -open systeem voor gestructureerd webonderzoek, dat werd ontworpen als een alternatief voor Openais Deep Research. De tool kan complexe vragen beantwoorden via multi -stage webonderzoek en uitgebreide, brongebaseerde rapporten maken. In tegenstelling tot eigen oplossingen biedt AI samen de volledige code, gegevensrecords en systeemarchitectuur publiekelijk om op de gemeenschap gebaseerde verdere ontwikkeling te bevorderen.
Geschikt hiervoor:
- Openai Deep Research: voor gebruikers wordt een hybride aanpak aanbevolen: AI Deep Research als een eerste screeningstool
De architectuur van open diep onderzoek
Open diep onderzoek werkt met een workflow met vier stage die het menselijke onderzoeksproces imiteert. Het proces begint met een planningsstap waarin een AI -model een lijst met relevante zoekopdrachten maakt. Geschikte inhoud van het web wordt vervolgens verzameld via de Tavily Search API. Een evaluatiemodel controleert vervolgens of er kennislacunes zijn voordat een schrijfmodel eindelijk het eindrapport maakt.
De speciale benadering van samen AI ligt in het gebruik van verschillende gespecialiseerde modellen voor verschillende taken in de workflow-een zogenaamde "Mixture-of Agent" (MOA) -benadering. De volgende AI -modellen worden gebruikt voor de implementatie:
- Planner: Qwen2.5-72B Instrueer Turbo uit Alibaba voor planning en redeneervaardigheden
- Samenvatting: LLAMA 3.3-70B instrueert turbo van meta om lange webinhoud samen te vatten
- JSON Extractor: LLAMA 3.1-70B instrueert turbo uit meta voor gestructureerde informatie-extractie
- Fabrikant rapporteren: Deepseek-V3 voor de verzameling informatie en het creëren van onderzoeksrapporten van hoge kwaliteit
Om met langere teksten om te gaan, vat het samenvattende model de inhoud samen en evalueert de relevantie ervan. Dit voorkomt dat de contextvensters van de spraakmodellen overlopen.
Technische stapel en integratie
Op technische basis worden de modellen via hun eigen AI Cloud -platform verstrekt. De zoekopdrachten op het web en inhoud vinden plaats via Tavily, waarbij een bepaald voordeel is dat zowel de zoekopdracht als de zoekopdracht van de website -inhoud in één API -oproep kan worden aangeroepen.
De verwerkingstijd voor een typisch verzoek is tussen 2 en 5 minuten, afhankelijk van de complexiteit van het verzoek en het aantal evaluatie- en reflectielussen.
Multimodale edities en uitgebreide functies
Open diep onderzoek is niet alleen beperkt tot tekstedities, maar biedt ook een aantal multimodale functies:
- HTML -editie: de resultaten worden gepresenteerd in een gestructureerd HTML -formaat, de tekst en visuele elementen worden gecombineerd
- Diagrammen: Automatische creatie van diagrammen via de JavaScript Library Mermaid JS
- Bedek afbeeldingen: het genereren van thematisch geschikte afbeeldingen met behulp van de fluxmodellen van Black Forest Labs
- Podcast -functie: automatische creatie van een compacte audiopodcast die de belangrijkste punten van het rapport samenvat met behulp van de Sonic Language -modellen van Cartesia
Deze multimodale outputformaten maken een meer uitgebreide en aantrekkelijkere presentatie van de onderzochte informatie mogelijk.
Prestatie -evaluatie en benchmarks
Samen evalueerde AI de prestaties van open diep onderzoek met behulp van drie populaire benchmarks:
- Frames: test voor logische conclusies met meerdere stage
- Simpleqa: onderzoek van feitelijke kennis
- Hotpotqa: evaluatie van multi-hop vragen die verschillende conclusie-stappen vereisen
In alle drie de benchmarks is open diep onderzoek veel beter afgebroken dan basismodellen zonder zoekhulpmiddelen. Ook vergeleken met vergelijkbare open systemen zoals Langchains Open Deep Research (LDR) en knuffelende gezichten Smolagen (SearchCodeAgent), behaalde het systeem meestal een hogere kwaliteit van antwoord.
Een bijzonder belangrijk resultaat van de evaluatie was het besef dat verschillende opeenvolgende onderzoeksstappen de antwoordkwaliteit aanzienlijk verbeteren. Indien beperkt tot een enkele zoekrun, daalde de nauwkeurigheid merkbaar.
Bekende beperkingen en uitdagingen
Ondanks de vooruitgang geeft AI samen verschillende beperkingen op zijn systeem aan:
- Foutuitvoering: fouten in vroege stappen van de workflow kunnen doorgaan door de hele pijplijn en leiden tot onjuiste eindresultaten
- Hallucinaties: hallucinaties kunnen optreden bij het interpreteren van bronnen, vooral met dubbelzinnige of tegenstrijdige informatie
- Structurele vervormingen: vooringenomenheid in trainingsgegevens of zoekindexen kunnen de resultaten beïnvloeden
- Topulariteit: onderwerpen met hoog -up -datumbehoeften of lage webbedekking zijn een speciale uitdaging
- Caching Probleem: de geïmplementeerde caching kan de kosten verlagen, maar leidt tot de levering van verouderde informatie zonder een geschikte vervalstijd
Deze beperkingen zijn typerend voor huidige AI -onderzoekstools en vormen belangrijke uitdagingen voor toekomstige verbeteringen.
Geschikt hiervoor:
- Gemini Deep Research 2.0-Google Ki-Modell Upgrade-Informatie over Gemini 2.0 Flash, Flash Thinking en Pro (experimenteel)
Open diep onderzoek in vergelijking met andere aanbiedingen
De ontwikkeling van diepe onderzoeksfuncties is momenteel een trend onder AI -providers. OpenAai introduceerde oorspronkelijk het concept, maar nu bieden Google, Grok en Perplexity ook vergelijkbare functies. Anthropic presenteerde onlangs ook een agentgebaseerde onderzoeksfunctie voor zijn Claude-model.
Knuffelende gezicht had al een bron -open alternatief gepresenteerd kort na de publicatie van Openai, maar ontwikkelde het niet verder. Als AI -zoekmachine biedt Pertlexity een gratis alternatief voor Chatgpts diep onderzoek, waarbij gebruikers elke dag maximaal vijf zoekopdrachten met "diep onderzoek" kunnen uitvoeren.
In tegenstelling tot gesloten, betaalde systemen zoals Openais Deep Research (het deel van het Chatgpt Pro-abonnement is voor ongeveer $ 200 per maand), biedt AI samen een volledig open en source-open alternatief.
Community focus en uitbreidbaarheid
Samen hebben AI opzettelijk open diep onderzoek ontworpen als een open platform dat door de gemeenschap kan worden uitgebreid en verbeterd. De architectuur is zo ontworpen dat deze gemakkelijk kan worden uitgebreid - ontwikkelaars kunnen hun eigen modellen integreren, gegevensbronnen aanpassen of nieuwe uitvoerformaten toevoegen.
De volledige code en de documentatie werden gepubliceerd op GitHub, samen met een evaluatiegegevensset en gedetailleerde uitleg in het bedrijfsblog. Samen beschouwt AI zijn systeem als basis voor verdere experimenten en verbeteringen van de open source -gemeenschap.
Deze openheid staat in tegenstelling tot de gesloten benaderingen van andere grote AI-bedrijven en weerspiegelt AI's bredere betrokkenheid voor open source AI, die ook werd uitgedrukt in eerdere projecten, zoals de recente publicatie van een bron-open coderingsmodel op het niveau van O3-Mini, maar met aanzienlijk minder parameters dan de gesloten competitie.
Betekenis voor het AI -onderzoekslandschap
De publicatie van open diep onderzoek door samen AI markeert een belangrijke stap in de democratisering van geavanceerde AI -onderzoekstools. Met de combinatie van krachtige AI-modellen, gestructureerde multi-level webonderzoek en multimodale outputformaten, biedt het systeem een veelbelovend alternatief voor eigen oplossingen.
De open aanpak stelt ontwikkelaars en onderzoekers in staat om het systeem aan te passen, uit te breiden en te verbeteren tot hun behoeften. Dit kan leiden tot meer innovatieve en diverse toepassingen op de lange termijn dan mogelijk zou zijn met gesloten systemen.
Hoewel er nog steeds uitdagingen zijn, vooral met betrekking tot hallucinaties, vooringenomenheid en actualiteit, blijkt samen AIS diep onderzoek dat krachtige AI -onderzoekstools niet beperkt hoeven te zijn tot eigen platforms. Het initiatief bevordert niet alleen open toegang tot geavanceerde AI-technologie, maar draagt ook bij aan transparantie en traceerbaarheid-belangrijke factoren voor vertrouwen in door AI ondersteunde onderzoeksresultaten.
Geschikt hiervoor:
Uw AI -transformatie, AI -integratie en AI Platform Industry Expert
☑️ onze zakelijke taal is Engels of Duits
☑️ Nieuw: correspondentie in uw nationale taal!
Ik ben blij dat ik beschikbaar ben voor jou en mijn team als een persoonlijk consultant.
U kunt contact met mij opnemen door het contactformulier hier in te vullen of u gewoon te bellen op +49 89 674 804 (München) . Mijn e -mailadres is: Wolfenstein ∂ Xpert.Digital
Ik kijk uit naar ons gezamenlijke project.