Röstval 📢


KI Open Source Alternative: Tillsammans publicerar AI källöppen "Open Deep Research" för detaljerad vävningsforskning

Publicerad den: 19 april 2025 / Uppdaterad den: 19 april 2025 – Författare: Konrad Wolfenstein

AI-alternativ med öppen källkod: Tillsammans släpper AI lös öppen källkod

AI-alternativ med öppen källkod: Together AI släpper den öppna källkoden "Open Deep Research" för detaljerad webbforskning – Bild: Xpert.Digital

Strukturerad, öppen källkod, kraftfull: Tillsammans tar AI djupgående forskning till en ny nivå

Together AI introducerar ”Open Deep Research”: Ett öppen källkodsalternativ till OpenAI:s Deep Research

Den 16 april 2025 släppte Together AI ”Open Deep Research” – ett system med öppen källkod för strukturerad webbforskning utformat som ett alternativ till OpenAI:s Deep Research. Verktyget kan besvara komplexa frågor genom webbforskning i flera steg och generera omfattande, källbaserade rapporter. Till skillnad från proprietära lösningar gör Together AI hela koden, dataseten och systemarkitekturen allmänt tillgängliga för att uppmuntra samhällsbaserad utveckling.

Lämplig för detta:

Arkitekturen för Open Deep Research

Open Deep Research använder ett arbetsflöde i fyra steg som efterliknar den mänskliga forskningsprocessen. Processen börjar med ett planeringssteg, där en AI-modell genererar en lista med relevanta sökfrågor. Därefter samlas motsvarande innehåll in från webben med hjälp av Tavilys sök-API. En utvärderingsmodell kontrollerar sedan eventuella kvarvarande kunskapsluckor innan en skrivmodell slutligen genererar den slutliga rapporten.

AI:s unika tillvägagångssätt ligger i dess användning av olika specialiserade modeller för olika uppgifter inom arbetsflödet – en så kallad "Mixture-of-Agents" (MoA)-metod. Följande AI-modeller används för implementeringen:

  • Planerare: Qwen2.5-72B-Instruct-Turbo från Alibaba för planerings- och resonemangsförmåga
  • Sammanfattning: Llama-3.3-70B-Instruct-Turbo av Meta för att sammanfatta långt webbinnehåll
  • JSON-extraktor: Llama-3.1-70B-Instruct-Turbo från Meta för strukturerad informationsextraktion
  • Rapportskapare: DeepSeek-V3 för att samla information och skapa högkvalitativa forskningsrapporter

För att hantera längre texter sammanfattar sammanfattningsmodellen innehållet kompakt och bedömer dess relevans. Detta förhindrar att språkmodellernas kontextfönster svämmar över.

Teknisk stack och integration

Modellerna tillhandahålls via Together AI:s egenutvecklade molnplattform. Webbsökning och innehållshämtning hanteras av Tavily, med den särskilda fördelen att både sökning och hämtning av webbplatsinnehåll kan utföras i ett enda API-anrop.

Behandlingstiden för en typisk förfrågan är mellan 2 och 5 minuter, beroende på förfrågans komplexitet och antalet utvärderings- och reflektionsloopar.

Multimodala utgångar och utökade funktioner

Open Deep Research är inte begränsat till textutdata, utan erbjuder en rad multimodala funktioner:

  • HTML-utdata: Resultaten presenteras i ett strukturerat HTML-format som kombinerar text och visuella element
  • Diagram: Automatisk skapande av diagram via Mermaid JS JavaScript-bibliotek
  • Omslagsbilder: Generering av tematiskt lämpliga bilder med hjälp av Flux-modellerna från Black Forest Labs
  • Podcastfunktion: Automatisk skapande av en kompakt ljudpodcast som sammanfattar rapportens huvudpunkter med hjälp av Cartesias Sonic-talmodeller

Dessa multimodala utdataformat möjliggör en mer omfattande och tilltalande presentation av den undersökta informationen.

Prestandautvärdering och riktmärken

Together AI utvärderade Open Deep Researchs resultat med hjälp av tre populära riktmärken:

  • RAMAR: Test för logiskt resonemang i flera steg
  • SimpleQA: Testning av faktakunskap
  •  HotPotQA: Bedömning av flerstegsfrågor som kräver flera steg i resonemang

I alla tre testerna presterade Open Deep Research betydligt bättre än grundläggande modeller utan sökverktyg. Jämfört med liknande öppna system som LangChains Open Deep Research (LDR) och Hugging Faces SmolAgents (SearchCodeAgent) uppnådde systemet generellt sett också högre svarskvalitet.

Ett särskilt viktigt resultat av utvärderingen var att flera på varandra följande söksteg avsevärt förbättrade svarens kvalitet. När sökningen begränsades till en enda sökning minskade noggrannheten märkbart.

Kända begränsningar och utmaningar

Trots framstegen pekar Together AI på flera begränsningar i sitt system:

  • Felspridning: Fel i tidiga steg i arbetsflödet kan spridas genom hela pipelinen och leda till felaktiga slutresultat
  • Hallucinationer: Hallucinationer kan uppstå vid tolkning av källor, särskilt med tvetydig eller motsägelsefull information
  • Strukturella biaser: Bias i träningsdata eller sökindex kan påverka resultaten
  • Aktualitet: Ämnen som kräver hög aktualitet eller har låg webbtäckning utgör en särskild utmaning
  • Cachproblem: Implementerad cachning kan minska kostnaderna, men utan tillräcklig utgångstid leder det till leverans av föråldrad information

Dessa begränsningar är typiska för nuvarande AI-forskningsverktyg och representerar viktiga utmaningar för framtida förbättringar.

Lämplig för detta:

Open Deep Research jämfört med andra erbjudanden

Utvecklingen av djupgående forskningskapacitet är för närvarande en trend bland AI-leverantörer. OpenAI introducerade ursprungligen konceptet, men Google, Grok och Perplexity erbjuder nu liknande funktioner. Anthropic introducerade nyligen även en agentbaserad forskningsfunktion för sin Claude-modell.

Hugging Face hade redan presenterat ett alternativ med öppen källkod kort efter OpenAI:s lansering, men utvecklade det inte vidare. Perplexity, en AI-sökmotor, erbjuder ett gratis alternativ till ChatGPT:s Deep Research, vilket gör det möjligt för användare att utföra upp till fem "djupgående research"-sökningar per dag.

Till skillnad från slutna, betalda system som OpenAIs Deep Research (som ingår i ChatGPT Pro-prenumerationen för cirka 200 dollar per månad) erbjuder Together AI ett helt öppet och öppen källkodsbaserad alternativ.

Gemenskapsfokus och skalbarhet

Together AI har medvetet utformat Open Deep Research som en öppen plattform som kan utökas och förbättras av communityn. Arkitekturen är utformad för att vara lätt att bygga ut – utvecklare kan integrera sina egna modeller, anpassa datakällor eller lägga till nya utdataformat.

Den kompletta koden och dokumentationen har publicerats på GitHub, tillsammans med en utvärderingsdatauppsättning och detaljerade förklaringar på företagets blogg. Tillsammans ser AI sitt system som en grund för ytterligare experiment och förbättringar av öppen källkodsgemenskapen.

Denna öppenhet står i kontrast till de slutna tillvägagångssätten hos andra stora AI-företag och återspeglar Together AI:s bredare engagemang för öppen källkod för AI, vilket också har uttryckts i tidigare projekt, såsom den senaste lanseringen av en öppen källkodsmodell på nivå med o3-mini, men med betydligt färre parametrar än dess slutna konkurrenter.

Betydelse för AI-forskningslandskapet

Lanseringen av Open Deep Research från Together AI markerar ett viktigt steg i demokratiseringen av avancerade AI-forskningsverktyg. Genom att kombinera kraftfulla AI-modeller, strukturerad webbforskning i flera steg och multimodala utdataformat erbjuder systemet ett lovande alternativ till proprietära lösningar.

Det öppna tillvägagångssättet gör det möjligt för utvecklare och forskare att anpassa, utöka och förbättra systemet efter sina behov. På lång sikt kan detta leda till mer innovativa och mångsidiga tillämpningar än vad som skulle vara möjligt med slutna system.

Även om utmaningar kvarstår, särskilt vad gäller hallucinationer, partiskhet och aktualitet, visar Together AI:s Open Deep Research att kraftfulla AI-forskningsverktyg inte behöver begränsas till proprietära plattformar. Initiativet främjar inte bara öppen tillgång till avancerad AI-teknik utan bidrar också till transparens och reproducerbarhet – avgörande faktorer för att bygga förtroende för AI-driven forskning.

Lämplig för detta:

 

Din AI -omvandling, AI -integration och AI -plattformsindustrin Expert

☑ Vårt affärsspråk är engelska eller tyska

☑ Nytt: korrespondens på ditt nationella språk!

 

Digital pionjär - Konrad Wolfenstein

Konrad Wolfenstein

Jag är glad att vara tillgänglig för dig och mitt team som personlig konsult.

Du kan kontakta mig genom att fylla i kontaktformuläret eller helt enkelt ringa mig på +49 89 674 804 (München) . Min e -postadress är: Wolfenstein xpert.digital

Jag ser fram emot vårt gemensamma projekt.

 

 

☑ SME -stöd i strategi, rådgivning, planering och implementering

☑ Skapande eller omjustering av AI -strategin

☑ Pioneer Business Development


⭐️ Artificiell intelligens (AI) - AI-blogg, hotspot och innehållsnav ⭐️ XPaper