Avaldatud: 19. aprillil 2025 / UPDATE FROM: 19. aprill 2025 - autor: Konrad Wolfenstein
Ki avatud lähtekoodiga alternatiiv: koos AI avaldab üksikasjaliku veebianalüüsi allika avamise „avatud sügavad uurimistööd”: xpert.digital
Struktureeritud, allikas, võimas: koos AI viib sügavad uuringud uuele tasemele
Koos tutvustab AI “Avatud sügavat uurimistööd”: avatud lähtekoodiga alternatiiv OpenAis Deep Researchile
16. aprillil 2025 andis AI välja koos “Open Deep Research” - struktureeritud veebis -uuringute allika süsteemi, mis oli loodud alternatiivina OpenAis Deep Research'ile. Tööriist saab keerukatele küsimustele vastata mitmetasandilise veebiuuringute kaudu ja luua põhjalikke, allikapõhiseid aruandeid. Vastupidiselt patenteeritud lahendustele pakub AI koos kogukonnapõhise edasise arengu edendamiseks kogu koodi, andmekirjeid ja süsteemi arhitektuuri.
Sobib selleks:
- OpenAi Deep Research: Kasutajate jaoks on soovitatav hübriidne lähenemisviis: AI Deep Research kui esialgse sõeluuringu tööriist
Avatud sügavate uuringute arhitektuur
Avatud sügavad uurimistööd töötavad nelja etapiga töövooga, mis jäljendab inimauuringute protsessi. Protsess algab planeerimisetapiga, kus AI -mudel loob loendi asjakohastest otsingupäringutest. Seejärel kogutakse veebist sobiv sisu API kaudu. Seejärel kontrollib hindamismudel, kas on olemas teadmiste lünki enne, kui kirjutamismudel lõpuks lõpparuande loob.
AI koos erinevate spetsialiseerunud mudelite kasutamises erinevate ülesannete kasutamises töövoo-a-nn „agendisegu” (MOA) lähenemisviisis. Rakendamiseks kasutatakse järgmisi AI mudeleid:
- Planeerija: Qwen2.5-72B juhendab Alibabast Turbo planeerimis- ja arutluskäikude jaoks
- Kokkuvõte: Lalama 3.3-70B juhendab Turbo metast kokku võtma pika veebisisu
- JSONE EXTRAKTOR: Lalma 3.1-70B juhendab Turbo metast struktureeritud teabe kaevandamiseks
- Aruandluse tootja: DeepSEEK-V3 teabe koondamise ja kvaliteetsete uuringuaruannete loomiseks
Pikemate tekstidega toimetulemiseks võtab kokkuvõtlik mudel sisu kompaktseks kokku ja hindab selle asjakohasust. See hoiab ära häälemudelite kontekstiaknad ülevoolu.
Tehniline virn ja integratsioon
Tehnilise alusena pakutakse mudeleid omaenda AI pilveplatvormi kaudu. Veebiotsing ja sisupäring toimub Tavily kaudu, mille kohaselt eriline eelis on see, et nii veebisaidi otsingut kui ka otsimist saab helistada ühe API -kõnega.
Tüüpilise päringu töötlemisaeg on vahemikus 2 kuni 5 minutit, sõltuvalt päringu keerukusest ning hindamis- ja peegeldussilmuste arvust.
Multimodaalsed väljaanded ja laiendatud funktsioonid
Avatud sügavad uuringud ei piirdu ainult tekstiväljaannetega, vaid pakub ka mitmeid multimodaalseid funktsioone:
- HTML väljaanne: tulemused on esitatud struktureeritud HTML -vormingus, tekst ja visuaalsed elemendid ühendatakse
- Skeemid: Diagrammide automaatne loomine JavaScripti raamatukogu merineitsi JS kaudu
- Kaanepildid: temaatiliselt sobivate piltide genereerimine Black Forest Labsi voolumudelite abil
- Podcasti funktsioon: kompaktse helipodcasti automaatne loomine, mis võtab kokku aruande peamised punktid, kasutades Cartesia helilisi keelemudeleid
Need multimodaalsed väljundvormingud võimaldavad uuritud teabe põhjalikumat ja ahvatlevamat esitlust.
Jõudluse hindamine ja võrdlusalused
AI hindas koos avatud sügavate uuringute tulemusi, kasutades kolme populaarset võrdlusalust:
- Raamid: mitmeastmeliste loogiliste järelduste test
- Simpleqa: faktiliste teadmiste uurimine
- HotpotQA: mitme hopi küsimuste hindamine, mis nõuavad mitmeid järeldustetappe
Kõigis kolmes võrdlusaluses katkestas Open Deep Research palju paremini kui põhimudelid ilma otsinguriistadeta. Võrreldes ka sarnaste avatud süsteemidega, näiteks Langchains Open Deep Research (LDR) ja kallistavate nägudega Smolagen (SearchCodeagent), saavutas süsteem tavaliselt kõrgema vastuse kvaliteedi.
Hindamise eriti oluline tulemus oli mõistmine, et mitmed järjestikused uurimistööd parandavad märkimisväärselt vastuste kvaliteeti. Kui see on piiratud ühe otsingujooksuga, langes täpsus märgatavalt.
Teadaolevad piirangud ja väljakutsed
Vaatamata edusammudele näitab AI koos oma süsteemi erinevaid piiranguid:
- Vigade jätk: töövoo varajastes etappides olevad vead võivad jätkuda kogu torujuhtme kaudu ja viia valede lõpptulemusteni
- Hallutsinatsioonid: allikate tõlgendamisel võivad tekkida hallutsinatsioonid, eriti mitmetähendusliku või vastuolulise teabega
- Struktuurilised moonutused: koolituse või otsinguindeksite eelarvamused võivad tulemusi mõjutada
- Topolity: kõrgete vajaduste või madala veebikattega teemad on eriline väljakutse
- Vahemäluprobleem: rakendatud vahemällu salvestamine võib kulusid vähendada, kuid see viib vananenud teabe tarnimiseni ilma asjakohase aegumisajata
Need piirangud on tüüpilised AI praegustele uurimisvahenditele ja esindavad olulisi väljakutseid edaspidiseks parandamiseks.
Sobib selleks:
- Kaksikud Deep Research 2.0-Google Ki-Modelli uuendus Kaksikute 2.0 välklambi, välklambi ja Pro kohta (eksperimentaalne)
Avatud sügavad uuringud võrreldes teiste pakkumistega
Sügavate teadusfunktsioonide arendamine on praegu AI pakkujate seas trend. Algselt tutvustas OpenAai kontseptsiooni, kuid nüüd pakuvad sarnaseid funktsioone ka Google, Grok ja hämmeldus. Hiljuti esitas Antropic oma Claude mudeli jaoks ka agendipõhise uurimisfunktsiooni.
Kallistus Face oli juba pärast OpenAi väljaannet avanud allika alternatiivi, kuid ei arendanud seda veelgi. AI otsingumootorina pakub hämming tasuta alternatiivi vestlusele sügavale uurimistööle, kusjuures kasutajad saavad iga päev läbi viia kuni viis otsingut.
Vastupidiselt suletud, tasuliste süsteemide nagu OpenAis Deep Research (CATGPT Pro tellimuse osa on umbes 200 dollarit kuus), pakub AI koos täiesti avatud ja allika-avanemis alternatiivi.
Kogukonna fookus ja laiendatavus
AI kavandas teadlikult avatud sügavad uurimistööna avatud platvormi, mida kogukond saab laiendada ja täiustada. Arhitektuur oli konstrueeritud nii, et seda saaks hõlpsasti laiendada - arendajad saavad oma mudeleid integreerida, andmeallikaid reguleerida või uusi väljundvorminguid lisada.
Kogu kood ja dokumentatsioon avaldati GitHubis koos hindamisandmete kogumi ja üksikasjalike selgitustega ettevõtte ajaveebis. AI peab oma süsteemi koos avatud lähtekoodiga kogukonna edasiste katsete ja paranduste aluseks.
See avatus on vastupidiselt teiste suurte AI-ettevõtete suletud lähenemisviisidele ja peegeldab AIS-i laiemat kaasamist avatud lähtekoodiga AI-ga, mida väljendati ka varasemates projektides, näiteks allika avamise kodeerimismudeli hiljutine väljaanne O3-mini tasemel, kuid märkimisväärselt vähem parameetreid kui suletud võistlus.
Tähendus AI uurimismaastiku jaoks
AI avatud sügava uurimistöö avaldamine tähistab AI olulist sammu AI teadusvahendite demokratiseerimisel. Võimsate AI-mudelite, struktureeritud mitmetasandilise veebiuuringute ja multimodaalsete väljundvormingute kombinatsiooni abil pakub süsteem paljutõotavat alternatiivi patenteeritud lahendustele.
Avatud lähenemisviis võimaldab arendajatel ja teadlastel süsteemi kohandada, laiendada ja parandada oma vajadusi. See võib pikas perspektiivis viia uuenduslikumate ja mitmekesisemate rakendusteni, kui suletud süsteemide puhul oleks võimalik.
Ehkki endiselt on väljakutseid, eriti hallutsinatsioonide, eelarvamuste ja aktuaalsuse osas, näitavad AIS avatud sügavad uuringud, et võimsad AI uurimisvahendid ei pea piirduma omanduses olevate platvormidega. Algatus mitte ainult ei edenda avatud juurdepääsu arenenud AI-tehnoloogiale, vaid aitab kaasa ka läbipaistvuse ja jälgitavuse olulistele teguritele usalduse jaoks AI toetatud uurimistulemustes.
Sobib selleks:
Teie AI ümberkujundamine, AI integreerimine ja AI platvormi tööstuse ekspert
☑️ Meie ärikeel on inglise või sakslane
☑️ Uus: kirjavahetus teie riigikeeles!
Mul on hea meel, et olete teile ja minu meeskonnale isikliku konsultandina kättesaadav.
Võite minuga ühendust võtta, täites siin kontaktvormi või helistage mulle lihtsalt telefonil +49 89 674 804 (München) . Minu e -posti aadress on: Wolfenstein ∂ xpert.digital
Ootan meie ühist projekti.