发表于:2025年4月19日 /更新,发表于:2025年4月19日 - 作者: Konrad Wolfenstein
结构化,来源,强大:AI将深入的研究带入了一个新的水平
AI共同介绍了“开放深度研究”:开放源
2025年4月16日,AI共同发布了“开放深度研究”,这是一种用于结构化Web研究的来源开放系统,该系统被设计为Openais深入研究的替代方法。该工具可以通过多阶段的Web研究回答复杂的问题,并创建基于综合的,基于来源的报告。与专有解决方案相反,AI共同提供了完整的代码,数据记录和系统体系结构,以促进基于社区的进一步发展。
适合:
开放深入研究的结构
开放深入的研究与模仿人类研究过程的四阶段工作流程一起工作。该过程从计划步骤开始,其中AI模型创建了相关搜索查询列表。然后,通过Tavily搜索API收集Web的适当内容。然后,评估模型检查写作模型之前是否存在任何知识差距,最终创建了最终报告。
AI一起使用的特殊方法在于使用不同的专用模型在Workflow-A所谓的“ Agent”(MOA)方法(MOA)方法中使用不同的任务。以下AI模型用于实施:
- 计划者:QWEN2.5-72B指示来自阿里巴巴的Turbo计划和推理技能
- 摘要:Llama 3.3-70B指示从Meta的Turbo总结长网络内容
- JSON提取器:Llama 3.1-70B指示来自Meta的Turbo进行结构化信息提取
- 报告制造商:DeepSeek-V3用于汇总信息和创建高质量研究报告
为了能够处理更长的文本,摘要模型将内容汇总并评估其相关性。这样可以防止语音模型的上下文窗口溢出。
技术堆栈和集成
作为技术基础,模型是通过自己的AI云平台一起提供的。 Web搜索和内容查询是通过Tavily进行的,因此特定的优势是可以在单个API调用中调用网站内容的搜索和搜索。
典型请求的处理时间为2至5分钟,具体取决于请求的复杂性以及评估和反射循环的数量。
多模式版和扩展功能
开放深度研究不仅限于文本版本,而且还提供了许多多模式功能:
- HTML版:结果以结构化的HTML格式呈现,文本和视觉元素合并
- 图:通过JavaScript图书馆美人鱼JS自动创建图表
- 封面图像:借助黑森林实验室的通量模型,生成主题合适的图像
- 播客功能:自动创建紧凑的音频播客,该播客使用Cartesia的Sonic语言模型来汇总报告的要点
这些多模式产出格式可以对研究信息进行更全面和吸引人的介绍。
绩效评估和基准
AI共同评估了使用三个流行的基准测试的开放深入研究的表现:
- 帧:多阶段逻辑结论的测试
- SimpleQA:事实知识的考察
- HOTPOTQA:对需要几个结论步骤的多跳问题的评估
在所有三个基准测试中,开放的深入研究都比没有搜索工具的基本模型要好得多。与类似的开放系统(例如Langchains Open Deep Research(LDR)和拥抱面孔Smolagen(SearchCodeagent))相比,该系统通常可以获得更高的答案质量。
评估的一个特别重要的结果是认识到几个连续的研究步骤可显着提高答案质量。当限制一次搜索运行时,准确性会明显下降。
已知的限制和挑战
尽管取得了进展,但AI共同表示对其系统的各种限制:
- 错误延续:工作流程的早期步骤中的错误可以继续通过整个管道,并导致不正确的最终结果
- 幻觉:解释来源时可能会发生幻觉,尤其是使用模棱两可或矛盾的信息
- 结构扭曲:培训数据或搜索指数的偏见会影响结果
- 高调:具有高点至日期的主题或低网络封面是一个特殊的挑战
- 缓存问题:实施的缓存可以降低成本,但导致在没有适当到期时间的情况下提供过时的信息
这些限制是当前AI研究工具的典型限制,并代表了未来改进的重要挑战。
适合:
与其他优惠相比,开放深入研究
深度研究功能的发展目前是AI提供者的趋势。 Openaai最初引入了该概念,但是现在Google,Grok和Pllexity也提供了类似的功能。 Anthropic最近还为其Claude模型提供了基于代理的研究功能。
Openai出版后不久,Hugging Face已经提出了一个消息来源,但没有进一步发展。作为AI搜索引擎,困惑为Chatgpts的自由替代方案提供了深入研究,用户每天可以通过“深入研究”进行多达五次搜索。
与封闭的付费系统(例如OpenAIS Deep Research(Chatgpt Pro订阅的一部分约为每月200美元))相反,AI提供了完全开放式源开放的替代方案。
社区重点和扩展性
AI将开放的深入研究刻意作为一个开放平台,可以由社区扩展和改进。该体系结构的设计使其可以轻松扩展 - 开发人员可以集成自己的模型,调整数据源或添加新的输出格式。
完整的代码和文档发表在GitHub上,以及评估数据集以及公司博客中的详细说明。 AI共同将其系统视为开源社区进一步实验和改进的基础。
这种开放性与其他大型AI公司的封闭方法形成鲜明对比,并反映了对开源AI的AIS更广泛的参与度,该公司在以前的项目中也表达了更广泛的参与,例如最近在O3-Mini级别上发布了源开放的编码模型,但与封闭竞争相比,参数少于较少的参数。
AI研究景观的意义
AI共同发表开放深入研究标志着先进AI研究工具民主化的重要一步。通过强大的AI模型,结构化的多级Web研究和多模式输出格式的组合,该系统为专有解决方案提供了有希望的替代方案。
开放式方法使开发人员和研究人员能够适应,扩展和改善系统满足他们的需求。从长远来看,这可能会导致更具创新性和多样化的应用程序,而封闭的系统可能会导致更多的应用。
尽管仍然存在挑战,尤其是在幻觉,偏见和局部性方面,AIS开放深入研究表明,强大的AI研究工具不必限于专有平台。该倡议不仅促进了对先进的AI技术的开放访问,而且还有助于透明度和可追溯性对AI支持的研究结果的信任因素。
适合:
您的AI转换,AI集成和AI平台行业专家
☑️我们的业务语言是英语或德语
☑️ 新:用您的国家语言进行通信!
我很乐意作为个人顾问为您和我的团队提供服务。
您可以通过填写此处的联系表,或者直接致电+49 89 89 674 804 (慕尼黑)。我的电子邮件地址是: wolfenstein ∂ xpert.digital
我很期待我们的联合项目。