语言选择 📢

Ki开源替代方案：AI一起发布了源开放的“开放深度研究”，以详细编织研究

发布日期：2025年4月19日 / 更新日期：2025年4月19日 – 作者：Konrad Wolfenstein

AI开源替代方案：Together AI发布开源“Open Deep Research”，用于进行详细的网络研究——图片来源：Xpert.Digital

结构化、开源、功能强大：Together AI 将深度研究提升到一个新的水平

Together AI推出“Open Deep Research”：OpenAI Deep Research的开源替代方案

2025年4月16日，Together AI发布了“Open Deep Research”——一个用于结构化网络研究的开源系统，旨在替代OpenAI的Deep Research。该工具能够通过多阶段网络研究回答复杂问题，并生成基于完整来源的综合报告。与专有解决方案不同，Together AI将完整的代码、数据集和系统架构公开，以鼓励社区参与开发。.

适合：

OpenAI深入研究：对于用户，建议采用混合方法：AI深入研究作为初始筛选工具

Open Deep Research 的架构

Open Deep Research 采用模拟人类研究过程的四阶段工作流程。该流程始于规划步骤，在此步骤中，人工智能模型会生成一系列相关的搜索查询。接下来，系统会使用 Tavily 搜索 API 从网络收集相应的内容。之后，评估模型会检查是否存在任何剩余的知识缺口，最后由写作模型生成最终报告。.

Together AI 的独特之处在于它针对工作流程中的不同任务使用了各种专门的模型——即所谓的“混合智能体”（MoA）方法。以下 AI 模型用于实现：

规划工具：阿里巴巴的 Qwen2.5-72B-Instruct-Turbo，用于提升规划和推理能力
摘要：Llama-3.3-70B-Instruct-Turbo（由 Meta 开发）用于总结长篇网页内容
JSON 提取器：来自 Meta 的 Llama-3.1-70B-Instruct-Turbo，用于结构化信息提取
报告创建工具：DeepSeek-V3，用于聚合信息并创建高质量的研究报告

为了处理较长的文本，摘要模型会对内容进行精炼概括并评估其相关性。这可以防止语言模型的上下文窗口溢出。.

技术栈和集成

这些模型通过 Together AI 的专有云平台提供。网页搜索和内容检索由 Tavily 处理，其独特优势在于，搜索和网站内容检索可以通过一次 API 调用完成。.

处理一个典型请求的时间在 2 到 5 分钟之间，具体取决于请求的复杂程度以及评估和反射循环的次数。.

多模态输出和扩展功能

Open Deep Research 不仅限于文本输出，还提供一系列多模态功能：

HTML 输出：结果以结构化的 HTML 格式呈现，该格式结合了文本和视觉元素。
图表：通过 Mermaid JS JavaScript 库自动创建图表
封面图片：使用 Black Forest Labs 的 Flux 模型生成与主题相符的图片。
播客功能：使用 Cartesia 的 Sonic 语音模型自动创建总结报告要点的精简音频播客。

这些多模态输出格式能够更全面、更吸引人地呈现研究信息。.

绩效评估和基准

Together AI 使用三个常用的基准测试对 Open Deep Research 的性能进行了评估：

框架：多阶段逻辑推理测试
SimpleQA：事实性知识测试
HotPotQA：评估需要多步骤推理的多跳问题

在所有三项基准测试中，Open Deep Research 的表现均显著优于不带搜索工具的基础模型。与 LangChain 的 Open Deep Research (LDR) 和 Hugging Faces SmolAgents (SearchCodeAgent) 等类似的开放系统相比，该系统通常也能获得更高的响应质量。.

评估中一项尤为重要的发现是，多次连续搜索能够显著提高答案质量。而仅进行一次搜索时，准确率则明显下降。.

已知的局限性和挑战

尽管取得了进展，但Together AI也指出其系统存在一些局限性：

错误传播：工作流程早期步骤中的错误可能会传播到整个流程，并导致最终结果出现错误。
幻觉：解读信息来源时可能会出现幻觉，尤其是当信息含糊不清或相互矛盾时。
结构性偏差：训练数据或搜索索引中的偏差会影响结果。
时效性：对时效性要求高或网络覆盖率低的议题提出了特殊的挑战。
缓存问题：虽然实施缓存可以降低成本，但如果没有足够的过期时间，就会导致提供过时的信息。

这些局限性是当前人工智能研究工具的典型特征，也是未来改进面临的重要挑战。.

适合：

Gemini Deep Research 2.0 – Google AI 模型升级 – Gemini 2.0 Flash、Flash Thinking 和 Pro（实验版）相关信息

Open Deep Research 与其他产品相比

深度研究能力的开发目前是人工智能供应商的一大趋势。OpenAI 最初提出了这一概念，但谷歌、Grok 和 Perplexity 现在也提供了类似的功能。Anthropic 最近也为其 Claude 模型引入了基于代理的研究功能。.

Hugging Face 在 OpenAI 发布后不久就推出了开源替代方案，但并未进一步开发。人工智能搜索引擎 Perplexity 提供了一个免费的替代方案，可以替代 ChatGPT 的深度研究功能，允许用户每天进行最多五次“深度研究”搜索。.

与 OpenAI 的 Deep Research（每月约 200 美元的 ChatGPT Pro 订阅的一部分）等封闭的付费系统不同，Together AI 提供了一个完全开放和开源的替代方案。.

社区关注度和可扩展性

Together AI 特意将 Open Deep Research 设计成一个开放平台，以便社区可以对其进行扩展和改进。其架构旨在易于扩展——开发者可以集成自己的模型、调整数据源或添加新的输出格式。.

完整的代码和文档已发布在 GitHub 上，评估数据集和详细说明则发布在公司博客上。Together AI 将其系统视为开源社区进一步实验和改进的基础。.

这种开放性与其他大型人工智能公司的封闭式方法形成鲜明对比，反映了 Together AI 对开源人工智能的更广泛承诺，这种承诺也体现在之前的项目中，例如最近发布的 o3-mini 级别的开源代码模型，但其参数比封闭式竞争对手少得多。.

对人工智能研究领域的重要意义

Together AI发布的Open Deep Research标志着先进人工智能研究工具民主化进程中的重要一步。该系统结合了强大的AI模型、结构化的多阶段网络研究以及多模态输出格式，为专有解决方案提供了一种极具前景的替代方案。.

开放式架构允许开发者和研究人员根据自身需求调整、扩展和改进系统。从长远来看，这有望催生出比封闭系统更具创新性和多样性的应用。.

尽管仍存在挑战，尤其是在幻觉、偏见和时效性方面，但Together AI的开放深度研究项目表明，强大的AI研究工具并非必须局限于专有平台。该项目不仅促进了先进AI技术的开放获取，还有助于提高透明度和可重复性——这些都是建立人们对AI驱动研究信任的关键因素。.

适合：

您的AI转换，AI集成和AI平台行业专家

☑️我们的业务语言是英语或德语

☑️ 新：用您的国家语言进行通信！

Konrad Wolfenstein

我很乐意作为个人顾问为您和我的团队提供服务。

您可以通过填写此处的联系表，或者直接致电+49 89 89 674 804 （慕尼黑）。我的电子邮件地址是： wolfenstein ∂ xpert.digital