Publicado em: 19 de abril de 2025 / atualização de: 19 de abril de 2025 - Autor: Konrad Wolfenstein
KI Open Source Alternative: Together AI publica a origem “Pesquisa profunda aberta” para pesquisa detalhada da Web: Xpert.Digital
Estruturado, fonte, poderoso: juntos a IA traz uma pesquisa profunda para um novo nível
Juntos
Em 16 de abril de 2025, juntos a IA lançou "Open Deep Research" - um sistema de origem -aberto para pesquisas na web estruturadas, que foi projetada como uma alternativa à pesquisa profunda. A ferramenta pode responder a perguntas complexas por meio de pesquisas na Web multi -estágios e criar relatórios abrangentes e baseados em origem. Em contraste com as soluções proprietárias, juntos a IA fornece publicamente o código completo, os registros de dados e a arquitetura do sistema para promover um desenvolvimento adicional baseado na comunidade.
Adequado para:
- Pesquisa profunda do OpenAI: para usuários, é recomendada uma abordagem híbrida: AI Pesquisa profunda como uma ferramenta de triagem inicial
A arquitetura da pesquisa profunda aberta
A Open Deep Research trabalha com um fluxo de trabalho de quatro estágios que imita o processo de pesquisa humana. O processo começa com uma etapa de planejamento na qual um modelo de IA cria uma lista de consultas de pesquisa relevantes. O conteúdo apropriado da Web é então coletado através da API de pesquisa de Tavily. Um modelo de avaliação verifica se existem lacunas de conhecimento antes de um modelo de redação finalmente cria o relatório final.
A abordagem especial da AI juntos reside no uso de diferentes modelos especializados para diferentes tarefas na abordagem de fluxo de trabalho-uma chamada "Mistura-do Agente" (MOA). Os modelos de IA a seguir são usados para implementação:
- Planejador: QWEN2.5-72B Instrua Turbo do Alibaba para habilidades de planejamento e raciocínio
- Resumo: LLAMA 3.3-70B Instruta Turbo da Meta para resumir o conteúdo da Web longo
- Extrator JSON: LLAMA 3.1-70B Instruct Turbo da Meta para Extração de Informações Estruturadas
- Fabricante de relatórios: Deepseek-V3 para a agregação de informações e criação de relatórios de pesquisa de alta qualidade
Para poder lidar com textos mais longos, o modelo de resumo resume o conteúdo de forma compacta e avalia sua relevância. Isso impede que as janelas de contexto dos modelos de voz transbordem.
Pilha técnica e integração
Como base técnica, os modelos são fornecidos por meio de seus próprios plataformas de nuvem de IA. A pesquisa da Web e a consulta de conteúdo ocorre via Tavily, pelo qual uma vantagem específica é que a pesquisa e a pesquisa do conteúdo do site podem ser chamadas em uma única chamada da API.
O tempo de processamento para uma solicitação típica é entre 2 e 5 minutos, dependendo da complexidade da solicitação e do número de loops de avaliação e reflexão.
Edições multimodais e funções estendidas
A pesquisa profunda aberta não se limita apenas às edições de texto, mas também oferece várias funções multimodais:
- Edição HTML: Os resultados são apresentados em um formato HTML estruturado, o texto e os elementos visuais são combinados
- Diagramas: criação automática de diagramas via Javascript Library sereia js
- Imagens de capa: geração de imagens tematicamente adequadas com a ajuda dos modelos de fluxo de laboratórios da Black Forest Labs
- Função do podcast: criação automática de um podcast de áudio compacto que resume os principais pontos do relatório usando os modelos de linguagem sonora da Cartesia
Esses formatos de saída multimodais permitem uma apresentação mais abrangente e atraente das informações pesquisadas.
Avaliação de desempenho e benchmarks
Juntos, a IA avaliou o desempenho da pesquisa profunda aberta usando três benchmarks populares:
- Frames: teste para conclusões lógicas multi -estágios
- Simpleqa: Exame do conhecimento factual
- Hotpotqa: Avaliação de perguntas multi-hop que requerem várias etapas de conclusão
Nos três benchmarks, a pesquisa profunda aberta cortou muito melhor do que os modelos básicos sem ferramentas de pesquisa. Também comparado a sistemas abertos semelhantes, como Langchains, abrem pesquisa profunda (LDR) e os rostos abraçados Smolagen (SearchCodeagent), o sistema geralmente alcançava maior qualidade de resposta.
Um resultado particularmente importante da avaliação foi a percepção de que várias etapas consecutivas de pesquisa melhoram significativamente a qualidade da resposta. Quando limitado a uma única pesquisa, a precisão caiu notavelmente.
Restrições e desafios conhecidos
Apesar do progresso, juntos a IA indica várias restrições em seu sistema:
- Continuação de erros: erros nas etapas iniciais do fluxo de trabalho podem continuar durante todo o pipeline e levar a resultados finais incorretos
- Alucinações: As alucinações podem ocorrer ao interpretar fontes, especialmente com informações ambíguas ou contraditórias
- Distorções estruturais: viés nos dados de treinamento ou índices de pesquisa podem influenciar os resultados
- Toularidade: tópicos com necessidades elevadas de alto date ou capa baixa da Web são um desafio especial
- Problema de armazenamento em cache: o cache implementado pode reduzir custos, mas leva à entrega de informações desatualizadas sem um tempo de validade apropriado
Essas restrições são típicas das ferramentas atuais de pesquisa de IA e representam desafios importantes para melhorias futuras.
Adequado para:
- Gemini Deep Research 2.0-Google Ki-Modell Upgrade Information Sobre Gemini 2.0 Flash, Flash Thinking and Pro (Experimental)
Pesquisa profunda aberta em comparação com outras ofertas
O desenvolvimento de funções de pesquisa profunda é atualmente uma tendência entre os fornecedores de IA. O OpenAai originalmente apresentou o conceito, mas agora Google, Grok e Perplexity também oferecem funções semelhantes. A Anthropic também apresentou recentemente uma função de pesquisa baseada em agente para seu modelo Claude.
Abraçar o rosto já havia apresentado uma alternativa de origem logo após a publicação do Openai, mas não a desenvolveu ainda mais. Como mecanismo de busca de IA, a Perplexity oferece uma alternativa gratuita para pesquisas profundas do Chatgpts, nas quais os usuários podem realizar até cinco pesquisas com “pesquisa profunda” todos os dias.
Em contraste com sistemas bem pagos, como a OpenAis Deep Research (a parte da assinatura do ChatGPT Pro é de cerca de US $ 200 por mês), juntos a IA oferece uma alternativa completamente aberta e de origem.
Foco da comunidade e expansão
Juntos, a IA projetou deliberadamente uma pesquisa profunda aberta como uma plataforma aberta que pode ser expandida e melhorada pela comunidade. A arquitetura foi projetada para que possa ser facilmente expandida - os desenvolvedores podem integrar seus próprios modelos, ajustar fontes de dados ou adicionar novos formatos de saída.
O código completo e a documentação foram publicados no GitHub, juntamente com um conjunto de dados de avaliação e explicações detalhadas no blog da empresa. Juntos, a IA vê seu sistema como base para outras experiências e melhorias da comunidade de código aberto.
Essa abertura contrasta com as abordagens fechadas de outras grandes empresas de IA e reflete juntos o engajamento mais amplo do AIS para a IA de código aberto, que também foi expresso em projetos anteriores, como a recente publicação de um modelo de codificação de origem no nível da O3-mini, mas com significativamente menos parâmetros que a concorrência fechada.
Significado para o cenário de pesquisa da IA
A publicação da Open Deep Research por AI marca uma etapa importante na democratização de ferramentas avançadas de pesquisa de IA. Com a combinação de modelos poderosos de IA, pesquisas da Web de vários níveis estruturadas e formatos de saída multimodais, o sistema oferece uma alternativa promissora às soluções proprietárias.
A abordagem aberta permite que desenvolvedores e pesquisadores se adaptem, expandam e melhorem o sistema para suas necessidades. Isso pode levar a aplicações mais inovadoras e diversas a longo prazo do que seria possível com sistemas fechados.
Embora ainda existam desafios, especialmente no que diz respeito às alucinações, preconceitos e topicicidade, juntos pesquisas profundas do AIS mostram que poderosas ferramentas de pesquisa de IA não precisam se limitar a plataformas proprietárias. A iniciativa não apenas promove o acesso aberto à tecnologia avançada de IA, mas também contribui para fatores importantes para a transparência e rastreabilidade para a confiança nos resultados da pesquisa apoiada pela IA.
Adequado para:
Sua transformação de IA, integração de IA e especialista do setor de plataforma de IA
☑️ Nosso idioma comercial é inglês ou alemão
☑️ NOVO: Correspondência em seu idioma nacional!
Ficarei feliz em servir você e minha equipe como consultor pessoal.
Você pode entrar em contato comigo preenchendo o formulário de contato ou simplesmente ligando para +49 89 89 674 804 (Munique) . Meu endereço de e-mail é: wolfenstein ∂ xpert.digital
Estou ansioso pelo nosso projeto conjunto.