Selección de voz 📢


Alternativa de código abierto de KI: Junta AI publica la "investigación profunda abierta" de origen para la investigación detallada de tejido

Publicado el 19 de abril de 2025 / Actualización de: 19 de abril de 2025 - Autor: Konrad Wolfenstein

Alternativa de código abierto de KI: juntos AI publica la fuente

Alternativa de código abierto de KI: Juntos AI publica la "investigación profunda abierta" de origen para la investigación web detallada: xpert.digital

Estructurado, fuente, poderoso: juntos AI trae una investigación profunda a un nuevo nivel

Juntos AI introduce "Investigación abierta de profundidad": una alternativa de código abierto a la investigación profunda de OpenAis

El 16 de abril de 2025, JUNSA AI lanzó "Investigación Open Deep Deep", un sistema de origen para la investigación web estructurada, que fue diseñada como una alternativa a la investigación profunda de OpenAis. La herramienta puede responder preguntas complejas a través de la investigación web de varios etapas y crear informes integrales basados ​​en la fuente. A diferencia de las soluciones propietarias, JUNSA AI proporciona públicamente el código completo, los registros de datos y la arquitectura del sistema para promover un mayor desarrollo basado en la comunidad.

Adecuado para:

La arquitectura de la investigación abierta

Open Deep Research funciona con un flujo de trabajo de cuatro etapas que imita el proceso de investigación humana. El proceso comienza con un paso de planificación en el que un modelo de IA crea una lista de consultas de búsqueda relevantes. El contenido apropiado de la web se recopila a través de la API de búsqueda de Tavily. Luego, un modelo de evaluación verifica si hay huecos de conocimiento antes de que un modelo de escritura finalmente cree el informe final.

El enfoque especial de la IA juntos radica en el uso de diferentes modelos especializados para diferentes tareas en el enfoque de flujo de trabajo, un llamado enfoque de "mezcla de agente" (MOA). Los siguientes modelos de IA se utilizan para la implementación:

  • Planificador: Qwen2.5-72b instruye a Turbo de Alibaba para habilidades de planificación y razonamiento
  • Resumen: Llama 3.3-70B instruye a Turbo de Meta para resumir el contenido web largo
  • JSON Extractor: Llama 3.1-70B instruye turbo de meta para extracción de información estructurada
  • Fabricante de informes: Deepseek-v3 para la agregación de información y creación de informes de investigación de alta calidad

Para poder lidiar con textos más largos, el modelo de resumen resume el contenido de manera compacta y evalúa su relevancia. Esto evita que las ventanas de contexto de los modelos de voz se desborden.

Pila técnica e integración

Como base técnica, los modelos se proporcionan a través de su propia plataforma AI Cloud de AI. La búsqueda en la web y la consulta de contenido se llevan a cabo a través de Tavily, por lo que una ventaja particular es que tanto la búsqueda como la búsqueda del contenido del sitio web se pueden llamar en una sola llamada API.

El tiempo de procesamiento para una solicitud típica es de entre 2 y 5 minutos, dependiendo de la complejidad de la solicitud y el número de bucles de evaluación y reflexión.

Ediciones multimodales y funciones extendidas

Open Deep Research no solo se limita a las ediciones de texto, sino que también ofrece una serie de funciones multimodales:

  • Edición HTML: los resultados se presentan en un formato HTML estructurado, el texto y los elementos visuales se combinan
  • Diagramas: Creación automática de diagramas a través de la sirena de la biblioteca JavaScript JS
  • Imágenes de portada: Generación de imágenes temáticamente adecuadas con la ayuda de los modelos de flujo de Black Forest Labs
  • Función de podcast: creación automática de un podcast de audio compacto que resume los puntos principales del informe utilizando los modelos de lenguaje Sonic de Cartesia

Estos formatos de salida multimodal permiten una presentación más completa y atractiva de la información investigada.

Evaluación de rendimiento y puntos de referencia

Juntos AI evaluaron el rendimiento de la investigación abierta de profundidad utilizando tres puntos de referencia populares:

  • Frames: prueba de conclusiones lógicas de múltiples etapas
  • Simpleqa: examen del conocimiento fáctico
  •  HOTPOTQA: Evaluación de preguntas de múltiples saltos que requieren varios pasos de conclusión

En los tres puntos de referencia, la investigación profunda abierta corta mucho mejor que los modelos básicos sin herramientas de búsqueda. También en comparación con sistemas abiertos similares, como Langchains, abre investigaciones profundas (LDR) y abrazando caras de smolágeno (SearchCodeagent), el sistema generalmente alcanzó una mayor calidad de respuesta.

Un resultado particularmente importante de la evaluación fue la comprensión de que varios pasos de investigación consecutivos mejoran significativamente la calidad de la respuesta. Cuando se limita a una sola ejecución de búsqueda, la precisión cayó notablemente.

Restricciones y desafíos conocidos

A pesar del progreso, Together AI indica varias restricciones en su sistema:

  • Continuación de errores: los errores en los primeros pasos del flujo de trabajo pueden continuar a través de toda la tubería y conducir a resultados finales incorrectos
  • Alucinaciones: pueden ocurrir alucinaciones al interpretar fuentes, especialmente con información ambigua o contradictoria
  • Distortiones estructurales: el sesgo en los datos de capacitación o los índices de búsqueda puede influir en los resultados
  • Topularidad: los temas con necesidades altas de la fecha o una cobertura web baja son un desafío especial
  • Problema de almacenamiento en caché: el almacenamiento en caché implementado puede reducir los costos, pero conduce a la entrega de información anticuada sin un tiempo de vencimiento apropiado

Estas restricciones son típicas de las herramientas de investigación actuales de IA y representan desafíos importantes para futuras mejoras.

Adecuado para:

Investigación profunda abierta en comparación con otras ofertas

El desarrollo de funciones de investigación profunda es actualmente una tendencia entre los proveedores de IA. OpenAai originalmente introdujo el concepto, pero ahora Google, Grok y Perplexity también ofrecen funciones similares. Anthrope recientemente también presentó una función de investigación basada en agentes para su modelo Claude.

Abrazing Face ya había presentado una alternativa de origen poco después de la publicación de Openai, pero no la desarrolló más. Como motor de búsqueda de IA, Perplexity ofrece una alternativa gratuita a la investigación profunda de los chatgpts, mediante la cual los usuarios pueden realizar hasta cinco búsquedas con "investigación profunda" todos los días.

A diferencia de los sistemas cerrados y pagos, como OpenAis Deep Research (la parte de la suscripción ChatGPT Pro es por alrededor de $ 200 por mes), Together AI ofrece una alternativa completamente abierta y abierta de origen.

Enfoque comunitario y capacidad de expansión

Juntos, IA diseñó deliberadamente la investigación abierta como una plataforma abierta que la comunidad puede ampliar y mejorar. La arquitectura se diseñó para que pueda ampliarse fácilmente: los desarrolladores pueden integrar sus propios modelos, ajustar las fuentes de datos o agregar nuevos formatos de salida.

El código completo y la documentación se publicaron en GitHub, junto con un conjunto de datos de evaluación y explicaciones detalladas en el blog de la compañía. Juntos, AI ve su sistema como la base de otros experimentos y mejoras de la comunidad de código abierto.

Esta apertura contrasta con los enfoques cerrados de otras grandes compañías de IA y refleja juntas una participación más amplia para la IA de código abierto, que también se expresó en proyectos anteriores, como la publicación reciente de un modelo de codificación abierta a nivel de O3-Mini, pero con significativamente menos parámetros que la competencia cerrada.

Significado para el panorama de investigación de IA

La publicación de investigaciones abiertas y profundas de AI marca un paso importante en la democratización de herramientas avanzadas de investigación de IA. Con la combinación de potentes modelos de IA, investigación web estructurada de niveles múltiples y formatos de salida multimodal, el sistema ofrece una alternativa prometedora a las soluciones patentadas.

El enfoque abierto permite a los desarrolladores e investigadores adaptarse, expandir y mejorar el sistema a sus necesidades. Esto podría conducir a aplicaciones más innovadoras y diversas a largo plazo de lo que sería posible con los sistemas cerrados.

Aunque todavía existen desafíos, especialmente con respecto a las alucinaciones, el sesgo y la actualidad, juntos las investigaciones abiertas y profundas muestran que las poderosas herramientas de investigación de IA no tienen que limitarse a las plataformas propietarias. La iniciativa no solo promueve el acceso abierto a la tecnología AI avanzada, sino que también contribuye a la transparencia y los factores importantes para la confianza en los resultados de la investigación respaldados por la IA.

Adecuado para:

 

Su transformación de IA, integración de IA y experto en la industria de la plataforma de IA

☑️ Nuestro idioma comercial es inglés o alemán.

☑️ NUEVO: ¡Correspondencia en tu idioma nacional!

 

Pionero digital - Konrad Wolfenstein

Konrad Wolfenstein

Estaré encantado de servirle a usted y a mi equipo como asesor personal.

Puedes ponerte en contacto conmigo rellenando el formulario de contacto o simplemente llámame al +49 89 89 674 804 (Múnich) . Mi dirección de correo electrónico es: wolfenstein xpert.digital

Estoy deseando que llegue nuestro proyecto conjunto.

 

 

☑️ Apoyo a las PYMES en estrategia, consultoría, planificación e implementación.

☑️ Creación o realineación de la estrategia de IA

☑️ Desarrollo empresarial pionero


⭐️ Inteligencia artificial (IA): blog de IA, punto de acceso y centro de contenido ⭐️ XPaper