Выбор голоса 📢


Альтернатива открытому исходному коду для ИИ: Together AI выпускает проект с открытым исходным кодом «Open Deep Research» для детального веб-исследования

Опубликовано: 19 апреля 2025 г. / Обновлено: 19 апреля 2025 г. – Автор: Konrad Wolfenstein

Альтернатива открытому исходному коду для ИИ: Together AI выпускает программное обеспечение с открытым исходным кодом

Альтернатива открытому исходному коду для ИИ: Together AI выпускает открытый исходный код «Open Deep Research» для детального веб-исследования – Изображение: Xpert.Digital

Структурированный, с открытым исходным кодом, мощный: Together AI выводит глубокие исследования на новый уровень

Together AI представляет «Open Deep Research»: альтернативу с открытым исходным кодом платформе Deep Research от OpenAI

16 апреля 2025 года компания Together AI выпустила «Open Deep Research» — систему с открытым исходным кодом для структурированного веб-исследования, разработанную как альтернатива Deep Research от OpenAI. Инструмент может отвечать на сложные вопросы посредством многоэтапного веб-исследования и генерировать исчерпывающие отчеты на основе источников. В отличие от проприетарных решений, Together AI делает весь код, наборы данных и архитектуру системы общедоступными, чтобы стимулировать разработку на основе сообщества.

Подходит для:

Архитектура Open Deep Research

Open Deep Research использует четырехэтапный рабочий процесс, имитирующий процесс исследования, проводимого человеком. Процесс начинается с этапа планирования, на котором модель ИИ генерирует список релевантных поисковых запросов. Затем соответствующий контент собирается из интернета с помощью API поиска Tavily. После этого модель оценки проверяет наличие оставшихся пробелов в знаниях, прежде чем модель написания, наконец, генерирует окончательный отчет.

Уникальный подход Together AI заключается в использовании различных специализированных моделей для решения разных задач в рамках рабочего процесса — так называемый подход «смешанных агентов» (Mixture-of-Agents, MoA). Для реализации используются следующие модели ИИ:

  • Планировщик: Qwen2.5-72B-Instruct-Turbo от Alibaba для развития навыков планирования и логического мышления
  • Краткое описание: Llama-3.3-70B-Instruct-Turbo от Meta для составления кратких обзоров веб-контента
  • JSON Extractor: Llama-3.1-70B-Instruct-Turbo от Meta для извлечения структурированной информации
  • Создатель отчетов: DeepSeek-V3 для агрегирования информации и создания высококачественных исследовательских отчетов

Для обработки длинных текстов модель суммаризации компактно резюмирует содержание и оценивает его релевантность. Это предотвращает переполнение контекстных окон языковых моделей.

Технический стек и интеграция

Модели предоставляются через собственную облачную платформу Together AI. Поиск в интернете и извлечение контента обрабатываются Tavily, при этом преимущество заключается в том, что и поиск, и извлечение контента веб-сайта могут быть выполнены за один вызов API.

Время обработки типичного запроса составляет от 2 до 5 минут, в зависимости от сложности запроса и количества циклов оценки и рефлексии.

Мультимодальные выходные данные и расширенные функции

Open Deep Research не ограничивается выводом текста, а предлагает целый ряд мультимодальных функций:

  • HTML-вывод: Результаты представлены в структурированном HTML-формате, сочетающем текстовые и визуальные элементы
  • Диаграммы: автоматическое создание диаграмм с помощью библиотеки JavaScript Mermaid JS
  • Изображения для обложки: Создание тематически подходящих изображений с использованием моделей Flux от Black Forest Labs
  • Функция подкаста: автоматическое создание компактного аудиоподкаста, summarizing основные моменты отчета, с использованием речевых моделей Sonic от Cartesia

Эти мультимодальные форматы вывода позволяют более полно и привлекательно представить исследованную информацию.

Оценка эффективности и контрольные показатели

Компания Together AI оценила производительность Open Deep Research, используя три популярных бенчмарка:

  • FRAMES: Тест на многоэтапное логическое мышление
  • SimpleQA: Проверка фактических знаний
  •  HotPotQA: Оценка навыков решения многошаговых задач, требующих нескольких этапов рассуждения

Во всех трех тестах Open Deep Research показала значительно лучшие результаты, чем базовые модели без инструментов поиска. По сравнению с аналогичными открытыми системами, такими как Open Deep Research (LDR) от LangChain и Hugging Faces SmolAgents (SearchCodeAgent), система также в целом продемонстрировала более высокое качество ответов.

Особенно важным результатом оценки стало то, что многократные последовательные шаги поиска значительно улучшают качество ответов. При ограничении поиска одним поиском точность заметно снижалась.

Известные ограничения и проблемы

Несмотря на достигнутый прогресс, компания Together AI указывает на ряд ограничений своей системы:

  • Распространение ошибок: Ошибки на ранних этапах рабочего процесса могут распространяться по всему конвейеру и приводить к некорректным конечным результатам
  • Галлюцинации: Галлюцинации могут возникать при интерпретации источников, особенно содержащих неоднозначную или противоречивую информацию
  • Структурные искажения: искажения в обучающих данных или поисковых индексах могут влиять на результаты
  • Актуальность: Темы, требующие высокой актуальности или имеющие низкий охват в интернете, представляют собой особую проблему
  • Проблема кэширования: Хотя внедрение кэширования может снизить затраты, без достаточного времени истечения срока действия оно приводит к доставке устаревшей информации

Эти ограничения типичны для современных инструментов исследования в области искусственного интеллекта и представляют собой важные задачи для дальнейшего совершенствования.

Подходит для:

Сравнение Open Deep Research с другими предложениями

В настоящее время среди поставщиков решений в области ИИ наблюдается тенденция к развитию возможностей углубленного исследования. Первоначально эту концепцию представила компания OpenAI, но теперь аналогичные функции предлагают также Google, Grok и Perplexity. Компания Anthropic недавно также представила функцию исследования на основе агентов для своей модели Клода.

Компания Hugging Face вскоре после выхода OpenAI представила альтернативу с открытым исходным кодом, но не стала развивать её дальше. Perplexity, поисковая система на основе ИИ, предлагает бесплатную альтернативу Deep Research от ChatGPT, позволяя пользователям выполнять до пяти поисковых запросов в рамках «глубокого исследования» в день.

В отличие от закрытых платных систем, таких как Deep Research от OpenAI (которая входит в подписку ChatGPT Pro примерно за 200 долларов в месяц), Together AI предлагает полностью открытую альтернативу с открытым исходным кодом.

Ориентация на сообщество и масштабируемость

Компания Together AI целенаправленно разработала Open Deep Research как открытую платформу, которую сообщество может расширять и улучшать. Архитектура была спроектирована таким образом, чтобы ее было легко расширять — разработчики могут интегрировать свои собственные модели, адаптировать источники данных или добавлять новые форматы выходных данных.

Полный код и документация опубликованы на GitHub, а набор данных для оценки и подробные пояснения — в блоге компании. Together AI рассматривает свою систему как основу для дальнейших экспериментов и улучшений со стороны сообщества разработчиков открытого программного обеспечения.

Эта открытость контрастирует с закрытым подходом других крупных компаний, занимающихся ИИ, и отражает более широкую приверженность Together AI к ИИ с открытым исходным кодом, которая также проявлялась в предыдущих проектах, таких как недавний выпуск модели кодирования с открытым исходным кодом на уровне o3-mini, но со значительно меньшим количеством параметров, чем у ее закрытых конкурентов.

Значение для сферы исследований в области искусственного интеллекта

Выпуск Open Deep Research от Together AI знаменует собой важный шаг в демократизации передовых инструментов для исследований в области искусственного интеллекта. Сочетая мощные модели ИИ, структурированные многоэтапные веб-исследования и мультимодальные форматы вывода, система предлагает многообещающую альтернативу проприетарным решениям.

Открытый подход позволяет разработчикам и исследователям адаптировать, расширять и улучшать систему в соответствии со своими потребностями. В долгосрочной перспективе это может привести к созданию более инновационных и разнообразных приложений, чем это было бы возможно при использовании закрытых систем.

Несмотря на сохраняющиеся проблемы, особенно касающиеся галлюцинаций, предвзятости и своевременности, инициатива Together AI Open Deep Research демонстрирует, что мощные инструменты для исследований в области ИИ не обязательно должны ограничиваться проприетарными платформами. Эта инициатива не только способствует открытому доступу к передовым технологиям ИИ, но и вносит вклад в прозрачность и воспроизводимость — важнейшие факторы для укрепления доверия к исследованиям, основанным на ИИ.

Подходит для:

 

Ваша трансформация искусственного интеллекта, интеграция ИИ и эксперт по индустрии платформ AI

☑️ Наш деловой язык — английский или немецкий.

☑️ НОВИНКА: Переписка на вашем национальном языке!

 

Цифровой пионер — Konrad Wolfenstein

Konrad Wolfenstein

Я был бы рад служить вам и моей команде в качестве личного консультанта.

Вы можете связаться со мной, заполнив контактную форму или просто позвоните мне по телефону +49 89 89 674 804 (Мюнхен) . Мой адрес электронной почты: wolfenstein xpert.digital

Я с нетерпением жду нашего совместного проекта.

 

 

☑️ Поддержка МСП в разработке стратегии, консультировании, планировании и реализации.

☑ Создание или перестройка стратегии ИИ

☑️ Пионерское развитие бизнеса


⭐️ Искусственный интеллект (ИИ) — блог об искусственном интеллекте, точка доступа и центр контента ⭐️ XPaper