פורסם בתאריך: 19 באפריל, 2025 / עודכן בתאריך: 19 באפריל, 2025 – מחבר: Konrad Wolfenstein

אלטרנטיבה לקוד פתוח של בינה מלאכותית: יחד עם בינה מלאכותית משחררת את הקוד הפתוח "מחקר עמוק פתוח" למחקר אינטרנט מפורט - תמונה: Xpert.Digital
מובנה, קוד פתוח, עוצמתי: יחד, בינה מלאכותית לוקחת את המחקר המעמיק לרמה חדשה
Together AI מציגה את "Open Deep Research": אלטרנטיבה בקוד פתוח ל-Deep Research של OpenAI
ב-16 באפריל 2025, Together AI הוציאה את "Open Deep Research" - מערכת קוד פתוח למחקר אינטרנט מובנה שתוכננה כחלופה ל-Deep Research של OpenAI. הכלי יכול לענות על שאלות מורכבות באמצעות מחקר אינטרנט רב-שלבי וליצור דוחות מקיפים מבוססי מקור. בניגוד לפתרונות קנייניים, Together AI הופכת את הקוד המלא, מערכי הנתונים וארכיטקטורת המערכת לזמינים לציבור כדי לעודד פיתוח מבוסס קהילה.
מתאים לכך:
הארכיטקטורה של מחקר עמוק פתוח
מחקר עמוק פתוח משתמש בתהליך עבודה בן ארבעה שלבים המחקה את תהליך המחקר האנושי. התהליך מתחיל בשלב תכנון, שבו מודל בינה מלאכותית מייצר רשימה של שאילתות חיפוש רלוונטיות. לאחר מכן, תוכן מתאים נאסף מהאינטרנט באמצעות ממשק ה-API של Tavily לחיפוש. מודל הערכה בודק פערים בידע שנותרו לפני שמודל כתיבה מייצר לבסוף את הדוח הסופי.
הגישה הייחודית של בינה מלאכותית טמונה בשימוש במודלים ייעודיים שונים עבור משימות שונות בתוך זרימת העבודה - גישת "תערובת סוכנים" (MoA). מודלי הבינה המלאכותית הבאים משמשים ליישום:
- מתכנן: Qwen2.5-72B-Instruct-Turbo מבית Alibaba למיומנויות תכנון והיגיון
- סיכום: Llama-3.3-70B-Instruct-Turbo מאת Meta לסיכום תוכן אינטרנט ארוך
- מחלץ JSON: Llama-3.1-70B-Instruct-Turbo מ-Meta לחילוץ מידע מובנה
- יוצר דוחות: DeepSeek-V3 לאיסוף מידע ויצירת דוחות מחקר איכותיים
כדי להתמודד עם טקסטים ארוכים יותר, מודל הסיכום מסכם בצורה קומפקטית את התוכן ומעריך את הרלוונטיות שלו. זה מונע הצפת חלונות ההקשר של מודלי השפה.
מחסנית טכנית ואינטגרציה
המודלים מסופקים דרך פלטפורמת הענן הקניינית של Together AI. חיפוש ואחזור תוכן באינטרנט מטופלים על ידי Tavily, עם יתרון מיוחד שניתן לבצע הן את החיפוש והן את אחזור תוכן האתר בקריאה אחת ל-API.
זמן העיבוד של בקשה אופיינית הוא בין 2 ל-5 דקות, בהתאם למורכבות הבקשה ולמספר לולאות ההערכה וההשתקפות.
יציאות רב-מודאליות ופונקציות מורחבות
מחקר עמוק פתוח אינו מוגבל לפלט טקסט, אלא מציע מגוון פונקציות רב-מודאליות:
- פלט HTML: התוצאות מוצגות בפורמט HTML מובנה המשלב טקסט ואלמנטים חזותיים
- תרשימים: יצירה אוטומטית של תרשימים באמצעות ספריית ה-JavaScript של Mermaid JS
- תמונות כריכה: יצירת תמונות מתאימות מבחינה נושאית באמצעות מודלי Flux ממעבדות היער השחור
- פונקציית פודקאסט: יצירה אוטומטית של פודקאסט אודיו קומפקטי המסכם את עיקרי הדוח, באמצעות מודלי הדיבור הקוליים של Cartesia
פורמטי פלט רב-מודאליים אלה מאפשרים הצגה מקיפה ומושכת יותר של המידע הנחקר.
הערכת ביצועים ומדדי ביצועים
יחד עם זאת, AI העריך את ביצועי Open Deep Research באמצעות שלושה מדדים פופולריים:
- מסגרות: מבחן לחשיבה לוגית רב-שלבית
- SimpleQA: בדיקת ידע עובדתי
- HotPotQA: הערכת שאלות מרובות קפיצות הדורשות מספר שלבי חשיבה
בכל שלושת מדדי הביצועים, Open Deep Research הציגה ביצועים טובים משמעותית בהשוואה למודלים בסיסיים ללא כלי חיפוש. בהשוואה למערכות פתוחות דומות כמו Open Deep Research (LDR) של LangChain ו-Hugging Faces SmolAgents (SearchCodeAgent), המערכת גם השיגה איכות תגובה גבוהה יותר באופן כללי.
ממצא חשוב במיוחד של ההערכה היה שמספר שלבי חיפוש רצופים משפרים משמעותית את איכות התשובות. כאשר החיפוש הוגבל לחיפוש יחיד, הדיוק ירד באופן ניכר.
מגבלות ואתגרים ידועים
למרות ההתקדמות, Together AI מצביעה על מספר מגבלות של המערכת שלה:
- התפשטות שגיאות: שגיאות בשלבים המוקדמים של זרימת העבודה יכולות להתפשט לאורך כל הצינור ולהוביל לתוצאות סופיות שגויות
- הזיות: הזיות יכולות להתרחש בעת פירוש מקורות, במיוחד עם מידע דו משמעי או סותר
- הטיות מבניות: הטיה בנתוני אימון או במדדי חיפוש יכולה להשפיע על התוצאות
- עדכניות: נושאים הדורשים אקטואליה גבוהה או עם סיקור אינטרנטי נמוך מציבים אתגר מיוחד
- בעיית אחסון במטמון: בעוד שמימוש אחסון במטמון יכול להפחית עלויות, ללא זמן תפוגה מספק הוא מוביל לאספקת מידע מיושן
מגבלות אלו אופייניות לכלי מחקר בינה מלאכותית עכשוויים ומייצגות אתגרים חשובים לשיפורים עתידיים.
מתאים לכך:
- Gemini Deep Research 2.0 – שדרוג מודל הבינה המלאכותית של גוגל – מידע על Gemini 2.0 Flash, Flash Thinking ו-Pro (ניסיוני)
מחקר עמוק פתוח בהשוואה להצעות אחרות
פיתוח יכולות מחקר מעמיקות הוא כיום טרנד בקרב ספקי בינה מלאכותית. OpenAI הציגה במקור את הקונספט, אך כעת גם גוגל, Grok ו-Perplexity מציעות תכונות דומות. לאחרונה הציגה Anthropic פונקציית מחקר מבוססת סוכנים עבור מודל קלוד שלה.
Hugging Face כבר הציגה אלטרנטיבה בקוד פתוח זמן קצר לאחר יציאת OpenAI, אך לא פיתחה אותה עוד. Perplexity, מנוע חיפוש מבוסס בינה מלאכותית, מציעה אלטרנטיבה חינמית ל-Deep Research של ChatGPT, המאפשרת למשתמשים לבצע עד חמישה חיפושי "מחקר מעמיק" ביום.
בניגוד למערכות סגורות בתשלום כמו Deep Research של OpenAI (שהיא חלק ממנוי ChatGPT Pro תמורת כ-200 דולר לחודש), Together AI מציעה אלטרנטיבה פתוחה לחלוטין ובקוד פתוח.
מיקוד קהילתי ויכולת הרחבה
בינה מלאכותית (Together AI) עיצבה במכוון את Open Deep Research כפלטפורמה פתוחה שניתן להרחיב ולשפר על ידי הקהילה. הארכיטקטורה תוכננה כך שתהיה ניתנת להרחבה בקלות - מפתחים יכולים לשלב מודלים משלהם, להתאים מקורות נתונים או להוסיף פורמטים חדשים של פלט.
הקוד והתיעוד המלאים פורסמו ב-GitHub, יחד עם מערך נתונים להערכה והסברים מפורטים בבלוג החברה. בינה מלאכותית רואה במערכת שלה בסיס לניסויים ושיפורים נוספים על ידי קהילת הקוד הפתוח.
פתיחות זו עומדת בניגוד לגישות הסגורות של חברות בינה מלאכותית גדולות אחרות ומשקפת את המחויבות הרחבה יותר של Together AI לבינה מלאכותית בקוד פתוח, אשר באה לידי ביטוי גם בפרויקטים קודמים, כגון השחרור האחרון של מודל קידוד בקוד פתוח ברמת o3-mini, אך עם פחות פרמטרים משמעותית בהשוואה למתחרים הסגורים שלה.
משמעות עבור נוף המחקר של בינה מלאכותית
השקת Open Deep Research מבית Together AI מסמנת צעד חשוב בדמוקרטיזציה של כלי מחקר מתקדמים בתחום הבינה המלאכותית. על ידי שילוב של מודלים רבי עוצמה של בינה מלאכותית, מחקר אינטרנט רב-שלבי מובנה ופורמטי פלט רב-מודאליים, המערכת מציעה אלטרנטיבה מבטיחה לפתרונות קנייניים.
הגישה הפתוחה מאפשרת למפתחים ולחוקרים להתאים, להרחיב ולשפר את המערכת לצרכיהם. בטווח הארוך, הדבר עשוי להוביל ליישומים חדשניים ומגוונים יותר מאשר במערכות סגורות.
למרות שנותרו אתגרים, במיוחד בכל הנוגע להזיות, הטיה ועיתוי, תוכנית המחקר הפתוח והעמוק של Together AI מדגימה שכלי מחקר רבי עוצמה בתחום הבינה המלאכותית אינם צריכים להיות מוגבלים לפלטפורמות קנייניות. היוזמה לא רק מקדמת גישה פתוחה לטכנולוגיית בינה מלאכותית מתקדמת, אלא גם תורמת לשקיפות וליכולת שחזור - גורמים מכריעים לבניית אמון במחקר המונע על ידי בינה מלאכותית.
מתאים לכך:
טרנספורמציית AI שלך, שילוב AI ומומחה לתעשיית הפלטפורמה AI
☑️ השפה העסקית שלנו היא אנגלית או גרמנית
☑️ חדש: התכתבויות בשפה הלאומית שלך!
אני שמח להיות זמין לך ולצוות שלי כיועץ אישי.
אתה יכול ליצור איתי קשר על ידי מילוי טופס יצירת הקשר או פשוט להתקשר אליי בטלפון +49 89 674 804 (מינכן) . כתובת הדוא"ל שלי היא: וולפנשטיין ∂ xpert.digital
אני מצפה לפרויקט המשותף שלנו.













