DeepSeek-R1-0528: עדכון DeepSeek מחזיר את מודל הבינה המלאכותית הסיני לרמה של מובילי התעשייה המערביים

Konrad Wolfenstein

לפני שנה

DeepSeek-R1-0528: עדכון DeepSeek מחזיר את מודל הבינה המלאכותית הסיני לרמה של מובילי התעשייה המערביים – תמונה: Xpert.Digital

בינה מלאכותית בקוד פתוח בקצה גבול היכולת שלה: DeepSeek מאפילה על OpenAI וגוגל

מ-60 ל-68: DeepSeek מעבירה את הבינה המלאכותית הסינית בחזרה לפסגה

סטארט-אפ הבינה המלאכותית הסיני DeepSeek הגיע לאבן דרך משמעותית עם שחרורו של DeepSeek-R1-0528 ב-28 במאי 2025, ובכך הגדיר מחדש את נוף הבינה המלאכותית העולמית. העדכון למודל החשיבה בקוד פתוח מדגים שיפורים דרמטיים בביצועים, וממקם את DeepSeek לראשונה בשורה אחת עם o3 של OpenAI ו-Google Gemini 2.5 Pro. ראוי לציין במיוחד שביצועי שיא אלה מושגים בחלקיק מהעלות ועם משקלי מודל פתוחים לחלוטין, מה שמעלה שאלות מהותיות לגבי עתיד מערכות בינה מלאכותית קנייניות. פלטפורמת הדירוג העצמאית Artificial Analysis נתנה לדגם החדש 68 נקודות - קפיצה מ-60 ל-68 נקודות התואמת את הפרש הביצועים בין OpenAI o1 ו-o3.

קשור לזה:

DeepSeek ו-Alibaba: פריצת דרך ברמת המומחים? הדחיפה הסינית של בינה מלאכותית בתחום הבריאות

העדכון והשיפורים הטכניים שלו

DeepSeek-R1-0528 מייצג שיפור משמעותי המשיג שיפורי ביצועים משמעותיים באמצעות אופטימיזציות אלגוריתמיות ושימוש מוגבר במשאבי חישוב לאחר האימון, מבלי לשנות את הארכיטקטורה הבסיסית. העדכון מתמקד בעיקר בשיפור יכולות החשיבה, ומאפשר, על פי DeepSeek, "תהליכי חשיבה עמוקים משמעותית". דוגמה מרשימה במיוחד לשיפור זה ניתן לראות במבחן המתמטיקה AIME 2025, שם הדיוק גדל מ-70 אחוז ל-87.5 אחוז. במקביל, מספר האסימונים הממוצע לשאלה גדל מ-12,000 ל-23,000 אסימונים, דבר המצביע על עיבוד אינטנסיבי יותר.

בנוסף לשיפורים בהיגיון, העדכון מציג פונקציונליות חדשה וחשובה, כולל פלט JSON וקריאות לפונקציות, ממשק משתמש אופטימלי והפחתת הזיות. שיפורים אלה הופכים את המודל לפרקטי משמעותית עבור מפתחים ומרחיבים את היקפו באופן משמעותי. הזמינות נותרה ללא שינוי: משתמשי API קיימים יקבלו את העדכון באופן אוטומטי, בעוד שמשקלי המודל ימשיכו להיות זמינים תחת רישיון MIT פתוח ב-Hugging Face.

ביצועי מדד והשוואות ביצועים

תוצאות המבחן עבור DeepSeek-R1-0528 מראות שיפורים מרשימים בכל קטגוריות ההערכה. במשימות מתמטיות, ציון AIME-2024 עלה מ-79.8 ל-91.4 אחוזים, HMMT-2025 מ-41.7 ל-79.4 אחוזים, ו-CNMO-2024 מ-78.8 ל-86.9 אחוזים. תוצאות אלו מציבות את המודל כאחת ממערכות הבינה המלאכותית החזקות ביותר לפתרון בעיות מתמטיות ברחבי העולם.

גם DeepSeek-R1-0528 מראה התקדמות משמעותית במבחני התכנות. LiveCodeBench השתפר מ-63.5 ל-73.3 אחוזים, Aider-Polyglot מ-53.3 ל-71.6 אחוזים, ו-SWE Verified מ-49.2 ל-57.6 אחוזים. דירוג Codeforces טיפס מ-1,530 ל-1,930 נקודות, מה שמציב את המודל בין פותרי הבעיות האלגוריתמיים המובילים. בהשוואה למודלים מתחרים, DeepSeek-R1 משיג 49.2 אחוזים ב-SWE Verified, מה שממקם אותו מעט לפני OpenAI o1-1217 עם 48.9 אחוזים, בעוד שב-Codeforces, עם 96.3 אחוזונים ודירוג Elo של 2,029 נקודות, הוא מתקרב מאוד למודל המוביל של OpenAI.

מבחני ידע כללי ולוגיקה מאשרים את שיפור הביצועים הרחב: GPQA-Diamond עלה מ-71.5 ל-81.0 אחוזים, Humanity's Last Exam מ-8.5 ל-17.7 אחוזים, MMLU-Pro מ-84.0 ל-85.0 אחוזים, ו-MMLU-Redux מ-92.9 ל-93.4 אחוזים. רק SimpleQA של OpenAI הראה ירידה קלה מ-30.1 ל-27.8 אחוזים. שיפורים מקיפים אלה מדגימים ש-DeepSeek-R1-0528 תחרותי לא רק בתחומים מיוחדים אלא בכל ספקטרום המשימות הקוגניטיביות.

ארכיטקטורה טכנית וחידושים

הבסיס הטכני של DeepSeek-R1-0528 מבוסס על ארכיטקטורת MoE (Mixture of Experts) מתוחכמת עם 37 מיליארד פרמטרים פעילים מתוך סך של 671 מיליארד פרמטרים ואורך הקשר של 128,000 טוקנים. המודל מיישם למידת חיזוקים מתקדמת כדי להשיג אימות עצמי, שיקוף רב-שלבי ויכולות חשיבה אנושיות. ארכיטקטורה זו מאפשרת למודל להתמודד עם משימות חשיבה מורכבות באמצעות תהליכי חשיבה איטרטיביים, דבר המבדיל אותו ממודלי שפה מסורתיים.

היבט חדשני במיוחד הוא פיתוח גרסה מזוקקת, DeepSeek-R1-0528-Qwen3-8B, אשר נוצרה על ידי זיקוק תהליך החשיבה של DeepSeek-R1-0528 עבור Qwen3-8B-Base לאחר אימון. גרסה קטנה יותר זו משיגה ביצועים מרשימים עם דרישות משאבים נמוכות משמעותית ופועלת על מעבדים גרפיים עם 8-12 ג'יגה-בייט של VRAM. במבחן AIME 2024, המודל השיג ביצועים חדישים בקרב דגמי קוד פתוח, עם שיפור של 10 אחוזים לעומת Qwen3-8B וביצועים דומים ל-Qwen3-235B-Thinking.

מתודולוגיית הפיתוח מראה ש-DeepSeek מסתמכת יותר ויותר על אימון לאחר המחקר עם למידה באמצעות חיזוקים, מה שהוביל לעלייה של 40% בצריכת הטוקנים במהלך ההערכה - מ-71 ל-99 מיליון טוקנים. דבר זה מצביע על כך שהמודל מייצר תשובות ארוכות ועמוקות יותר מבלי לדרוש שינויים ארכיטקטוניים מהותיים.

מעמד בשוק ודינמיקה תחרותית

DeepSeek-R1-0528 מבסס את עצמו כמתחרה רציני לדגמים הקנייניים המובילים של חברות טכנולוגיה מערביות. על פי Artificial Analysis, הדגם מקבל 68 נקודות, מה שמציב אותו בשורה אחת עם Gemini 2.5 Pro של גוגל ומקדים דגמים כמו Grok 3 mini של xAI, Llama 4 Maverick של Meta ו-Nemotron Ultra של Nvidia. בקטגוריית הקוד, DeepSeek-R1-0528 מגיע לרמה מעט מתחת ל-o4-mini ו-o3 של OpenAI.

לשחרור העדכון הייתה השפעה משמעותית על נוף הבינה המלאכותית העולמית. השחרור הראשוני של DeepSeek-R1 בינואר 2025 כבר הוביל לצניחה במניות הטכנולוגיה מחוץ לסין וערער את ההנחה שהרחבת הבינה המלאכותית דורשת כוח מחשוב והשקעה עצומים. מתחרים מערביים הגיבו במהירות: גוגל הציגה תעריפי גישה מוזלים עבור Gemini, בעוד ש-OpenAI הורידה מחירים והציגה דגם o3 Mini הדורש פחות כוח מחשוב.

מעניין לציין, שניתוחי סגנון טקסט מ-EQBench מראים שסגנון DeepSeek-R1 מושפע יותר מגוגל מאשר מ-OpenAI, דבר המצביע על כך שייתכן שימשו יותר פלטים סינתטיים של Gemini בפיתוחו. תצפית זו מדגישה את ההשפעות המורכבות וההעברות הטכנולוגיות בין מפתחי בינה מלאכותית שונים.

יעילות עלויות וזמינות

יתרון תחרותי מרכזי של DeepSeek-R1-0528 טמון ביעילות העלות יוצאת הדופן שלו. מבנה התמחור שלו נוח משמעותית מזה של OpenAI: אסימוני קלט עולים 0.14 דולר למיליון אסימונים עבור פגיעות במטמון ו-0.55 דולר עבור החמצות במטמון, בעוד שאסימוני פלט עולים 2.19 דולר למיליון אסימונים. לשם השוואה, OpenAI o1 גובה 15 דולר עבור אסימוני קלט ו-60 דולר עבור אסימוני פלט למיליון, מה שהופך את DeepSeek-R1 לזול יותר ב-90-95 אחוז.

Microsoft Azure מציעה גם את DeepSeek-R1 במחירים תחרותיים: הגרסה הגלובלית עולה 0.00135 דולר עבור טוקנים של קלט ו-0.0054 דולר עבור טוקנים של פלט לכל 1,000 טוקנים, בעוד שהגרסה האזורית מציעה מחירים מעט גבוהים יותר. תמחור זה הופך את המודל לאטרקטיבי במיוחד עבור חברות ומפתחים המעוניינים למנף פונקציונליות בינה מלאכותית באיכות גבוהה ללא העלויות הגבוהות של פתרונות קנייניים.

זמינותו כמודל קוד פתוח תחת רישיון MIT מאפשרת גם שימוש מסחרי ושינוי ללא דמי רישיון. מפתחים יכולים להריץ את המודל באופן מקומי או להשתמש בו דרך ממשקי API שונים, מה שמציע גמישות ושליטה על היישום. עבור משתמשים עם משאבים מוגבלים, זמינה גרסה מזוקקת של 8 מיליארד פרמטרים, הפועלת על חומרה צרכנית עם 24 ג'יגה-בייט של זיכרון.

קשור לזה:

השלמת הפער של סין בתחום הבינה המלאכותית: מקרה DeepSeek והשימוש האסטרטגי בנתונים

השלמת הפער של סין בתחום הבינה המלאכותית: מה המשמעות של הצלחת DeepSeek

DeepSeek-R1-0528 מסמן נקודת מפנה בפיתוח הבינה המלאכותית העולמית, ומדגים שחברות סיניות יכולות לפתח מודלים המתחרים במערכות המערביות הטובות ביותר למרות מגבלות היצוא האמריקאיות. העדכון מוכיח ששיפורי ביצועים משמעותיים אפשריים ללא שינויים ארכיטקטוניים מהותיים כאשר אופטימיזציות לאחר אימון ולמידה מחוזקת מיושמות ביעילות. השילוב של ביצועי שיא, עלויות מופחתות באופן דרסטי וזמינות קוד פתוח מאתגר באופן מהותי מודלים עסקיים מבוססים בתעשיית הבינה המלאכותית.

תגובותיהם של המתחרים המערביים להצלחתה של DeepSeek כבר מראות שינויים ראשוניים בשוק: ירידות מחירים מצד OpenAI וגוגל, כמו גם פיתוח מודלים יעילים יותר במשאבים. עם ההשקה הצפויה של DeepSeek-R2, שתוכננה במקור למאי 2025, לחץ תחרותי זה עשוי להתעצם עוד יותר. סיפור ההצלחה של DeepSeek-R1-0528 ממחיש כי חדשנות בבינה מלאכותית אינה בהכרח דורשת השקעות ומשאבי מחשוב עצומים, אלא ניתנת להשגה באמצעות אלגוריתמים חכמים ושיטות פיתוח יעילות.

קשור לזה:

מומחה התעשייה שלך לטרנספורמציה של בינה מלאכותית, שילוב בינה מלאכותית ופלטפורמות בינה מלאכותית

☑️ שפת העסקים שלנו היא אנגלית או גרמנית

☑️ חדש: התכתבות בשפת האם שלך!

Konrad Wolfenstein

אני והצוות שלי שמחים לעמוד לרשותכם כיועצים האישיים שלכם.

ניתן ליצור איתי קשר על ידי מילוי טופס יצירת הקשר כאן פשוט להתקשר אליי למספר 49 7348 4088 965+. כתובת הדוא"ל שלי היא wolfenstein@xpert.digital:או

אני מצפה בקוצר רוח לפרויקט המשותף שלנו.

DeepSeek-R1-0528: עדכון DeepSeek מחזיר את מודל הבינה המלאכותית הסיני לרמה של מובילי התעשייה המערביים

בינה מלאכותית בקוד פתוח בקצה גבול היכולת שלה: DeepSeek מאפילה על OpenAI וגוגל