Deepseek-R1-0528: עדכון DeepSeek מחזיר את דגם ה- AI הסיני בגובה העיניים עם מנהיגי התעשייה המערבית

פורסם ב: 31 במאי 2025 / עדכון מ: 31 במאי 2025 - מחבר: קונרד וולפנשטיין

Deepseek-R1-0528: עדכון DeepSeek מחזיר את דגם ה- AI הסיני בגובה העיניים עם מנהיגי התעשייה המערבית-דימוי: xpert.digital

קוד פתוח AI בגבול: DeepSeek מבצע את Openai ו- Google בצל

בין 60 ל 68: DeepSeek עטוף את ה- AI הסיני בחזרה לפסגה

עם פרסום Deepseek-R1-0528 ב- 28 במאי 2025, השיגה ה- Statup Startup הסיני Deepseek אבן דרך חשובה שהגדירה מחדש את נוף ה- AI העולמי. העדכון של מודל קריאת הקוד הפתוח מראה את הביצועים הדרמטיים עולה ולראשונה עמדות עמדות DeepSeek באותה רמה כמו OpenAIS O3 ו- Google Gemini 2.5 Pro. ראוי לציין במיוחד כי הביצועים המובילים הללו מושגים עם חלק מהעלויות ועם משקולות מודל פתוחות לחלוטין, מה שמעלה שאלות מהותיות לגבי עתיד מערכות ה- AI הקנייניות. פלטפורמת הדירוג העצמאית ניתוח מלאכותי מסווג את הדגם החדש עם 68 נקודות - קפיצה בין 60 ל 68 נקודות תואמת את הפרש הביצועים בין OpenAAI O1 ל- O3.

מתאים לכך:

Deepseek ו- Alibaba: פריצת דרך ברמה המומחית? ה- AI הסיני דוחף במערכת הבריאות

העדכון והשיפורים הטכניים שלו

Deepseek-R1-0528 מייצג פיתוח משמעותי נוסף, שאינו דורש שינויים בארכיטקטורה הבסיסית, אך משיג עלייה משמעותית באימוני ההכשרה באמצעות אופטימיזציות אלגוריתמיות והגברת השימוש במשאבים אריתמטיים. העדכון מתמקד בעיקר בשיפור כישורי ההנמקה, ולדברי DeepSeek, מאפשר "תהליכי חשיבה עמוקים יותר". דוגמה מרשימה במיוחד לשיפור זה מראה במבחן המתמטיקה של AIME 2025, שם הדיוק עלה מ -70 אחוז ל 87.5 אחוזים. במקביל, מספר האסימונים הממוצע לשאלה גדל מ 12,000 ל- 23,000 אסימונים, מה שמעיד על תהליכי עיבוד אינטנסיביים יותר.

בנוסף לשיפורי ההנמקה, העדכון מציג פונקציות חדשות חשובות, כולל פלט JSON ותצוגות פונקציונליות, ממשק משתמש אופטימלי והזיות מופחתות. חידושים אלה הופכים את המודל למעשי הרבה יותר עבור המפתחים ומרחיבים משמעותית את היקפו. הזמינות נותרה ללא שינוי: משתמשי ה- API הקיימים מקבלים אוטומטית את העדכון, בעוד שמשקולות הדגם עדיין זמינות תחת רישיון המשותף הפתוח על הפנים המחובקות.

השוואות ביצועים והשוואות ביצועים

תוצאות המידה של Deepseek-R1-0528 מראות שיפורים מרשימים בכל קטגוריות ההערכה. במשימות מתמטיות, ערך AIME 2024 עלה מ- 79.8 ל- 91.4 אחוזים, HMMT 2025 מ- 41.7 ל- 79.4 אחוזים ו- CNMO 2024 מ- 78.8 ל- 86.9 אחוזים. תוצאות אלה מציבות את המודל כאחת ממערכות ה- AI החזקות ביותר לפתרונות בעיות מתמטיות ברחבי העולם.

עם מדדי תכנות, Deepseek-R1-0528 מראה גם התקדמות משמעותית. LiveCodebech השתפר מ- 63.5 ל- 73.3 אחוזים, Polyglot Aider מ- 53.3 ל- 71.6 אחוזים ו- SWE אומת מ- 49.2 ל- 57.6 אחוזים. דירוג ה- Codeforces טיפס מ -1,530 ל -1,930 נקודות, מה שמסווג את הדגם בקבוצה העליונה של פתרונות בעיות אלגוריתמיות. בהשוואה לדגמים מתחרים, DeepSeek-R1 מגיע ל -49.2 אחוזים ב- SWE המאומת ולכן הוא ממש לפני OpenAAI O1-1217 עם 48.9 אחוזים, ואילו Codeforces עם 96.3 אחוזים ודירוג ELO של 2029 נקודות קרובים מאוד ל- OpenAIS.

בדיקות ידע וליגיון כללי מאשרים את העלייה הרחבה בביצועים: GPQA-Diamond עלה מ 71.5 ל- 81.0 אחוזים, הבחינה האחרונה של האנושות בין 8.5 ל- 17.7 אחוזים, MMLU-Pro מ 84.0 ל- 85.0 אחוזים ו- MMLU-Redux מ- 92.9 ל- 93.4 אחוזים. רק עם OpenAis SimpleQA הייתה ירידה קלה בין 30.1 ל 27.8 אחוזים. שיפורים מקיפים אלה מתעדים כי DeepSeek-R1-0528 אינו רק תחרותי באזורים מיוחדים, אלא על כל הקשת של המשימות הקוגניטיביות.

ארכיטקטורה וחידושים טכניים

הבסיס הטכני של Deepseek-R1-0528 מבוסס על ארכיטקטורת MOE מפותחת ביותר (תערובת מומחים) עם 37 מיליארד פרמטרים פעילים מתוך 671 מיליארד פרמטרים ואורך הקשר של 128,000 אסימונים. המודל מיישם למידה מתקדמת של פגיעה על מנת להשיג בדיקה עצמית, השתקפות רב -שלבית ויכולת לטעון המותאמת לבני אדם. ארכיטקטורה זו מאפשרת למודל לנהל משימות נימוק מורכבות באמצעות תהליכי חשיבה איטרטיביים, המבדילים בין דגמי קול מסורתיים.

היבט חדשני במיוחד הוא פיתוח גרסה מזוקקת, Deepseek-R1-0528-Qwen3-8B, שנוצר על ידי זיקוק המחשבות של Deepseek-R1-0528 לאימוני הבסיס של Qwen3-8B. גרסה קטנה יותר זו משיגה שירותים מרשימים עם דרישות משאבים נמוכות משמעותית וניתן להפעיל אותה ב- GPUs עם 8-12 GB VRAM. המודל השיג ביצועים חדישים במבחן AIME 2024 תחת מודלים של קוד פתוח עם שיפור של 10 אחוזים בהשוואה ל- QWEN3-8B וביצועים דומים כמו QWEN3-235B-חשיבה.

מתודולוגיית הפיתוח מראה כי DeepSeek מסתמך יותר ויותר על אימונים שלאחר אימונים עם למידת חיזוק, מה שהביא לעלייה של 40 אחוז בצריכת האסימון בהערכה-בין 71 עד 99 מיליון אסימונים. זה מצביע על כך שהמודל מייצר תשובות ארוכות ועמוקות יותר ללא שינויים אדריכליים מהותיים.

עמדת שוק ודינמיקה תחרותית

Deepseek-R1-0528 קובע את עצמו כמתחרה רציני למודלים הקנייניים המובילים של חברות הטכנולוגיה המערביות. על פי ניתוח מלאכותי, המודל עם 68 נקודות נמצא באותה רמה כמו Gemini 2.5 Pro של גוגל ומול דגמים כמו Xais Grok 3 Mini, Metas Llama 4 Maverick ו- Nvidias Nemotron Ultra. בקטגוריית הקוד, DeepSeek-R1-0528 מגיע לרמה ממש מתחת ל- O4-MINI ו- O3.

לפרסום העדכון הייתה השפעה משמעותית על נוף ה- AI העולמי. הפרסום המקורי של Deepseek-R1 בינואר 2025 הוביל לפריצה של מניות טכנולוגיות מחוץ לסין והטיל ספק בהנחה כי קנה המידה של AI נדרש כוח מחשוב והשקעות עצומות. התגובה של המתחרים המערביים הייתה מהירה: גוגל הציגה תעריפי גישה מוזלים עבור מזל תאומים, ואילו Openai הורידה את המחירים והציגה מודל Mini O3 שהיה זקוק לפחות כוח מחשוב.

מעניין לציין כי ניתוחים בסגנון טקסטים מ- EqBench מראים כי DeepSeek-R1 מכוון יותר כלפי גוגל מאשר ב- OpenAAI, מה שמעיד כי ייתכן שתפוקות תאומים סינתטיים יותר שימשו בפיתוח. תצפית זו מדגישה את ההשפעות המורכבות וההעברה הטכנולוגית בין מפתחי AI השונים.

יעילות עלות וזמינות

יתרון תחרותי מכריע של Deepseek-R1-0528 הוא יעילות העלות יוצאת הדופן שלה. מבנה המחירים זול משמעותית מזה של Openai: אסימוני קלט עולים 0.14 דולר למיליון אסימונים עבור להיטי מטמון ו -0.55 דולר בהחמצות של מטמון, ואילו אסימוני תפוקה עולים 2.19 דולר למיליון אסימונים. לשם השוואה, Openai O1 דורש 15 דולר עבור אסימוני קלט ו -60 דולר עבור אסימוני תפוקה למיליון, מה שהופך את DeepSeek-R1 מעל 90-95 אחוז לזול יותר.

Microsoft Azure מציעה גם Deepseek-R1 עם מחירים תחרותיים: הגרסה הגלובלית עולה 0.00135 דולר עבור אסימוני קלט ו- 0.0054 $ עבור אסימוני תפוקה לאלף אסימונים, ואילו הגרסה האזורית מחירים מעט גבוהים יותר. תמחור זה הופך את המודל לאטרקטיבי במיוחד עבור חברות ומפתחים שרוצים להשתמש בפונקציות AI באיכות גבוהה ללא העלויות הגבוהות של פתרונות קנייניים.

הזמינות כמודל קוד פתוח תחת רישיון משותף מאפשרת גם שימוש ושינוי מסחרי ללא דמי רישיון. מפתחים יכולים להפעיל את המודל באופן מקומי או להשתמש בממשקי API שונים, המציעים גמישות ובקרה על היישום. עבור משתמשים עם משאבים מוגבלים, גרסת הפרמטרים המזוקקת של 8 מיליארד זמינה, הפועלת על חומרת צרכנים עם זיכרון של 24 ג'יגה -בייט.

מתאים לכך:

התפיסה של סין בבינה מלאכותית: המקרה DeepSeek ושימוש הנתונים האסטרטגיים

ה- AI של סין מדביק: מה פירוש ההצלחה של DeepSeek

Deepseek-R1-0528 מסמן נקודת מפנה בפיתוח AI העולמי וממחיש כי חברות סיניות יכולות לפתח מודלים למרות מגבלות הייצוא האמריקאיות המתחרות במערכות Best Western. העדכון מוכיח כי ביצועים משמעותיים גדלים ללא שינויים אדריכליים בסיסיים אפשריים אם משתמשים ביעילות אופטימיזציות לאחר אימון ולמידה בהכרה מחדש. השילוב של הביצועים המובילים, הפחיתו באופן דרסטי עלויות ושאלות זמינות של קוד פתוח קבעו מודלים עסקיים בענף AI.

התגובות של המתחרים המערביים להצלחתו של Deepseek כבר מראים את שינויים בשוק הראשון: קיצוץ מחירים ב- OpenAAI ובגוגל, כמו גם פיתוח מודלים של חוברת משאבים. עם הפרסום הצפוי של Deepseek-R2, שתוכנן במקור למאי 2025, לחץ תחרותי זה יכול להתעצם עוד יותר. סיפור ההצלחה של Deepseek-R1-0528 מראה כי חדשנות ב- AI אינה בהכרח דורשת השקעות מאסיביות ומשאבים אריתמטיים, אלא ניתן להשיג באמצעות אלגוריתמים חכמים ושיטות פיתוח יעילות.

מתאים לכך:

טרנספורמציית AI שלך, שילוב AI ומומחה לתעשיית הפלטפורמה AI

☑️ השפה העסקית שלנו היא אנגלית או גרמנית

☑️ חדש: התכתבויות בשפה הלאומית שלך!

קונרד וולפנשטיין

אני שמח להיות זמין לך ולצוות שלי כיועץ אישי.

אתה יכול ליצור איתי קשר על ידי מילוי טופס יצירת הקשר או פשוט להתקשר אליי בטלפון +49 89 674 804 (מינכן) . כתובת הדוא"ל שלי היא: וולפנשטיין ∂ xpert.digital

אני מצפה לפרויקט המשותף שלנו.