דגם Kimi K2 של בינה מלאכותית מבית Moonshot AI: ספינת הדגל החדשה בקוד פתוח מסין - אבן דרך נוספת עבור מערכות בינה מלאכותית פתוחות

Konrad Wolfenstein

לפני 12 חודשים

מודל הבינה המלאכותית Kimi K2: ספינת הדגל החדשה בקוד פתוח מסין - אבן דרך נוספת עבור מערכות בינה מלאכותית פתוחות - תמונה: Xpert.Digital

מודל טריליון הפרמטרים קימי K2 סולל את הדרך לפיתוח בינה מלאכותית ריבונית באירופה

עוד מהפכת קוד פתוח: Kimi K2 מביאה בינה מלאכותית ברמה עולמית למרכזי נתונים באירופה

Kimi K2 לוקחת את המערכת האקולוגית הפתוחה של בינה מלאכותית לרמה חדשה. מודל שילוב המומחים שלה, עם טריליון פרמטרים, מספק תוצאות ריאליסטיות בתכנות, מתמטיקה ומדדי ביצועים של סוכנים, ברמה של חברות קנייניות - בחלק קטן מהעלות ועם משקלים גלויים במלואם. זה פותח הזדמנות למפתחים וחברות בגרמניה לארח באופן עצמאי שירותי בינה מלאכותית בעלי ביצועים גבוהים, לשלב אותם בתהליכים קיימים ולפתח מוצרים חדשים.

קשור לזה:

בינה מלאכותית בקוד פתוח מסין – כיצד DeepSeek זורקת את עולם הטכנולוגיה לכאוס – פחות כרטיסי מסך, יותר כוח בינה מלאכותית

למה קימי K2 הוא יותר מסתם דגם הבינה המלאכותית הגדול הבא

בעוד שמעבדות מערביות כמו OpenAI ו-Anthropic מסתירות את המודלים הטובים ביותר שלהן מאחורי ממשקי API בתשלום, Moonshot AI נוקטת בגישה שונה: כל המשקלים זמינים לציבור תחת רישיון MIT שונה. זה לא רק מאפשר שחזור מדעי, אלא גם מאפשר לעסקים קטנים ובינוניים לבנות אשכולות הסקה משלהם או להשתמש ב-Kimi K2 בתרחישי קצה. ההשקה חופפת לתקופה שבה סין מבססת את עצמה כמובילת תנועת LLM בקוד פתוח; DeepSeek V3 נחשבה לנקודת ייחוס עד יוני, וכעת Kimi K2 מעלה את הרף שוב.

ארכיטקטורה ושיטות אימון

תמהיל מומחים ברמה שיא

Kimi K2 בנוי על מערכת מומחים חדשנית עם 384 מומחים, כאשר רק שמונה מומחים ו"מומחה משותף" גלובלי אחד פעילים לכל טוקן. ארכיטקטורה זו מאפשרת למנוע ההסקה לטעון רק 32 מיליארד פרמטרים לזיכרון בו זמנית, ובכך להפחית באופן דרסטי את עומס ה-GPU. בעוד שמודל צפוף של 70 מיליארד פרמטרים הפועל בדיוק מלא כבר דורש שני GPUs H100, Kimi K2 משיג איכות דומה או אפילו טובה יותר תוך כדי שהוא פועל רק שליש מהמשקל על אותם GPUs.

בהשוואה למודלים אחרים, יעילותו של Kimi K2 ניכרת בבירור: עם סך של טריליון פרמטרים, הוא עולה על DeepSeek V3-Base עם 671 מיליארד פרמטרים ונמצא נמוך מהערך המשוער של GPT-4.1 עם כ-1.8 טריליון פרמטרים. יתר על כן, Kimi K2 משתמש רק ב-32 מיליארד פרמטרים לכל טוקן, בהשוואה ל-37 מיליארד עבור DeepSeek V3-Base. מערכת המומחים של Kimi K2 משתמשת ב-384 מומחים, מתוכם שמונה נבחרים, בעוד ש-DeepSeek V3-Base משתמשת ב-240 מומחים, גם הם עם שמונה נבחרים. כל שלושת המודלים תומכים באורך הקשר של 128,000 טוקנים.

התפתחות זו מראה כי Moonshot משחררת מודל ציבורי עם טריליון פרמטרים בפעם הראשונה, תוך שהיא עדיין נשארת מתחת למגבלת 40 מיליארד הפרמטרים לכל אסימון, מה שמייצג התקדמות משמעותית ביעילות של מודלים של שפות גדולות.

MuonClip – ייצוב בקנה מידה חדש

אימון שנאי MoE רבי עוצמה סובל לעיתים קרובות מיומני קשב מתפוצצים. לכן, Moonshot משלבת את מייעל ה-Muon היעיל מבחינת טוקנים עם תהליך שינוי קנה מידה "qk-clip" במורד הזרם, אשר מנרמל את מטריצות השאילתה והמפתח לאחר כל שלב. על פי Moonshot, לא התרחשה אפילו עלייה חדה בהפסדים ב-15.5 טריליון טוקנים לאימון. התוצאה היא עקומת למידה חלקה ביותר ומודל יציב מאז השקתו הראשונית.

מסד נתונים

עם 15.5 טריליון טוקנים, Kimi K2 משיג את נפח הנתונים של מודלים מסוג GPT-4. בנוסף לטקסט וקוד קלאסיים באינטרנט, קריאות כלים מדומות ודיאלוגים של זרימת עבודה שולבו באימון המקדים כדי לבסס את יכולת הסוכן. בניגוד ל-DeepSeek R1, יכולת הסוכן אינה מבוססת בעיקר על פיקוח על שרשרת מחשבה, אלא על תרחישי למידה שבהם המודל היה צריך לתזמר ממשקי API מרובים.

ביצועי מדד בפירוט

תוצאות המבחן מציגות השוואות מפורטות בין שלושה מודלים של בינה מלאכותית בתחומי משימה שונים. בתכנות, Kimi K2-Instr. משיגה שיעור הצלחה של 65.8 אחוזים במבחן SWE-bench Verified, בעוד ש-DeepSeek V3 משיגה ציון של 38.8 אחוזים ו-GPT-4.1 54.6 אחוזים. ב-LiveCodeBench v6, Kimi K2-Instr. מובילה עם 53.7 אחוזים, ואחריה DeepSeek V3 עם 49.2 אחוזים ו-GPT-4.1 עם 44.7 אחוזים. במבחן צימוד הכלים, Tau2 Retail, עם ממוצע של ארבעה ניסיונות, GPT-4.1 משיגה את הביצועים הטובים ביותר עם 74.8 אחוזים, מעט לפני Kimi K2-Instr. עם 70.6 אחוזים ו-DeepSeek V3 עם 69.1 אחוזים. בקטגוריית המתמטיקה MATH-500, עם התאמה מדויקת, Kimi K2-Instr. שולטת. עם 97.4 אחוזים, אחריו הגיע DeepSeek V3 עם 94.0 אחוזים ו-GPT-4.1 עם 92.4 אחוזים. במבחן הידע הכללי של MMLU ללא הגבלת זמן, GPT-4.1 הציגו את הביצועים הטובים ביותר עם 90.4 אחוזים, ואחריו מקרוב Kimi K2-Instr. עם 89.5 אחוזים, בעוד DeepSeek V3 תפס את המקום האחרון עם 81.2 אחוזים.

פירוש התוצאות

בתרחישי קידוד מציאותיים, Kimi K2 עולה בבירור על כל דגמי הקוד הפתוח הקודמים ועובר את GPT-4 .1 במבחן SWE-bench Verified.
מתמטיקה וחשיבה סימבולית כמעט מושלמות; המודל עולה אפילו על מערכות קנייניות בהקשר זה.
מבחינת ידע עולמי טהור, GPT-4.1 עדיין מעט קדימה, אך הפער קטן מאי פעם.

מיומנויות סוכן בחיי היומיום

הרבה סטודנטים למשפטים מסבירים דברים היטב אך לא נוקטים פעולה. קימי K2 אומן באופן עקבי להשלים משימות באופן אוטונומי - כולל קריאות לכלי עבודה, ביצוע קוד וטיפול בקבצים.

דוגמה 1: תכנון נסיעת עסקים

המודל מפרק בקשה ("הזמנת טיסה, מלון ושולחן לשלושה אנשים בברלין") ל-17 קריאות API: לוח שנה, צובר טיסות, API לרכבת, OpenTable, דוא"ל חברה, Google Sheets - ללא הנדסת בקשות ידנית.

דוגמה 2: ניתוח נתונים

קובץ CSV המכיל 50,000 רשומות נתוני שכר מיובא, מנותח סטטיסטית, נוצר גרף והוא נשמר כדף HTML אינטראקטיבי. התהליך כולו מתרחש בצ'אט אחד.

למה זה חשוב?

פרודוקטיביות: תגובת המודל אינה רק טקסט, אלא פעולה ניתנת לביצוע.
עמידות שגיאות: באמצעות אימון RL על זרימות עבודה, Kimi K2 לומד לפרש הודעות שגיאה ולתקן את עצמו.
עלויות: סוכן אוטומטי חוסך במסירות אנושיות ומפחית את עלויות ההקשר, מכיוון שנדרשות פחות נסיעות הלוך ושוב.

רישוי, עלויות והשלכות תפעוליות

רִשָׁיוֹן

המשקלים כפופים לרישיון דמוי MIT. Moonshot דורשת הודעת "Kimi K2" גלויה בממשק המשתמש רק עבור מוצרים עם מעל 100 מיליון משתמשים פעילים חודשיים או יותר מ-20 מיליון דולר בהכנסות חודשיות. זה לא רלוונטי עבור רוב החברות הגרמניות.

תמחור API ואחסון עצמי

מחירי API ואחסון עצמי משתנים באופן משמעותי בין ספקים. בעוד ש-API של Moonshot גובה 0.15 דולר למיליון טוקנים של קלט ו-2.50 דולר למיליון טוקנים של פלט, API של DeepSeek עולה 0.27 דולר לקלט ו-1.10 דולר לפלט. API של GPT-4 יקר משמעותית, ועולה בממוצע 10.00 דולר לקלט ו-30.00 דולר לפלט.

ראויה לציון במיוחד יעילות העלויות שמציעה טכנולוגיית MoE: עלויות הענן הפכו לתחרותיות ביותר. דוגמה מעשית ממחישה זאת: מפתח משלם רק כ-0.005 דולר עבור צ'אט של 2,000 טוקנים עם Kimi K2, בעוד שאותו צ'אט עולה ארבעה דולר עם GPT-4.

פרופיל חומרה לתפעול פנימי

דגם מלא (FP16): לפחות 8 × H100 80 GB או 4 × B200.
קוונטיזציה של 4 סיביות: פועל ביציבות על 2 × H100 או 2 × Apple M3 Ultra 512 GB.
מנועי הסקה: vLLM, SGLang ו-TensorRT-LLM תומכים באופן טבעי ב-Kimi K2.

יישומים מעשיים באירופה

תעשייה 4.0: ניתן לדמות לוחות זמנים אוטומטיים לתחזוקה, אבחון תקלות והזמנות חלקי חילוף כזרימה של סוכנים.
עסקים קטנים ובינוניים (SME): צ'אטבוטים מקומיים עונים על פניות ספקים ולקוחות בזמן אמת מבלי לשלוח נתונים לשרתים בארה"ב.
שירותי בריאות: מרפאות משתמשות ב-Kimi K2 לקידוד מכתבים רפואיים, חישוב מקרי DRG ותיאום תורים - הכל במקום.
מחקר והוראה: אוניברסיטאות מארחות את המודל באשכולות HPC כדי לאפשר לסטודנטים לערוך ניסויים חופשיים עם תואר שני במשפטים (LLMs) חדישים.
רשויות: מוסדות ציבור נהנים ממשקלים של קוד פתוח, שכן תקנות הגנת המידע מקשות על שימוש במודלים קנייניים של ענן.

שיטות עבודה מומלצות לפעולה פרודוקטיבית

מספר שיטות עבודה מומלצות נקבעו להפעלה פרודוקטיבית של מערכות בינה מלאכותית. עבור עוזרי צ'אט, יש להגדיר את הטמפרטורה ל-0.2 עד 0.3 כדי להבטיח תשובות עובדתיות, בעוד שערך ה-p העליון צריך להיות מקסימום 0.8. עבור יצירת קוד, חיוני להגדיר בבירור את הפקודה של המערכת, למשל, עם הפקודה "אתה עוזר פייתון מדויק", וליישם בדיקות אמינות. עבור קריאות כלים, יש לציין בקפדנות את סכמת ה-JSON כך שהמודל יעצב נכון קריאות פונקציה. צינורות RAG פועלים בצורה הטובה ביותר עם גודל קבוצה של לא יותר מ-800 טוקנים ודירוג מחדש עם מקודד צולב כגון bge-RERANK-L לפני אחזור. למען האבטחה, חיוני לבצע פקודות יוצאות בארגז חול, למשל, במכונת וירטואלית Firecracker, כדי למזער את סיכוני ההזרקה.

קשור לזה:

כלכלת הבינה המלאכותית ככוח כלכלי: ניתוח של הטרנספורמציה הגלובלית, תחזיות וסדרי עדיפויות גיאופוליטיים

אתגרים ומגבלות

טביעת רגל של הזיכרון

למרות שרק 32 פרמטרים של B פעילים, הנתב חייב לשמור על כל משקולות המומחים. לכן, הסקת מסקנות טהורה של המעבד אינה מציאותית.

תלות בכלי

כלים שמוגדרים בצורה שגויה מובילים ללולאות אינסופיות; טיפול שגיאות חזק הוא חיוני.

הזיות

עם ממשקי API לא ידועים לחלוטין, המודל יכול להמציא פונקציות פנטום. נדרש אימות קפדני.

סעיף רישיון

עם גידול חזק של משתמשים, דרישת המיתוג עשויה להפוך לנושא דיון.

אתיקה ובקרות יצוא

פתיחות זו גם מקלה על יישומים שעלולים להיות פוגעניים; חברות נושאות באחריות על מערכות הסינון.

קוד פתוח כמנוע חדשנות

המהלך של Moonshot AI מדגים שמודלים פתוחים לא רק מפגרים אחרי חלופות קנייניות, אלא שכבר שולטים בתחומים מסוימים. בסין, מתפתחת מערכת אקולוגית של אוניברסיטאות, סטארט-אפים וספקי ענן, המאיצה את הפיתוח באמצעות מחקר שיתופי ותמחור תחרותי.

זה מציע לאירופה יתרון כפול:

גישה טכנולוגית ללא נעילת ספק ותחת ריבונות נתונים אירופאית.
לחץ עלויות על ספקים מסחריים מצביע על כך שניתן לצפות למחירים הוגנים עבור שירותים דומים בטווח הבינוני.

בטווח הארוך, אנו יכולים לצפות לראות את הופעתם של מודלים נוספים של קיום (MoE) בשווי טריליוני דולרים, אולי אפילו רב-מודאליים. אם מונשוט תמשיך במגמה זו, ניתן יהיה לחשוף שיפורים בראייה או בשמע. בנקודה זו, התחרות על "הסוכן הפתוח" הטוב ביותר תהפוך למניע המרכזי של כלכלת הבינה המלאכותית.

לא עוד ממשקי API יקרים של קופסה שחורה: קימי K2 הופך את פיתוח הבינה המלאכותית לדמוקרטיזציה

Kimi K2 מסמן נקודת מפנה: הוא משלב ביצועים שיא, גמישות ומשקלים פתוחים בחבילה אחת. עבור מפתחים, חוקרים וחברות באירופה, משמעות הדבר היא חופש בחירה אמיתי: במקום להסתמך על ממשקי API יקרים של קופסה שחורה, הם יכולים להפעיל, להתאים אישית ולשלב בסיס AI בעל ביצועים גבוהים ובמחיר סביר במוצרים שלהם. אלו שיצברו ניסיון מוקדם עם זרימות עבודה מבוססות סוכנים ותשתיות MoE ייצרו יתרון תחרותי בר-קיימא בשוק האירופי.

קשור לזה:

שותף השיווק והפיתוח העסקי הגלובלי שלך

☑️ שפת העסקים שלנו היא אנגלית או גרמנית

☑️ חדש: התכתבות בשפת האם שלך!

Konrad Wolfenstein

אני והצוות שלי שמחים לעמוד לרשותכם כיועצים האישיים שלכם.

ניתן ליצור איתי קשר על ידי מילוי טופס יצירת הקשר כאן wolfenstein@xpert.digital:או פשוט להתקשר אליי למספר 49 7348 4088 965+. כתובת הדוא"ל שלי היא

אני מצפה בקוצר רוח לפרויקט המשותף שלנו.

דגם Kimi K2 של בינה מלאכותית מבית Moonshot AI: ספינת הדגל החדשה בקוד פתוח מסין - אבן דרך נוספת עבור מערכות בינה מלאכותית פתוחות

מודל טריליון הפרמטרים קימי K2 סולל את הדרך לפיתוח בינה מלאכותית ריבונית באירופה

עוד מהפכת קוד פתוח: Kimi K2 מביאה בינה מלאכותית ברמה עולמית למרכזי נתונים באירופה