מטא משחררת סדרות דגמי בינה מלאכותית חדשות: Llama 4 Scout, Maverick ו-Behemoth

Konrad Wolfenstein

לפני שנה

מטא משחררת סדרות דגמי בינה מלאכותית חדשות: Llama 4 Scout, Maverick ו-Behemoth – תמונה: Xpert.Digital

לאמה 4: הדור החדש של מערכות בינה מלאכותית פתוחות מבית מטא

Llama 4 נחשף: המפתח של מטא לעידן הבא של הבינה המלאכותית

ב-5 באפריל 2025, חשפה מטה את הדור האחרון של דגמי הבינה המלאכותית שלה, Llama 4. דגמים חדשים אלה מייצגים התקדמות משמעותית בפיתוח מערכות בינה מלאכותית פתוחות וכוללים מספר יכולות פורצות דרך המשפרות משמעותית את ביצועיהן ויעילותן. סדרת Llama 4 כוללת מספר דגמים, שניים מהם כבר זמינים לציבור, בעוד שהדגם החזק ביותר עדיין בשלב האימון.

קשור לזה:

מוסברים בפשטות על מודלים של בינה מלאכותית: הבנת יסודות הבינה המלאכותית, מודלים של שפה והיגיון

משפחת הדגמים Llama 4

מטא פיתחה שלושה דגמים שונים בסדרת Llama 4, כל אחד מהם מותאם למקרי שימוש שונים:

לאמה 4 צופה

Llama 4 Scout הוא דגם קומפקטי עם מפרט טכני מרשים:

17 מיליארד פרמטרים פעילים עם 16 מומחים (סה"כ 109 מיליארד פרמטרים)
ניתן להפעיל על כרטיס מסך יחיד מסוג NVIDIA H100 עם כימות Int4
הוא כולל חלון הקשר גדול במיוחד של 10 מיליון טוקנים, מה שהופך אותו לאחד הדגמים הפתוחים הראשונים עם קיבולת זו

לפי Meta, Scout עולה בביצועיו על דגמים אחרים בקטגוריה שלו, כגון Gemini 3, Gemini 2.0 Flash-Lite ו-Mistral 3.1. הוא מתאים במיוחד למשימות כמו סיכום מסמכים ארוכים, התאמה אישית של תוכן על סמך נתוני משתמש והסקת מסקנות מורכבות מכמויות גדולות של ידע.

לאמה 4 מאבריק

ה-Llama 4 Maverick הוא החזק יותר מבין שני הדגמים הזמינים:

17 מיליארד פרמטרים פעילים עם 128 מומחים (400 מיליארד פרמטרים בסך הכל)
גרסת הצ'אט הניסיונית הגיעה ל-ELO 1417 ב-LMArena
לפי מטא, הוא עולה בביצועיו על דגמים כמו GPT-4o ו-Gemini 2.0 Flash במבחנים רבים

מודל זה מתאים במיוחד ליישומי סיוע וצ'אט כלליים כגון כתיבה יצירתית ומציג תוצאות דומות ל-DeepSeek v3 במשימות חשיבה וקידוד, אך עם חצי מהפרמטרים.

לאמה 4 בהמות

Llama 4 Behemoth הוא המודל החזק ביותר של מטא, אך הוא עדיין לא זמין לציבור:

288 מיליארד פרמטרים פעילים עם 16 מומחים (כמעט 2 טריליון פרמטרים בסך הכל)
לפי Meta, הוא עולה בביצועיו על GPT-4.5, Claude Sonnet 3.7 ו-Gemini 2.0 Pro במספר מדדי STEM
משמש כ"מודל מורה" עבור דגמי ה-Lama 4 הקטנים יותר

Behemoth עדיין בשלב האימונים וישוחרר במועד מאוחר יותר.

חידושים טכניים

סדרת הדגמים Llama 4 מציגה מספר חידושים טכניים משמעותיים המשפרים את הביצועים והיעילות שלה:

ארכיטקטורת תערובת מומחים (MoE)

אחד החידושים החשובים ביותר ב-Llama 4 הוא ארכיטקטורת Mixture of Experts (MoE), שבה רק תת-קבוצה של פרמטרי המודל מופעלת עבור כל אסימון:

זה מפחית משמעותית את מאמץ החישוב ואת זמן ההשהיה, תוך שמירה על ביצועים גבוהים
ב-Llama 4 Maverick, כל אסימון מעובד על ידי מומחה משותף ואחד מתוך 128 מומחים מנותבים
ארכיטקטורה זו מאפשרת להגדיל את הפרמטרים הכוללים של המודל מבלי להגדיל את עלויות ההסקה

מולטימודליות מקורית עם היתוך מוקדם

Llama 4 הוא המודל הפתוח הראשון עם מולטימודליות מקורית דרך Early Fusion:

אסימוני טקסט ותמונה משולבים בארכיטקטורת מודל מאוחדת
זה מאפשר אימון מקדים משותף עם כמויות גדולות של נתוני טקסט, תמונה ווידאו
בניגוד ל-Lama 3.2, שהשתמשה בפרמטרים נפרדים עבור טקסט ותמונות, Llama 4 מבין את שני המודלים באופן טבעי עם אותם פרמטרים

חלון הקשר ארוך במיוחד

חלון ההקשר הארוך במיוחד של Llama 4 Scout מרשים במיוחד:

עם 10 מיליון טוקנים, הוא עולה משמעותית על רוב הדגמים הזמינים
זה מאפשר עיבוד של מסמכים ארוכים מאוד, בסיסי קוד שלמים או שיחות נרחבות
ארכיטקטורת iRoPE (שכבות קשב משולבות) מאפשרת זאת

שיטות אימון חדשות

מטא השתמשה במספר שיטות חדשניות לאילוף לאמה 4:

MetaP: טכניקה לכוונון חזק של היפרפרמטרים קריטיים של מודלים
דיוק FP8: שימוש במספרי נקודה צפה של 8 סיביות לאימון יעיל
זיקוק משותף: שימוש ב-Llama 4 Behemoth כמודל למורה עבור מודלים קטנים יותר
למידה מקוונת אסינכרונית לחלוטין עם הגברה: תשתית חדשה ללמידה בקנה מידה גדול

זמינות ואינטגרציה

דגמי Llama 4 זמינים דרך פלטפורמות ושירותים שונים:

ספקי הורדה וענן

ניתן להוריד את המודלים של Scout ו-Maverick ישירות ממטא או דרך Hugging Face
הם זמינים גם דרך פלטפורמות ענן שונות:
- בינה מלאכותית של עובדי Cloudflare
- Azure AI Foundry ו-Azure Databricks
- ורטקס בינה מלאכותית של גוגל קלאוד
- שותפים נוספים יצטרפו בימים הקרובים

שילוב במטא-מוצרים

מטא כבר עדכנה את עוזרי הבינה המלאכותית שלה ל-Llama 4 בפלטפורמות שונות:

וואטסאפ, מסנג'ר ואינסטגרם דירקט ב-40 מדינות שונות
אתר האינטרנט של Meta.AI
עם זאת, התכונות הרב-מודאליות זמינות כרגע רק למשתמשים דוברי אנגלית בארה"ב

קשור לזה:

מטא בינה מלאכותית כבר כאן בגרמניה! וואטסאפ, אינסטגרם ופייסבוק מקבלות בינה מלאכותית - עם הבדלים חשובים מהגרסה האמריקאית

רישוי ומחלוקות

למרות ש-Meta Llama 4 מתואר כ"קוד פתוח", ישנן כמה מגבלות ברישיון שעוררו מחלוקת:

הגבלות רישיון

רישיון הקהילה Llama 4 מכיל מספר הגבלות:

חברות עם יותר מ-700 מיליון משתמשים פעילים בחודש דורשות רישיון מיוחד מ-Meta
משתמשים וחברות מהאיחוד האירופי ככל הנראה אינם מורשים להשתמש או להפיץ את המודלים, ככל הנראה עקב דרישות רגולטוריות
ישנן דרישות בנוגע למתן שמות וייחוס של מודלים נגזרים

ויכוח על "קוד פתוח"

יש ויכוח האם יש לקרוא ל-Lama 4 "קוד פתוח":

יוזמת הקוד הפתוח קבעה בשנת 2023 כי המגבלות ברישיון Llama מוציאות אותו "מקטגוריית 'קוד פתוח'"
מבקרים טוענים שמדובר יותר במודל של "קוד פתוח" או "משקלים פתוחים" מאשר תוכנה בקוד פתוח אמיתי
מגבלות הרישוי עלולות להיות בעייתיות עבור עסקים קטנים שאין להם מחלקות משפטיות משלהם

תוכניות עתידיות

מטה כבר סיפק כמה תובנות לגבי תוכניותיו לעתיד עבור Llama 4 ומעבר לו:

LlamaCon והכרזות נוספות

מטה תארח את כנס LlamaCon הראשון שלה ב-29 באפריל 2025, שם יפורסמו פרטים נוספים על מודלי הבינה המלאכותית ותוכניות המוצר שלה
החברה מתכננת גם לשחרר אפליקציה ייעודית עבור המטא צ'אטבוט שלה ברבעון השני

הרחבת כישורי שפה

מטא עובדת על שיפור כישורי השפה של לאמה 4 כדי לאפשר שיחות טבעיות יותר
המטרה היא לאפשר דיאלוגים חלקים ודו-כיווניים שבהם משתמשים יכולים להפריע למודל הבינה המלאכותית
כריס קוקס, מנהל מוצר ראשי של מטה, תיאר את Llama 4 הקרוב כ"מודל כל-משתמש" המאפשר תרגום שפה מקומית במקום דיבור לטקסט

בינה מלאכותית סוכנתית ויכולות משופרות

מארק צוקרברג הודיע כי ל-Llama 4 יהיו "יכולות סוכנות" שיאפשרו מקרי שימוש חדשים
מטא שואפת לפתח מודלים של בינה מלאכותית שיכולים "לבצע פעולות כלליות, לתקשר באופן טבעי עם בני אדם ולפתור בעיות מאתגרות"
החברה שוקלת להציע מנויים פרימיום לעוזר הבינה המלאכותית שלה למטרות הקשורות לסוכנים כגון הזמנות או הפקת וידאו

מדוע Llama 4 הוא נקודת מפנה בנוף הבינה המלאכותית

השקת Llama 4 מייצגת צעד משמעותי באסטרטגיה של Meta להפוך למובילה בתחום התחרותי ביותר של בינה מלאכותית גנרטיבית. עם הצגת ארכיטקטורת Mixture of Experts, מולטימודליות מקורית וחלון הקשר ארוך ומרשים, Meta מדגימה שמודלים פתוחים יכולים להתחרות במודלים קנייניים של חברות טכנולוגיה גדולות.

למרות המחלוקות סביב הרישוי והשאלה האם Llama 4 באמת צריך להיקרא "קוד פתוח", ההתקדמות הטכנית מייצגת אבן דרך משמעותית. יכולתם של המודלים לעבד טקסט ותמונות כאחד פותחת אפשרויות חדשות עבור מפתחים ועסקים.

עם התוכנית Llama 4 Behemoth שעדיין תלויה ועומדת, והתוכניות שהוכרזו לשיפור יכולות השפה והסוכן, ברור ש-Meta תגביר עוד יותר את השקעותיה בבינה מלאכותית. החודשים הקרובים יראו כיצד מודלים חדשים אלה ישנו את נוף הבינה המלאכותית, והאם הם אכן, כפי שחזה מארק צוקרברג, יעזרו למודלים פתוחים של בינה מלאכותית להפוך לכוח המוביל בבינה מלאכותית.

קשור לזה:

שותף השיווק והפיתוח העסקי הגלובלי שלך

☑️ שפת העסקים שלנו היא אנגלית או גרמנית

☑️ חדש: התכתבות בשפת האם שלך!

Konrad Wolfenstein

אני והצוות שלי שמחים לעמוד לרשותכם כיועצים האישיים שלכם.

ניתן ליצור איתי קשר על ידי מילוי טופס יצירת הקשר כאן wolfenstein@xpert.digital:או פשוט להתקשר אליי למספר 49 7348 4088 965+. כתובת הדוא"ל שלי היא

אני מצפה בקוצר רוח לפרויקט המשותף שלנו.

מטא משחררת סדרות דגמי בינה מלאכותית חדשות: Llama 4 Scout, Maverick ו-Behemoth

לאמה 4: הדור החדש של מערכות בינה מלאכותית פתוחות מבית מטא