
פוגע AI הגדול של סין: עם וואן 2.2 עליבאבא רוצה לעקוף את המערב – ועושה את כל הקוד הפתוח – תמונה: xpert.digital
זהו Wunner-ki WAN2.2 החדש של עליבאבא: חינם, חזק יותר מהתחרות וזמין לכולם
תגובת הווידיאו של סין לסורה פון Openaai: AI חדש זה מייצר סרטונים באיכות הקולנוע – והוא גם ללא תשלום
חברת הטכנולוגיה הסינית אליבאבא פרסמה גרסה חדשה ומעניינת של מודל הווידיאו של הקוד הפתוח שלה ב- 29 ביולי 2025 עם WAN2.2 ובכך שינתה באופן מהותי את הנוף של הבינה המלאכותית לייצור וידיאו. טכנולוגיה חדשנית זו מייצגת את מודל הווידיאו הראשון של קוד פתוח בעולם שהטמיע ארכיטקטורת תערובת-של-מומחים (MOE) ועוצב הן עבור הפקות קולנוע מקצועיות והן לשימוש בחומרה זמינה מסחרית.
מתאים לכך:
- עליבאבא משקיעה מעל 50 מיליארד דולר ב- AI ומחשוב ענן – אינטליגנציה כללית מלאכותית (AGI) ממלאת תפקיד מרכזי
מהפכה טכנולוגית באמצעות ארכיטקטורת MOE
לראשונה, WAN2.2 מציגה ארכיטקטורה של תערובת-מומחים במודלים מסירות וידאו, המהווה פריצת דרך טכנולוגית משמעותית. ארכיטקטורה חדשנית זו עובדת עם מערכת מומחים כפולים המחלקת את תהליך הווידיאו לשני שלבים מיוחדים. המומחה הראשון מתמקד בשלבים המוקדמים של דיכוי הרעש וקובע את הפריסה הבסיסית של הסצינה, ואילו המומחה השני משתלט על השלבים המאוחרים יותר ומעדן פרטים ומרקמים.
במערכת יש בסך הכל 27 מיליארד פרמטרים, אך מפעילה רק 14 מיליארד פרמטרים לכל שלב הסקה, מה שמקטין את מאמץ המחשוב עד 50 אחוז מבלי להשפיע על האיכות. עלייה זו ביעילות מאפשרת לייצר סרטונים באיכות גבוהה, ואילו עלויות המחשוב נשארות קבועות ובו בזמן מורחבת יכולת הדגם הכוללת.
אסתטיקה של סרטים ושליטה קולנועית
מאפיין יוצא מן הכלל של WAN2.2 הוא מערכת הבקרה האסתטית הקולנועית, המאפשרת למשתמשים לבצע שליטה מדויקת על ממדים חזותיים שונים. הדגם הוכשר בנתונים אסתטיים שאוצרים בקפידה המכילים תוויות מפורטות לתאורה, הרכב, ניגודיות, צבע, כיריים מצלמה, גודל תמונה, אורך מוקד ופרמטרים קולנועיים אחרים.
פונקציונליות זו מבוססת על מערכת מהירה בהשראה קולנועית המקסות מידות מפתח כמו תאורה, תאורה, קומפוזיציה וצביעה. כתוצאה מכך, WAN2.2 יכול לפרש וליישם במדויק את הכוונות האסתטיות של המשתמשים במהלך תהליך הייצור, המאפשר יצירת סרטונים עם העדפות קולנועיות הניתנות להתאמה אישית.
נתוני אימונים מורחבים וייצור תנועה מורכב
בהשוואה לקודם WAN2.1, מערך נתוני ההדרכה הורחב משמעותית: 65.6 אחוז יותר נתוני תמונה ו 83.2 אחוז יותר נתוני וידאו. התרחבות נתונים מאסיבית זו משפרת משמעותית את כישורי ההכללה של המודל ומגדילה את המגוון היצירתי בכמה ממדים כמו תנועה, סמנטיקה ואסתטיקה.
המודל מציג שיפורים משמעותיים בייצור תנועות מורכבות, כולל הבעות פנים מלאות חיים, מחוות ידיים דינמיות ותנועות ספורט מורכבות. בנוסף, היא מספקת לייצוגים מציאותיים עם תאימות פיקוד משופרת ועמידה בחוקים פיזיים, מה שמוביל לרצפי וידיאו טבעיים ומשכנעים יותר.
שימוש יעיל בחומרה ונגישות
WAN2.2 מציע שלוש גרסאות מודל שונות המכסות דרישות שונות ותצורות חומרה:
- WAN2.2-T2V-A14B: מודל טקסט לווידיאו עם 27 מיליארד פרמטרים (14 מיליארד פעילים), המייצר סרטונים ברזולוציה של 720p ו- 16fps.
- WAN2.2-I2V-A14B: מודל תמונה לווידיאו עם אותה ארכיטקטורה להמרה של תמונות סטטיות לסרטונים.
- WAN2.2-TI2V-5B: מודל פרמטר קומפקטי בן 5 מיליארד המשלב פונקציות טקסט לווידיאו וגם פונקציות תמונה לווידיאו במסגרת אחידה.
דגם ה- TI2V-5B הקומפקטי הוא פריצת דרך מיוחדת, מכיוון שהוא יכול לייצר 5 שניות 720p סרטונים בפחות מ- 9 דקות ב- GPU צרכני יחיד כמו ה- RTX 4090. מהירות זו הופכת אותו לאחד מהדגמים המהירים ביותר של 720P@24FPS ומאפשר יישומים תעשייתיים והן למחקר אקדמי להפיק תועלת מהטכנולוגיה.
ארכיטקטורת VAE מתקדמת לדחיסה אופטימלית
מודל TI2V 5B מבוסס על ארכיטקטורת VAE תלת-ממדית יעילה ביותר עם יחס דחיסה של 4 × 16 × 16, מה שמגדיל את שיעור דחיסת המידע הכולל ל 64. עם שכבת טלאים נוספת, יחס הדחיסה הכולל של TI2V-5B אפילו מגיע ל -4 × 32 × 32, המבטיח דרישת זיכרון מינימאלית עם מינימום.
טכנולוגיית דחיסה מתקדמת זו מאפשרת למודל לתמוך הן במשימות טקסט לווידיאו והן במשימות תמונה לווידיאו במסגרת אחת אחידה, המכסה הן מחקר אקדמי והן יישומים מעשיים כאחד.
ביצועים במבחן ומיקום השוק
WAN2.2 נבדק כנגד דגמי וידיאו מסחריים מסחריים מסחריים בעזרת סוויטת ההערכה החדשה של WAN-Bench 2.0, כולל סורה, קלינג 2.0 והילאו 02. התוצאות מראות כי WAN2.2 משיג את הביצועים החדישים ברוב הקטגוריות ועולה על מתחרותיה הגבוהות.
בהשוואה בין דירוג ישיר, WAN2.2-T2V-A14B הבטיחה את המקום הראשון בארבעה מתוך ששת הממדים המרכזיים, כולל איכות אסתטית ודינמיקת תנועה. ביצוע זה קובע את WAN2.2 כמוביל בשוק חדש בקוד פתוח בווידיאו-גוגניזציה ברזולוציה גבוהה.
זמינות ושילוב של קוד פתוח
WAN2.2 זמין כתוכנת קוד פתוח לחלוטין תחת רישיון Apache 2.0 וניתן להוריד אותו באמצעות חיבוק פנים, GitHub ו- ModelScope. הדגמים כבר שולבו במסגרות פופולריות כמו Comfyui ומפזרים, המאפשר שימוש חלק בזרימות עבודה קיימות.
חיבוק שטח פנים זמין לשימוש ישיר עבור מודל TI2V 5B, מה שאומר שמשתמשים יכולים לנסות את הטכנולוגיה באופן מיידי מבלי שיצטרכו לבצע התקנות מורכבות. נגישות זו דמוקרטיזציה של הגישה לטכנולוגיית וידיאו -גוגניזציה של המדינה ומקדמת חדשנות בקהילת המפתחים כולה.
פוגעת AI האסטרטגית של סין
הפרסום של WAN2.2 הוא חלק מאסטרטגיית AI עם קוד פתוח סיני יותר שכבר משכה תשומת לב בינלאומית עם דגמים כמו Deepseek. אסטרטגיה זו עוקבת אחר תוכנית הדיגיטציה הסינית הרשמית, המקדמת שיתוף פעולה בקוד פתוח כמשאב לאומי מאז 2018 ומספקת השקעות מדינה מאסיביות בתשתיות AI.
עליבאבא כבר רשם מעל 5.4 מיליון הורדות של דגמי ה- WAN שלו על חיבוק פנים ודגמניות, שמדגיש את הביקוש הבינלאומי החזק לפתרונות AI של קוד פתוח. החברה מתכננת השקעות נוספות של כ -52 מיליארד דולר במחשוב ענן ותשתיות AI כדי לאחד את מעמדה בשוק הצומח במהירות זו.
מתאים לכך:
WAN2.2 מספק פריצת דרך בסרטוני AI: קוד פתוח ברמה המקצועית
WAN2.2 מייצג נקודת מפנה ב- AI VIDEOOGENIASIONIONAL מכיוון שהוא מציע את האלטרנטיבה הראשונה של הקוד הפתוח שיש לשלם מודלים קנייניים שיכולים להתחרות בפתרונות מסחריים. השילוב של איכות קולנועית, שימוש יעיל בחומרה וזמינות של קוד פתוח, מציב את הדגם כחלופה אטרקטיבית עבור יצרני תוכן, יוצרי קולנוע ומפתחים ברחבי העולם.
הפרסום עשוי להעצים את התחרות בתחום ה- AI VideoGoniese ויכול לגרום לחברות אחרות להמשיך באסטרטגיות קוד פתוח דומות. עם היכולת שלה לפעול על חומרת צרכנים ולהעביר תוצאות מקצועיות, ל- WAN2.2 יש פוטנציאל לדמוקרטיזציה של הפקת וידיאו ולפתוח הזדמנויות יצירתיות חדשות.
באמצעות השילוב של טכנולוגיה מתקדמת עם פילוסופיה התפתחותית פתוחה, עליבאבא עם WAN2.2 קובע סטנדרטים חדשים ב- AI VideoGoniesing ומבסס את סין ככוח מוביל בחדשנות AI גלובלית. ההשפעות הרחוקות של התפתחות זו ישנו את האופן בו נוצרים ומופקים סרטונים, בשנים הקרובות.
מתאים לכך:
טרנספורמציית AI שלך, שילוב AI ומומחה לתעשיית הפלטפורמה AI
☑️ השפה העסקית שלנו היא אנגלית או גרמנית
☑️ חדש: התכתבויות בשפה הלאומית שלך!
אני שמח להיות זמין לך ולצוות שלי כיועץ אישי.
אתה יכול ליצור איתי קשר על ידי מילוי טופס יצירת הקשר או פשוט להתקשר אליי בטלפון +49 89 674 804 (מינכן) . כתובת הדוא"ל שלי היא: וולפנשטיין ∂ xpert.digital
אני מצפה לפרויקט המשותף שלנו.