
هجوم الصين الكبير في مجال الذكاء الاصطناعي: مع شبكة WAN 2.2، تسعى شركة علي بابا إلى التفوق على الغرب، وتجعل كل شيء مفتوح المصدر. - الصورة: Xpert.Digital
هذه هي تقنية الذكاء الاصطناعي الجديدة الرائعة من علي بابا، Wan2.2: مجانية، وأكثر قوة من المنافسة، ومتاحة للجميع
رد الصين على برنامج سورا من شركة OpenAI من خلال تقنية الفيديو: هذا الذكاء الاصطناعي الجديد يُنتج فيديوهات بجودة سينمائية - وهو مجاني
في 29 يوليو 2025، أطلقت شركة علي بابا الصينية للتكنولوجيا Wan2.2، وهي نسخة جديدة ومبتكرة من نموذجها مفتوح المصدر لإنتاج الفيديو، مُحدثةً بذلك نقلة نوعية في مجال الذكاء الاصطناعي لإنتاج الفيديو. تمثل هذه التقنية المبتكرة أول نموذج مفتوح المصدر في العالم لإنتاج الفيديو يُطبّق بنية "مزيج من الخبراء" (MoE)، وهي مصممة خصيصًا لإنتاج الأفلام الاحترافية والاستخدام على الأجهزة المتاحة تجاريًا.
ذو صلة بهذا الموضوع:
- تستثمر شركة علي بابا أكثر من 50 مليار دولار أمريكي في الذكاء الاصطناعي والحوسبة السحابية - ويلعب الذكاء الاصطناعي العام (AGI) دورًا محوريًا
الثورة التكنولوجية من خلال هندسة وزارة التعليم
يُقدّم Wan2.2 لأول مرة بنيةً تجمع بين خبرات متعددة في نماذج انتشار الفيديو، ما يُمثّل طفرةً تقنيةً هامة. تستخدم هذه البنية المبتكرة نظام خبير مزدوج يُقسّم عملية توليد الفيديو إلى مرحلتين متخصصتين. يركز الخبير الأول على المراحل المبكرة من تقليل التشويش وتحديد التخطيط الأساسي للمشهد، بينما يتولى الخبير الثاني المراحل اللاحقة، مُحسّنًا التفاصيل والنسيج.
يحتوي النظام على 27 مليار مُعامل، لكنه لا يُفعّل سوى 14 مليار مُعامل في كل خطوة استدلال، مما يُقلل الجهد الحسابي بنسبة تصل إلى 50% دون المساس بالجودة. هذه الزيادة في الكفاءة تُتيح إنتاج فيديوهات عالية الجودة مع الحفاظ على التكاليف الحسابية ثابتة، وفي الوقت نفسه توسيع القدرة الإجمالية للنموذج.
جماليات الفيلم والتحكم السينمائي
من أبرز ميزات Wan2.2 نظام التحكم الجمالي السينمائي، الذي يتيح للمستخدمين التحكم الدقيق في مختلف الأبعاد البصرية. وقد تم تدريب النموذج على بيانات جمالية منتقاة بعناية، تتضمن تصنيفات تفصيلية للإضاءة، والتكوين، والتباين، واللون، وزاوية الكاميرا، وحجم الصورة، والبعد البؤري، وغيرها من المعايير السينمائية.
تعتمد هذه الخاصية على نظام توجيه مستوحى من السينما، يصنف الأبعاد الرئيسية كالإضاءة والتكوين واللون. وهذا يُمكّن برنامج Wan2.2 من فهم وتنفيذ رغبات المستخدم الجمالية بدقة أثناء عملية الإنتاج، مما يتيح إنشاء فيديوهات بتفضيلات سينمائية قابلة للتخصيص.
بيانات تدريب متقدمة وتوليد حركة معقدة
بالمقارنة مع الإصدار السابق، Wan2.1، تم توسيع مجموعة بيانات التدريب بشكل ملحوظ: حيث زادت بيانات الصور بنسبة 65.6% وبيانات الفيديو بنسبة 83.2%. هذا التوسع الهائل في البيانات يُحسّن بشكل كبير من قدرات النموذج على التعميم، ويزيد من التنوع الإبداعي عبر أبعاد متعددة مثل الحركة والدلالات والجماليات.
يُظهر النموذج تحسينات ملحوظة في توليد الحركات المعقدة، بما في ذلك تعابير الوجه الواقعية، وإيماءات اليد الديناميكية، والحركات الرياضية الدقيقة. بالإضافة إلى ذلك، يُقدّم النموذج صورًا واقعية مع تحسين استجابة الأوامر والالتزام بالقوانين الفيزيائية، مما ينتج عنه مقاطع فيديو أكثر طبيعية وإقناعًا.
الاستخدام الأمثل للأجهزة وسهولة الوصول إليها
تقدم Wan2.2 ثلاثة نماذج مختلفة تغطي متطلبات وتكوينات أجهزة مختلفة:
- Wan2.2-T2V-A14B: نموذج لتحويل النص إلى فيديو يحتوي على 27 مليار معلمة (14 مليار معلمة نشطة) يقوم بإنشاء مقاطع فيديو بدقة 720 بكسل و16 إطارًا في الثانية.
- Wan2.2-I2V-A14B: نموذج لتحويل الصور إلى فيديو بنفس البنية لتحويل الصور الثابتة إلى مقاطع فيديو.
- Wan2.2-TI2V-5B: نموذج مضغوط يحتوي على 5 مليارات معلمة يجمع بين وظائف تحويل النص إلى فيديو وتحويل الصورة إلى فيديو في إطار عمل موحد.
يمثل طراز TI2V-5B الصغير الحجم طفرة كبيرة، حيث يمكنه توليد مقاطع فيديو بدقة 720p مدتها 5 ثوانٍ في أقل من 9 دقائق على وحدة معالجة رسومات واحدة للمستهلكين مثل RTX 4090. هذه السرعة تجعله أحد أسرع طرازات 720p@24fps المتاحة، مما يسمح للتطبيقات الصناعية والبحوث الأكاديمية بالاستفادة من هذه التقنية.
بنية الإمارات العربية المتحدة المتقدمة لضغط البيانات الأمثل
يعتمد طراز TI2V-5B على بنية VAE ثلاثية الأبعاد عالية الكفاءة بنسبة ضغط تبلغ 4×16×16، مما يزيد من معدل ضغط المعلومات الإجمالي إلى 64. ومع طبقة ترقيع إضافية، تصل نسبة الضغط الإجمالية لـ TI2V-5B إلى 4×32×32، مما يضمن إعادة بناء فيديو عالي الجودة مع الحد الأدنى من متطلبات التخزين.
تتيح تقنية الضغط المتقدمة هذه للنموذج دعم مهام تحويل النص إلى فيديو وتحويل الصور إلى فيديو بشكل أصلي في إطار عمل موحد واحد، يغطي كلاً من البحث الأكاديمي والتطبيقات العملية.
الأداء المعياري والمكانة السوقية
تم اختبار Wan2.2 مقابل نماذج توليد الفيديو الرائدة في مجال الذكاء الاصطناعي، بما في ذلك Sora وKLING 2.0 وHailuo 02، باستخدام مجموعة أدوات التقييم الجديدة Wan-Bench 2.0. وتُظهر النتائج أن Wan2.2 يحقق أداءً متميزًا في معظم الفئات ويتفوق على منافسيه من ذوي المستوى العالي.
في مقارنات التصنيف المباشر، حصد برنامج Wan2.2-T2V-A14B المركز الأول في أربعة من أصل ستة معايير أساسية، بما في ذلك الجوانب الحاسمة للجودة الجمالية وديناميكيات الحركة. وبهذا الإنجاز، يتبوأ Wan2.2 مكانة رائدة السوق الجديدة مفتوحة المصدر في مجال إنتاج الفيديو عالي الدقة.
توافر وتكامل المصادر المفتوحة
يتوفر برنامج Wan2.2 كبرنامج مفتوح المصدر بالكامل بموجب ترخيص Apache 2.0، ويمكن تنزيله من مواقع Hugging Face وGitHub وModelScope. وقد تم دمج النماذج بالفعل في أطر عمل شائعة مثل ComfyUI وDiffusers، مما يتيح استخدامها بسلاسة في سير العمل الحالي.
يتميز طراز TI2V-5B بخاصية "مساحة الوجه المحتضن" الجاهزة للاستخدام، مما يتيح للمستخدمين تجربة هذه التقنية فورًا دون الحاجة إلى عمليات تثبيت معقدة. هذه السهولة في الوصول إلى أحدث تقنيات توليد الفيديو تُسهّل على الجميع الوصول إليها، وتعزز الابتكار في أوساط مجتمع المطورين.
الهجوم الاستراتيجي الصيني بالذكاء الاصطناعي
يُعدّ إطلاق Wan2.2 جزءًا من استراتيجية صينية أوسع نطاقًا للذكاء الاصطناعي مفتوح المصدر، والتي حظيت بالفعل باهتمام دولي بفضل نماذج مثل DeepSeek. وتنسجم هذه الاستراتيجية مع خطة التحول الرقمي الرسمية للصين، التي شجعت التعاون مفتوح المصدر كمورد وطني منذ عام 2018، وتتضمن استثمارًا حكوميًا ضخمًا في البنية التحتية للذكاء الاصطناعي.
سجلت شركة علي بابا بالفعل أكثر من 5.4 مليون عملية تنزيل لنماذجها الرقمية على منصتي Hugging Face وModelScope، مما يؤكد الطلب العالمي القوي على حلول الذكاء الاصطناعي الصينية مفتوحة المصدر. وتخطط الشركة لاستثمار ما يقارب 52 مليار دولار أمريكي في الحوسبة السحابية والبنية التحتية للذكاء الاصطناعي لتعزيز مكانتها في هذا السوق سريع النمو.
ذو صلة بهذا الموضوع:
يُحدث Wan2.2 طفرة في مجال فيديوهات الذكاء الاصطناعي: المصدر المفتوح على مستوى احترافي
يمثل Wan2.2 نقطة تحول في مجال إنتاج الفيديو بالذكاء الاصطناعي، إذ يقدم أول بديل مفتوح المصدر للنماذج المدفوعة والاحتكارية، ما يجعله قادراً على منافسة الحلول التجارية. إن الجمع بين الجودة السينمائية، والاستخدام الأمثل للموارد، والتوافر الكامل كمصدر مفتوح، يجعل هذا النموذج خياراً جذاباً لمنشئي المحتوى، وصناع الأفلام، والمطورين في جميع أنحاء العالم.
من المرجح أن يُؤدي هذا الإصدار إلى زيادة حدة المنافسة في مجال إنتاج الفيديو المدعوم بالذكاء الاصطناعي، وقد يُشجع شركات أخرى على اتباع استراتيجيات مماثلة مفتوحة المصدر. وبفضل قدرته على العمل على أجهزة المستهلكين وتقديم نتائج احترافية، يتمتع Wan2.2 بإمكانية إتاحة إنتاج الفيديو للجميع وفتح آفاق إبداعية جديدة.
من خلال الجمع بين التكنولوجيا المتقدمة وفلسفة التطوير المفتوحة، ترسي شركة علي بابا معايير جديدة في مجال إنتاج الفيديو بالذكاء الاصطناعي عبر منصة Wan2.2، وتؤكد مكانة الصين كقوة رائدة في ابتكارات الذكاء الاصطناعي العالمية. وستُحدث هذه التطورات تغييرات جذرية في طريقة إنشاء وإنتاج الفيديوهات خلال السنوات القادمة.
ذو صلة بهذا الموضوع:
خبيركم في مجال التحول الرقمي بالذكاء الاصطناعي، وتكامل الذكاء الاصطناعي، ومنصات الذكاء الاصطناعي
☑️ لغة أعمالنا هي الإنجليزية أو الألمانية
☑️ جديد: مراسلات بلغتك الأم!
يسعدني أنا وفريقي أن نكون متاحين لكم بصفتنا مستشاركم الشخصي.
يمكنكم التواصل معي عبر ملء نموذج الاتصال هنا wolfenstein@xpert.digital:أو الاتصال بي مباشرةً على الرقم +49 7348 4088 965. عنوان بريدي الإلكتروني هو
أتطلع إلى مشروعنا المشترك.
