تاريخ النشر: ١٦ فبراير ٢٠٢٥ / تاريخ التحديث: ١٦ فبراير ٢٠٢٥ - المؤلف: Konrad Wolfenstein

تحويل النصوص إلى أفلام مع Midjourney – من رائد في مجال إنشاء الصور بالذكاء الاصطناعي إلى فيديوهات الذكاء الاصطناعي المفضلة؟ – الصورة: Xpert.Digital
من صور الذكاء الاصطناعي إلى أفلام الذكاء الاصطناعي: هل هذه هي الخطوة الكبيرة التالية لشركة ميدجورني؟
هل ستصبح شركة Midjourney ملك الفيديو الجديد بتقنية الذكاء الاصطناعي؟ مراجعة لوظيفة تحويل النص إلى فيديو.
أصبحت شركة Midjourney واحدة من أبرز الشركات وأكثرها ابتكارًا في مجال توليد الصور بالذكاء الاصطناعي خلال السنوات الأخيرة. وقد أرست الشركة، من خلال نماذجها السابقة - وصولًا إلى الإصدار الخامس - معايير جديدة للإبداع وسهولة الاستخدام. والآن، أعلنت Midjourney عن انتقالها من توليد الصور فقط إلى توليد الفيديو، واعدةً بثورة حقيقية في طريقة إنشاء المحتوى المرئي. ووفقًا للرئيس التنفيذي ديفيد هولز، تعمل Midjourney حاليًا على تطوير نموذج جديد لتحويل النصوص إلى فيديو، يُعرف باسم "Midjourney Video" في أوساط المطورين. وتشير الإعلانات الداخلية إلى أن هذا النموذج، المبني على نموذج الفيديو السادس، كان من المقرر إطلاقه بالتزامن مع الإصدار السابع في أوائل يناير 2025.
تشتهر شركة Midjourney في مجال الذكاء الاصطناعي بمزيجها سهل الاستخدام من الخوارزميات المتطورة والحرية الإبداعية. ومع هذا التطور الجديد، بات بإمكان الشركة ترسيخ مكانتها كمنصة عالمية للمحتوى المرئي. أصبح المستقبل، الذي يُمكن فيه إنشاء مقاطع فيديو قصيرة متحركة بسهولة تامة عبر إدخال النصوص كما هو الحال مع الصور الثابتة، قاب قوسين أو أدنى. ما هي تبعات هذه الخطوة على المبدعين، والوكالات، والعلامات التجارية، والتجارة الإلكترونية، والعديد من القطاعات الأخرى؟ ما الذي مكّن Midjourney من تنفيذ هذا المشروع الطموح؟ والأهم من ذلك: ما هي الابتكارات التكنولوجية، والموارد المالية، والإمكانات الإبداعية الكامنة وراء هذه القفزة النوعية في عالم الفيديو؟
يهدف هذا النص إلى الإجابة عن هذه الأسئلة وغيرها الكثير. وسيتناول الخلفية الاقتصادية والجوانب التقنية. كما سيوضح الفرص الجديدة التي يمكن أن توفرها أداة الذكاء الاصطناعي هذه لمختلف القطاعات. وأخيرًا، سيستكشف كيفية تطور منصة توليد الصور بالذكاء الاصطناعي إلى منصة توليد الفيديو بالذكاء الاصطناعي، ولماذا يُعد هذا تطورًا منطقيًا ذا آثار بعيدة المدى على مستقبل الإبداع الرقمي.
مناسب ل:
منتصف الرحلة: من رائد في توليد الصور بالذكاء الاصطناعي إلى رائد في توليد الفيديو
مراجعة تاريخية والوضع الراهن
بدأت شركة ميدجورني كشركة متخصصة في توليد الصور باستخدام الذكاء الاصطناعي. وبفضل تكاملها مع منصة ديسكورد، اكتسبت ميدجورني شعبية واسعة بين المبدعين والفنانين الهواة وعشاق التكنولوجيا. وقد ساهمت تعليماتها البسيطة وأسلوبها المرح في جعلها رائدة في تبني نماذج الذكاء الاصطناعي على نطاق واسع لأغراض فنية.
بمرور الوقت، ازدادت الشركة احترافيةً، وواصلت تحسين جودة نماذجها ونطاقها. وطُرحت إصدارات متتالية من الذكاء الاصطناعي: V3 وV4 وV5، التي أرست الأساس لسمعة Midjourney الحالية كمرادف لسهولة الاستخدام والنتائج الفنية الراقية. ومع كل إصدار جديد، تحسّنت جودة الصورة ودقة النتائج وسرعتها. والآن، مع اقتراب الإصدارين V6 وV7، تعد الشركة، ولأول مرة، بإمكانية توليد الصور الثابتة والمتحركة على حد سواء.
"نريد تمكين الناس من عرض رؤاهم بشكل أكثر وضوحًا"، هكذا يمكن وصف فلسفة "ميدجورني". مع الإعلان عن "نموذج ميدجورني لتحويل النصوص إلى فيديوهات"، تخطو الشركة خطوةً كبيرة نحو بُعد جديد: المحتوى المتحرك والديناميكي. لن يعتمد هذا المحتوى على الخبرة الحالية في توليد الصور فحسب، بل سيُتيح أيضًا نطاقًا أوسع من المعايير الإبداعية التي تُمكّن المستخدمين من تحويل أفكارهم إلى مشاهد سلسة ومتحركة.
الرئيس التنفيذي ديفيد هولز وتأثيره
يُعدّ ديفيد هولز، الرئيس التنفيذي لشركة ميدجورني، أحد القوى الدافعة وراء هذه الرؤية الشاملة. وقد أكّد مرارًا وتكرارًا أن نجاحات ميدجورني السابقة ليست سوى غيض من فيض ما يُمكن تحقيقه باستخدام تقنيات الذكاء الاصطناعي الحديثة في المجال الإبداعي والمرئي. ووفقًا لإعلان صدر في نوفمبر 2024، فإنّ تدريب نموذج الفيديو قد بدأ بالفعل على نطاق واسع. ويؤكد هولز أن ميدجورني لا يُمكنها الاكتفاء بما حققته من نجاحات، بل تهدف إلى إحداث ثورة في جميع جوانب الإبداع الرقمي. فالصور لم تكن سوى البداية، أما الآن، فإنّ إنتاج الفيديو سيفتح آفاقًا جديدة.
قدّم هولز لمحةً عن الخطوات المستقبلية، إذ يتطلع إلى تطوير الصوت والتفاعلية على المدى الطويل، وربما حتى عوالم افتراضية كاملة. لكن التركيز حاليًا ينصبّ على الإطلاق الوشيك لنموذج الفيديو V6 في الأسواق، بالتزامن مع إطلاق V7 في بداية العام. ويتماشى هذا مع استراتيجية ميدجورني الراسخة في تطوير نموذج الصورة الخاص بها، والدخول في صيغ إعلامية جديدة واعدة.
الأساسيات التقنية والميزات الخاصة لتحويل النص إلى فيديو
يُعدّ توليد الفيديو بناءً على إدخال نص ("تحويل النص إلى فيديو") أكثر تعقيدًا بكثير من توليد الفيديو بناءً على الصور. فبينما يُنتج كل إدخال للصور لقطة نهائية واحدة، تُضيف مقاطع الفيديو أبعادًا مثل الزمن والحركة والانتقالات والاستمرارية. يمكن تحريك الخلفية الثابتة، ويجب عرض الشخصيات بشكل متسق عبر إطارات متعددة، ويتغير الضوء والظلال أثناء الحركة، وهناك احتمالات غير محدودة لزوايا الكاميرا.
تعتزم شركة ميدجورني الاستفادة من نقاط قوة نموذجها الحالي للصور في توليد الفيديو. هذا النموذج، المعروف باسم V6، يتضمن خوارزميات وشبكات عصبية محددة أثبتت نجاحها في توليد الصور. ووفقًا لميدجورني، سيعتمد توليد الفيديو بشكل أساسي على توسيع تقنية الانتشار المستخدمة في العديد من نماذج الذكاء الاصطناعي المتقدمة للصور. تعمل هذه التقنية على تحويل التشويش الأولي تدريجيًا إلى بنية صورة متماسكة. بالنسبة للفيديو، تتطلب هذه العملية تمديدًا زمنيًا لإنتاج صورة نهائية متماسكة، إطارًا تلو الآخر.
الميزات الجديدة والوظائف الأساسية المتوقعة
بحسب المعلومات المتاحة، من المتوقع أن يحتوي طراز Midjourney Video الجديد على الميزات الرئيسية التالية:
1. إنشاء الفيديو الأساسي
يمكن للمستخدمين إنشاء مقاطع فيديو قصيرة بناءً على أوصاف نصية ("مطالبات"). فعلى سبيل المثال، يمكن لأمر مثل "/imagine -video a future spaceship flying through a neon colored universe" أن يُنشئ سيناريو رسوم متحركة بأسلوب الخيال العلمي. وكما هو الحال في إنشاء الصور، ستتوفر خاصية "-video" لتفعيل وظيفة الفيديو.
2. ضبط مدة الفيديو ودقته
على غرار الخيارات الحالية لدقة الصور المختلفة، يمكن لبرنامج Midjourney Video أن يتيح للمستخدمين تغيير أطوال ودقة مقاطع الفيديو. وهذا من شأنه أن يمكّن المستخدمين من إنشاء مقاطع فيديو عالية الدقة مدتها 5 ثوانٍ، أو مقاطع أطول منخفضة الدقة.
3. الإطارات الرئيسية والتعبئة الديناميكية
تحت عنوان "تغيير المنطقة"، يُقترح توسيع نطاق أسلوب ترميم الصور - أي إعادة تلوين أو استبدال مناطق محددة من الصورة - ليشمل مقاطع الفيديو. وهذا من شأنه أن يسمح بتغيير أو استبدال أجزاء فردية داخل المقطع مع الحفاظ على ثبات بقية الفيديو. ويمكن استخدام الإطارات الرئيسية للتحكم في توقيت حدوث تغييرات محددة، مما يحقق انتقالات سلسة.
4. تحكم إبداعي موسع
استنادًا إلى الأجيال السابقة من برنامج Midjourney، يُفترض أن يوفر البرنامج مجموعة واسعة من الخيارات لتعديل الأسلوب، ولوحة الألوان، وتعقيد الموضوع، والسرعة. وقد يتضمن أيضًا خيارات للمؤثرات الخاصة مثل الحركة البطيئة، والتصوير بتقنية الفاصل الزمني، أو حركات الكاميرا.
5. خبير تحويل الصور إلى فيديو.digital/ai-applications/
إضافةً إلى التوجيه النصي، يمكن لبرنامج Midjourney أن يتيح خيار استخدام الصور الموجودة كمصدر لإنشاء مقاطع متحركة. وهذا من شأنه أن يسمح بانتقال سلس للغاية من تحرير الصور إلى تحرير الفيديو.
كل هذا يوضح أن شركة Midjourney لا تريد فقط إنشاء صور متحركة بسيطة، بل تهدف إلى أداة قوية يمكنها خدمة مختلف الصناعات بشكل شامل.
الخلفية المالية والمكانة السوقية
تتمتع شركة ميدجورني بقوة مالية هائلة. فمع إيرادات سنوية متكررة تبلغ حوالي 200 مليون دولار أمريكي، وقيمة سوقية تقارب 10 مليارات دولار أمريكي، تُعدّ ميدجورني من بين أغلى الشركات في قطاعها. ويتيح لها هذا الدعم المالي الاستثمار في مشاريع بحث وتطوير ضخمة، واتباع استراتيجيات طويلة الأجل دون الاعتماد على الأرباح السريعة.
يمكن تلخيص موقف الشركة بالقول: "نحن على ثقة تامة بأن لدينا الموارد المالية اللازمة لتطوير تقنيات رائدة حقًا". في الواقع، يتطلب تطوير وتدريب نموذج فيديو مدعوم بالذكاء الاصطناعي موارد ضخمة. فتكاليف قوة الحوسبة، وجمع البيانات، وتوظيف الكوادر المؤهلة تأهيلاً عالياً باهظة للغاية. إن قدرة شركة ميدجورني على تحمل هذه التكاليف تؤكد طموحها في منافسة كبرى شركات التكنولوجيا في المستقبل.
يوجد حاليًا تداخل كبير في مجال الذكاء الاصطناعي التوليدي بين مختلف مزودي هذه التقنية. فشركات مثل OpenAI وStability AI وجوجل تُجري أبحاثًا على نماذج توليدية للصور والفيديوهات. مع ذلك، تتميز Midjourney بنهجها القائم على إنشاء منصة سهلة الاستخدام يمكن دمجها بسلاسة في سير العمل الإبداعي. وقد ضمن هذا التركيز على سهولة الاستخدام والحرية الفنية بناء مجتمع مخلص لـ Midjourney. لذا، من المرجح جدًا أن يرحب هذا المجتمع بحماس بالانتقال من توليد الصور إلى توليد الفيديوهات.
مناسب ل:
التأثير المحتمل على الصناعات الإبداعية والقطاعات الأخرى
قد يكون لمولد الفيديو المدعوم بالذكاء الاصطناعي، الذي تخطط شركة ميدجورني لتطويره، آثارٌ بعيدة المدى على العديد من الصناعات. إن إطلاق نموذج الفيديو بنجاح لن يُكمّل أساليب إنتاج الفيديو الحالية فحسب، بل سيخلق أيضًا فرصًا جديدة تمامًا لحلول سريعة وإبداعية وفعّالة من حيث التكلفة. فيما يلي أهم مجالات التطبيق.
1. التسويق والإعلان
تسعى وكالات التسويق والإعلان باستمرار إلى إيجاد طرق فعّالة لإثارة المشاعر وإيصال الرسائل إلى فئات مستهدفة محددة. وتفتح أدوات الفيديو المدعومة بالذكاء الاصطناعي آفاقًا جديدة تمامًا في هذا الصدد. تُستخدم الصور المُولّدة بالذكاء الاصطناعي بكثرة في الحملات الإعلانية لتجسيد الأفكار الرائجة أو النماذج الأولية، على سبيل المثال. ومع توليد الفيديو، يُمكن أن تُصبح السيناريوهات التالية واقعًا ملموسًا:
- إنتاج الإعلانات التجارية بسرعة: بدلاً من حجز استوديوهات تصوير باهظة الثمن أو المرور بمراحل تخطيط مطولة، يمكن لفرق التسويق إنتاج واختبار مقاطع الفيديو الأولية في وقت قصير جدًا. يمكن أن تكون عبارة مثل "مقطع فيديو حماسي لمنتج رياضي جديد مع موسيقى ديناميكية" بمثابة نقطة انطلاق لإنشاء لوحة قصصية بسرعة.
- الإعلانات المُخصصة: باستخدام تقنية تحويل النص إلى فيديو، يُمكن بسهولة إنشاء نسخ مختلفة من المقطع، كل منها مُصممة خصيصًا لفئات مُستهدفة مُحددة. وهذا يسمح بتكييف مقطع المنتج أو العلامة التجارية مع لغات وثقافات وفئات عمرية مُختلفة.
- الاستجابة السريعة للاتجاهات: تتسم اتجاهات وسائل التواصل الاجتماعي بالسرعة. ويستفيد الراغبون في التفاعل السريع من إنتاج الفيديو المدعوم بالذكاء الاصطناعي. إذ يمكن تحويل الميمات الرائجة والأفكار المنتشرة وحملات الهاشتاغات إلى صور متحركة بسرعة فائقة.
2. صناعة الترفيه
سواءً في مجال السينما أو التلفزيون أو منصات البث، يواجه قطاع الترفيه تحولاً جذرياً محتملاً. ورغم أن الذكاء الاصطناعي لن يحل محل المبدعين البشريين بين عشية وضحاها، إلا أنه يُمكن أن يكون أداةً فعّالة لتبسيط عمليات الإنتاج وفتح آفاق جديدة.
- المؤثرات البصرية وتطوير المفاهيم: في المراحل المبكرة من إنتاج فيلم أو مسلسل، يمكن للمنتجين استخدام الذكاء الاصطناعي لاختبار الأفكار البصرية بسرعة، والتحقق من تخطيطات المشاهد، أو تحديد التوجهات الأسلوبية.
- مشاهد أولية ولوحات قصصية: يمكن للمخرجين وكتاب السيناريو استخدام برنامج Midjourney Video لإنشاء لوحات قصصية متحركة أولية. وهذا من شأنه أن يساعد في تقييم مدى نجاح المشهد كما هو مُخطط له، دون الحاجة إلى استثمار مبالغ طائلة في تصوير مُتقن.
- إتاحة إنتاج الفيديو للجميع: بفضل الذكاء الاصطناعي، بات بإمكان حتى الإنتاجات ذات الميزانيات المنخفضة وصانعي الأفلام المستقلين إنتاج مؤثرات خاصة متقنة كانت تتطلب سابقًا شركات إنتاج ما بعد الإنتاج باهظة الثمن. وهذا من شأنه أن يوسع بشكل كبير النطاق الإبداعي لصناعة السينما.
3. التجارة الإلكترونية
تلعب عروض المنتجات دورًا محوريًا في التجارة الإلكترونية. فسواءً كان متجرًا إلكترونيًا أو سوقًا إلكترونية، غالبًا ما يتخذ العملاء قرارات الشراء بناءً على الانطباعات البصرية. ويفتح توليد الفيديوهات المدعوم بالذكاء الاصطناعي آفاقًا جديدة في هذا المجال.
- مقاطع فيديو آلية للمنتجات: بدلاً من الاكتفاء بعرض صور ثابتة، يمكن لأصحاب المتاجر إنشاء مقطع فيديو قصير تلقائياً لكل منتج، يعرضه أثناء الاستخدام. هذا يزيد من القيمة المعلوماتية ويحسّن تجربة العملاء.
- الاستشارة عبر الفيديو الشخصية: من الناحية النظرية، سيكون من الممكن حتى إنشاء عروض تقديمية مخصصة للمنتجات يظهر فيها اسم العميل أو يتم محاكاة سيناريو محدد يتم فيه استخدام المنتج.
- بيئات التسوق التفاعلية: على المدى البعيد، يمكن تصور متاجر إلكترونية توفر مقاطع فيديو قصيرة متحركة لكل منتج. يزيد الفيديو القصير الذي يُبرز أهم الميزات من احتمالية الشراء. ويمكن للذكاء الاصطناعي تسريع هذه العملية وتخصيصها بشكل كبير.
4. التعليم
تواجه المؤسسات التعليمية ومنصات التعلم عبر الإنترنت أيضًا تحدي تقديم المحتوى التعليمي بطريقة جذابة، وبالتالي توليد دافعية أعلى للتعلم:
- إنشاء مقاطع فيديو تعليمية تفاعلية: يمكن للمعلمين إنشاء مقاطع فيديو توضيحية متحركة بسرعة وبدون ميزانية كبيرة، توضح بوضوح المفاهيم المعقدة.
- أنظمة التدريس الشخصية: يمكن تكييف مقاطع الفيديو المدعومة بالذكاء الاصطناعي مع مستوى معرفة كل متعلم على حدة. على سبيل المثال، سيشاهد الطالب (أ) شرحًا أكثر تفصيلًا، بينما سيشاهد الطالب (ب) شرحًا أكثر إيجازًا نظرًا لمعرفته المسبقة الأكبر.
- المحاكاة والتصوير المرئي: تُعدّ المحاكاة، لا سيما في المواد العلمية كعلم الأحياء والكيمياء والفيزياء، أداةً شائعةً لتصوير العمليات غير المرئية بالعين المجردة. ويمكن لمقاطع الفيديو المُولّدة بالذكاء الاصطناعي أن تُتيح إنشاء مواد تعليمية بسرعة فائقة وبشكل مُوجّه.
5. الإعلام والصحافة
غالباً ما تحتاج وسائل الإعلام والصحفيون إلى معالجة الأخبار بسرعة والاعتماد على المواد المرئية. يمكن لبرنامج Midjourney Video تبسيط إنتاج المحتوى التحريري.
- إنتاج مقاطع الفيديو الإخبارية بسرعة: غالباً ما يكون الحصول على لقطات فيديو مناسبة أمراً صعباً عند تغطية الأخبار العاجلة. ورغم أنه لا يُفضّل الاستغناء تماماً عن اللقطات الحقيقية، إلا أن المقاطع المعلوماتية المتحركة قد تُسهّل فهم السياق، على سبيل المثال، من خلال الخرائط المتحركة أو الرسوم البيانية أو السيناريوهات الافتراضية.
- الرسوم البيانية وتصور البيانات: يمكن توضيح البيانات المعقدة في رسوم بيانية متحركة أو خرائط تم إنشاؤها بدعم من الذكاء الاصطناعي. وهذا يزيد من جاذبية التقارير متعددة الوسائط.
- أشكال جديدة للتقارير متعددة الوسائط: يمكن للصحفيين تجربة رسومات الذكاء الاصطناعي ورسوم الفيديو المتحركة لسرد قصص أكثر إثارة وتشويقاً. قد يشمل ذلك مقاطع فيديو بزاوية 360 درجة أو عروض مرئية تفاعلية.
6. الصناعات الإبداعية
لطالما شكّل المصممون والفنانون والمبدعون جمهوراً أساسياً لمنصة ميدجورني. وتتيح لهم خاصية الفيديو توسيعاً شبه لا محدود لإمكانياتهم التعبيرية.
- الفن المفاهيمي ورسم القصص المصورة: يتيح الجمع بين توليد الصور والفيديوهات للمبدعين تطوير سيناريوهات بسرعة وعرضها بشكل متحرك. وهذا يُسهّل طرح الأفكار واختبار تأثيرها في وقت مبكر.
- الرسوم المتحركة والمؤثرات البصرية: يستطيع الفنانون المستقلون إنتاج أفلامهم القصيرة، ومقاطع الفيديو الموسيقية، والرسوم المتحركة الخاصة بهم دون الحاجة إلى موارد إنتاجية ضخمة. وهذا من شأنه أن يُفضي إلى موجة جديدة كلياً من فنون ورسوم الذكاء الاصطناعي.
- ربط الوسائط المختلفة: بما أن منصة Midjourney توفر بالفعل وظائف متكاملة (مثل استخدامها عبر Discord)، فمن الممكن أن تتطور مشاريع تعاونية يعمل فيها العديد من الفنانين معًا على فيديو واحد. يمكن أن يحدث هذا في الوقت الفعلي أو بشكل غير متزامن، مما سيؤدي إلى أساليب إبداعية جديدة كليًا.
كيف تهدف شركة Midjourney إلى جعل مقاطع الفيديو التي تعمل بالذكاء الاصطناعي أكثر أمانًا وأفضل؟
أينما ظهرت تقنيات جديدة، لا بد من مراعاة التحديات والمخاطر المحتملة. ويُعدّ توليد الفيديو المدعوم بالذكاء الاصطناعي، على وجه الخصوص، مجالاً واعداً لإساءة الاستخدام، كما في تقنية التزييف العميق، حيث يُوضع الأشخاص في سياقات زائفة. ويُطرح التساؤل حول كيفية تعامل شركة ميدجورني مع هذه المشكلات. ومن الممكن أن تقوم الشركة - على غرار نهجها في توليد الصور - بوضع آليات وإرشادات للفلترة لمنع المحتوى المسيء أو غير القانوني.
علاوة على ذلك، تُعدّ جودة مقاطع الفيديو المُنشأة وتناسقها أمراً بالغ الأهمية. ولا يزال من غير الواضح مدى قدرة النظام على عرض الحركات المعقدة أو المشاهد التفصيلية التي تستغرق عدة ثوانٍ. وكلما زاد طول المقطع، زاد احتمال ظهور تناقضات أو تشوهات. لذا، ينبغي على المستخدمين أن يكونوا على دراية بأن هذه التقنية لها حدودها في البداية.
جانب آخر يتعلق بقاعدة البيانات. يتطلب تدريب نموذج ذكاء اصطناعي قوي كميات هائلة من البيانات. في السابق، اعتمدت شركة ميدجورني على مجموعات بيانات صور واسعة النطاق تغطي مواضيع وأنماطًا ووجهات نظر لا حصر لها. ستكون متطلبات البيانات هذه أكبر بكثير بالنسبة للفيديوهات. من الضروري عدم حدوث أي انتهاكات لحقوق النشر أو حماية البيانات أثناء جمع البيانات، وأن تغطي بيانات التدريب المختارة أوسع نطاق ممكن من محتوى الفيديو لضمان مرونة النموذج.
التكامل والاستخدام
تشتهر منصة Midjourney بسهولة استخدامها وبساطتها عبر منصة Discord. لذا، يُفترض أن يكون نموذج الفيديو V6 متاحًا مبدئيًا عبر هذه المنصة أو واجهة دردشة مشابهة. يُدخل المستخدمون طلباتهم، ويضيفون المعامل "--video"، ثم يتلقون مقطع فيديو بعد فترة معالجة قصيرة. مع ذلك، لا يزال النقاش قائمًا حول ما إذا كانت Midjourney ستوفر تطبيقًا مستقلًا أم واجهة ويب لإنشاء مقاطع الفيديو. خاصةً مع المقاطع الطويلة، قد يكون من المفيد منح المستخدمين مزيدًا من التحكم والشمولية مقارنةً بواجهة الدردشة.
أشارت الإعلانات السابقة، ولو بشكل غير مباشر، إلى دراسة إمكانية تطوير حل مستقل. قد يوفر هذا الحل ميزات متقدمة، مثل عرض زمني يُمكن من خلاله تحديد الإطارات الرئيسية، أو إمكانيات تحرير متكاملة للتصحيح الديناميكي. يصعب تطبيق هذه الميزات في واجهة روبوت محادثة تقليدية.
من الصور إلى الفيديوهات: كيف تُحسّن ميدجورني بصرياً هذا الجيل
يشير إطلاق الإصدارين V6 (المخصص للفيديو) وV7 (كامتداد لتقنية توليد الصور) في بداية العام إلى أن شركة Midjourney تعتزم تقديم مجموعة متكاملة من أدوات الذكاء الاصطناعي في المستقبل. من المرجح أن يُحسّن الإصدار V7 تقنية توليد الصور ويُضيف ميزات جديدة، مثل تحسين تفسير التعليمات، وزيادة دقة الصور، وتوفير المزيد من أنماط العرض. أما نموذج الفيديو في الإصدار V6، فيركز على الصور المتحركة، ومن المتوقع أن يعتمد على العديد من خوارزميات وبيانات التدريب الخاصة بالإصدار V7، مع إضافة عنصر زمني.
قد تكون فلسفة ميدجورني هي: "نرى كلا النموذجين وجهين لعملة واحدة". فكلاهما، إنتاج الصور والفيديوهات، يهدف في النهاية إلى ابتكار محتوى مرئي ذي معنى وجاذبية فنية. يكمن الاختلاف في عامل الوقت، الذي يزيد بشكل كبير من المتطلبات التقنية. وبطبيعة الحال، يمتلك من ينجحون في إنتاج الفيديوهات مجموعة أوسع من التقنيات التي يمكن الاستفادة منها أيضاً في مجال إنتاج الصور.
توسعات محتملة لما بعد عام 2025
أوضحت شركة ميدجورني بالفعل أن الصور والفيديوهات ليست سوى جزء واحد مما يُتوقع أن يقوم به الذكاء الاصطناعي في المستقبل. وقد تشمل التطورات المستقبلية، على سبيل المثال:
- دمج الصوت: يُعدّ توليد المؤثرات الصوتية أو الموسيقى تلقائيًا بما يتناسب مع أسلوب الفيديو خطوة منطقية تالية. سيُتيح ذلك إنشاء أفلام قصيرة مُولّدة بالكامل، بما في ذلك موسيقى تصويرية مُلائمة.
- المحتوى التفاعلي: قد يصبح من الممكن للمستخدمين إنشاء ليس فقط فيديو ثابت أو خطي، ولكن أيضًا مقاطع تفاعلية يمكن للمشاهدين من خلالها اختيار كيفية استمرار القصة.
- النماذج ثلاثية الأبعاد والواقع الافتراضي: إذا كان بإمكان Midjourney بالفعل إنشاء صور ومقاطع فيديو ثنائية الأبعاد، فإن الخطوة التالية ستكون إنشاء نماذج ثلاثية الأبعاد يمكن تضمينها في بيئات الواقع الافتراضي أو الواقع المعزز.
- التوليد في الوقت الحقيقي والتطبيقات المباشرة: من الممكن أيضًا توسيع هذا ليشمل البيئات الحية التي يتم فيها إنشاء مقاطع الفيديو أو تعديلها في الوقت الحقيقي بناءً على تدفقات البيانات الواردة أو معلومات المستشعرات.
مع أن هذه التحسينات لا تزال في طور التطوير، إلا أنه لا ينبغي الاستهانة بالوتيرة السريعة للابتكار في مجال الذكاء الاصطناعي. وقد أثبتت شركة ميدجورني مراراً وتكراراً أن تطوير نسخ جديدة من النماذج غالباً ما يسير بوتيرة أسرع من المتوقع.
ميدجورني الإصدارين 6 و7: الموجة التالية من إنشاء المحتوى الرقمي
أثار إعلان شركة ميدجورني عن إطلاق "نموذج الفيديو V6" بالتزامن مع V7 في أوائل عام 2025 ضجة كبيرة. وباعتبارها شركة رائدة في مجال توليد الصور بالذكاء الاصطناعي، تدخل ميدجورني الآن حقبة جديدة: توليد الفيديو الشامل بالذكاء الاصطناعي. التوقعات عالية، فإذا نجحت ميدجورني في تكرار نجاحها في مجال الصور، فستُحدث نقلة نوعية في صناعة الإبداع الرقمي.
المزايا واضحة: إنتاج فيديوهات سريع، وفعّال من حيث التكلفة، ومرن، يمكن أن يحقق نتائج فنية مبهرة مع توجيهات مُتقنة. ويمكن لمجموعة واسعة من القطاعات الاستفادة من ذلك، بدءًا من التسويق والإعلان، مرورًا بالسينما والتلفزيون، والتجارة الإلكترونية، وصولًا إلى التعليم. مع ذلك، من المهم التذكير بأن إنتاج الفيديو أكثر تعقيدًا بكثير من مجرد إنشاء صور فردية. وتكمن التحديات الأكبر على الأرجح في الحفاظ على التناسق بين الإطارات المتعددة، وتصوير الحركة بشكل مقنع، وتجنب التشوهات.
تتمتع شركة ميدجورني بموارد مالية كافية لتنفيذ هذا المشروع الضخم، كما أن مجتمعها الداعم يمثل ركيزة أساسية لها. فمع تجربة نموذج الفيديو الجديد، سيلعب هذا المجتمع دورًا محوريًا في تحديد التحسينات وتطوير تطبيقات إبداعية غير مسبوقة.
"مستقبل الذكاء الاصطناعي الإبداعي ما زال في بداياته" - هذه العبارة تلخص جوهر هذا التطور. مع "نموذج تحويل النص إلى فيديو في منتصف العملية"، نقترب من عالم يُنشأ فيه جزء كبير من محتوانا الرقمي - سواءً كان صورة أو فيديو - بدعم من الذكاء الاصطناعي. هذا لا يقتصر على جعل العمليات الإبداعية أكثر كفاءة فحسب، بل يمتد ليشمل توسيع آفاق الجماليات لما نفهمه حاليًا بالفن الرقمي وصناعة المحتوى. في الوقت نفسه، يتطلب هذا نهجًا مسؤولًا تجاه هذه الأدوات الجديدة لتجنب إساءة استخدامها والنزاعات الأخلاقية.
سيُظهر هذا الإصدار ما إذا كانت شركة ميدجورني قادرة على تحقيق التوقعات. إذا نجحت، فمن المرجح أن يرسخ قسم الفيديو مكانته بسرعة مماثلة لسرعة توليد الصور بالذكاء الاصطناعي في السابق، ليصبح بذلك الموجة الكبيرة التالية في الاستخدام الإبداعي والتجاري للذكاء الاصطناعي.
مناسب ل:
شريكك العالمي في التسويق وتطوير الأعمال
☑️ لغة العمل لدينا هي الإنجليزية أو الألمانية
☑️ جديد: المراسلات بلغتك الوطنية!
سأكون سعيدًا بخدمتك وفريقي كمستشار شخصي.
يمكنك الاتصال بي عن طريق ملء نموذج الاتصال أو ببساطة اتصل بي على +49 89 89 674 804 (ميونخ) . عنوان بريدي الإلكتروني هو: ولفنشتاين ∂ xpert.digital
إنني أتطلع إلى مشروعنا المشترك.


