خطأ في التقدير بقيمة 57 مليار دولار - شركة NVIDIA تحديداً تحذر: صناعة الذكاء الاصطناعي راهنت على الحصان الخاسر
إصدار تجريبي من إكسبرت
اختيار اللغة 📢
تاريخ النشر: 9 نوفمبر 2025 / تاريخ التحديث: 9 نوفمبر 2025 - المؤلف: Konrad Wolfenstein

خطأ في التقدير بقيمة 57 مليار دولار - شركة NVIDIA تحديدًا تحذر: صناعة الذكاء الاصطناعي راهنت على الحصان الخاسر - الصورة: Xpert.Digital
انسَ عمالقة الذكاء الاصطناعي: لماذا المستقبل صغير، لا مركزي، وأرخص بكثير
### نماذج اللغة الصغيرة: مفتاح الاستقلالية الحقيقية للأعمال ### من مُقدمي خدمات الحوسبة السحابية العملاقة إلى المستخدمين: تحول في موازين القوى في عالم الذكاء الاصطناعي ### خطأ الـ 57 مليار دولار: لماذا لا تحدث ثورة الذكاء الاصطناعي الحقيقية في الحوسبة السحابية؟ ### ثورة الذكاء الاصطناعي الصامتة: اللامركزية بدلًا من المركزية ### عمالقة التكنولوجيا على المسار الخاطئ: مستقبل الذكاء الاصطناعي مرن ومحلي ### من مُقدمي خدمات الحوسبة السحابية العملاقة إلى المستخدمين: تحول في موازين القوى في عالم الذكاء الاصطناعي ###
مليارات الدولارات من الاستثمارات المهدرة: لماذا تتفوق نماذج الذكاء الاصطناعي الصغيرة على النماذج الكبيرة؟
يواجه عالم الذكاء الاصطناعي زلزالًا هائلًا يُذكّر بتصحيحات عصر فقاعة الإنترنت. ويكمن جوهر هذا التحوّل في خطأ فادح: فبينما تستثمر شركات التكنولوجيا العملاقة مثل مايكروسوفت وجوجل وميتا مئات المليارات من الدولارات في بنى تحتية مركزية لنماذج اللغة الضخمة، يتخلف السوق الفعلي لتطبيقاتها بشكلٍ كبير. وقد أظهر تحليلٌ رائد، أجرته جزئيًا شركة NVIDIA الرائدة في هذا المجال، أن الفجوة تبلغ 57 مليار دولار في استثمارات البنية التحتية مقارنةً بحجم سوق حقيقي لا يتجاوز 5.6 مليار دولار، أي بفارق عشرة أضعاف.
ينبع هذا الخطأ الاستراتيجي من افتراض أن مستقبل الذكاء الاصطناعي يكمن حصراً في نماذج أكبر حجماً وأكثر كثافة حسابية وتخضع لسيطرة مركزية. لكن هذا النموذج ينهار الآن. ثورة هادئة، مدفوعة بنماذج لغوية أصغر حجماً ولا مركزية (نماذج اللغة الصغيرة، SLMs)، تُحدث تغييراً جذرياً في النظام القائم. هذه النماذج ليست فقط أرخص وأكثر كفاءة بكثير، بل تُمكّن الشركات أيضاً من تحقيق مستويات جديدة من الاستقلالية وسيادة البيانات والمرونة، بعيداً كل البعد عن الاعتماد المكلف على عدد قليل من مزودي خدمات الحوسبة السحابية العملاقة. يحلل هذا النص تفاصيل هذا الاستثمار الخاطئ الذي بلغت قيمته مليارات الدولارات، ويُبين لماذا تحدث ثورة الذكاء الاصطناعي الحقيقية ليس في مراكز البيانات الضخمة، بل بشكل لا مركزي وعلى أجهزة ذات موارد محدودة. إنها قصة تحول جوهري في موازين القوى من مزودي البنية التحتية إلى مستخدمي التكنولوجيا.
ذو صلة بهذا الموضوع:
بحث شركة NVIDIA حول سوء تخصيص رأس المال في مجال الذكاء الاصطناعي
البيانات التي وصفتها مأخوذة من ورقة بحثية لشركة NVIDIA نُشرت في يونيو 2025. المصدر الكامل هو:
"نماذج اللغة الصغيرة هي مستقبل الذكاء الاصطناعي الفاعل"
- المؤلفون: بيتر بيلجاك، جريج هاينريش، شيزهي دياو، يونغغان فو، شين دونغ، سوراف موراليداران، ينغيان سيلين لين، بافلو مولتشانوف
- تاريخ الإصدار: 2 يونيو 2025 (الإصدار 1)، آخر مراجعة 15 سبتمبر 2025 (الإصدار 2)
- موقع النشر: arXiv:2506.02153 [cs.AI]
- DOI: https://doi.org/10.48550/arXiv.2506.02153
- صفحة أبحاث NVIDIA الرسمية: https://research.nvidia.com/labs/lpr/slm-agents/
الرسالة الرئيسية المتعلقة بسوء تخصيص رأس المال
يوثق البحث تباينًا جوهريًا بين استثمارات البنية التحتية وحجم السوق الفعلي: ففي عام 2024، استثمر القطاع 57 مليار دولار في البنية التحتية السحابية لدعم خدمات واجهة برمجة تطبيقات نماذج اللغة الكبيرة (LLM)، بينما لم يتجاوز حجم السوق الفعلي لهذه الخدمات 5.6 مليار دولار. ويُفسر هذا التباين الكبير، الذي يصل إلى عشرة أضعاف، في الدراسة على أنه مؤشر على خطأ في الحسابات الاستراتيجية، حيث استثمر القطاع بكثافة في بنية تحتية مركزية للنماذج واسعة النطاق، على الرغم من إمكانية استبدال ما بين 40% و70% من أحمال عمل نماذج اللغة الكبيرة الحالية بنماذج لغة صغيرة (SLM) أصغر حجمًا وأكثر تخصصًا بتكلفة لا تتجاوز 1/30 من التكلفة الحالية.
سياق البحث والتأليف
هذه الدراسة عبارة عن ورقة بحثية صادرة عن فريق أبحاث كفاءة التعلم العميق في قسم الأبحاث بشركة NVIDIA. المؤلف الرئيسي، بيتر بيلكاك، باحث في مجال الذكاء الاصطناعي في NVIDIA، ويركز على موثوقية وكفاءة الأنظمة القائمة على الوكلاء. وتستند الورقة البحثية إلى ثلاثة محاور رئيسية:
SLMs هي
- قوي بما فيه الكفاية
- مناسب للجراحة و
- ضروري اقتصاديا
للعديد من حالات الاستخدام في أنظمة الذكاء الاصطناعي الوكيلة.
يؤكد الباحثون صراحةً أن الآراء الواردة في هذه الورقة البحثية هي آراء المؤلفين ولا تعكس بالضرورة موقف شركة NVIDIA. تدعو NVIDIA إلى النقاش البنّاء وتلتزم بنشر أي مراسلات ذات صلة على الموقع الإلكتروني المرفق.
لماذا تجعل نماذج اللغات الصغيرة اللامركزية البنية التحتية المركزية عتيقة الطراز؟
يشهد الذكاء الاصطناعي منعطفًا حاسمًا، تُذكّر تداعياته بتقلبات فقاعة الإنترنت. فقد كشفت ورقة بحثية صادرة عن شركة NVIDIA عن خلل جوهري في تخصيص رأس المال، يُزعزع أسس استراتيجيتها الحالية في مجال الذكاء الاصطناعي. فبينما استثمرت صناعة التكنولوجيا 57 مليار دولار في بنية تحتية مركزية لنماذج لغوية واسعة النطاق، لم يتجاوز حجم السوق الفعلي لاستخدامها 5.6 مليار دولار. هذا التفاوت الهائل، الذي يصل إلى عشرة أضعاف، لا يُشير فقط إلى مبالغة في تقدير الطلب، بل يكشف أيضًا عن خطأ استراتيجي جوهري فيما يتعلق بمستقبل الذكاء الاصطناعي.
استثمار فاشل؟ مليارات تُنفق على البنية التحتية للذكاء الاصطناعي - ماذا نفعل بالقدرة الفائضة؟
الأرقام تتحدث عن نفسها. ففي عام 2024، بلغ الإنفاق العالمي على البنية التحتية للذكاء الاصطناعي ما بين 80 و87 مليار دولار، وفقًا لتحليلات مختلفة، حيث استحوذت مراكز البيانات ومسرعات الأعمال على الغالبية العظمى منه. أعلنت مايكروسوفت عن استثمارات بقيمة 80 مليار دولار للسنة المالية 2025، ورفعت جوجل توقعاتها إلى ما بين 91 و93 مليار دولار، وتخطط ميتا لاستثمار ما يصل إلى 70 مليار دولار. تمثل هذه الشركات الثلاث العملاقة وحدها حجم استثمار يتجاوز 240 مليار دولار. وتشير تقديرات ماكينزي إلى أن إجمالي الإنفاق على البنية التحتية للذكاء الاصطناعي قد يصل إلى ما بين 3.7 و7.9 تريليون دولار بحلول عام 2030.
في المقابل، يُثير واقع الطلب قلقًا بالغًا. فقد قُدِّر حجم سوق نماذج اللغة الكبيرة للمؤسسات بما يتراوح بين 4 و6.7 مليار دولار أمريكي فقط لعام 2024، مع توقعات تتراوح بين 4.8 و8 مليارات دولار أمريكي لعام 2025. حتى أكثر التقديرات تفاؤلًا لسوق الذكاء الاصطناعي التوليدي ككل تتراوح بين 28 و44 مليار دولار أمريكي لعام 2024. ويتضح التناقض الجوهري جليًا: فقد بُنيت البنية التحتية لسوق غير موجودة بهذا الشكل والنطاق.
ينبع هذا الاستثمار الخاطئ من افتراضٍ يتبين زيفه بشكل متزايد: وهو أن مستقبل الذكاء الاصطناعي يكمن في نماذج مركزية ضخمة باستمرار. فقد انتهجت شركات الحوسبة السحابية العملاقة استراتيجية التوسع الهائل، مدفوعةً بقناعة راسخة بأن عدد المعلمات وقوة الحوسبة هما العاملان الحاسمان في المنافسة. واعتُبر نموذج GPT-3، الذي يضم 175 مليار معلمة، إنجازًا بارزًا في عام 2020، بينما وضع نموذج GPT-4، الذي يضم أكثر من تريليون معلمة، معايير جديدة. وقد اتبعت الصناعة هذا المنطق دون تفكير، واستثمرت في بنية تحتية مصممة لتلبية احتياجات نماذج تفوق حجمها حجم معظم حالات الاستخدام.
يُظهر هيكل الاستثمار بوضوح سوء التخصيص. ففي الربع الثاني من عام 2025، وُجّه 98% من مبلغ 82 مليار دولار أمريكي المُنفَق على البنية التحتية للذكاء الاصطناعي إلى الخوادم، حيث خُصص 91.8% منها لأنظمة مُسرّعة بوحدات معالجة الرسومات (GPU) ووحدات المعالجة المُوسّعة (XPU). واستحوذت شركات الحوسبة السحابية العملاقة على 86.7% من هذه النفقات، أي ما يُقارب 71 مليار دولار أمريكي في ربع واحد. تجاهل هذا التركيز لرأس المال في أجهزة مُتخصصة للغاية وكثيفة الاستهلاك للطاقة لتدريب واستنتاج نماذج ضخمة حقيقة اقتصادية أساسية: وهي أن معظم تطبيقات المؤسسات لا تتطلب هذه القدرة.
النموذج يتغير: من المركزية إلى اللامركزية
تُقدّم شركة NVIDIA، المستفيد الرئيسي من طفرة البنية التحتية الأخيرة، تحليلاً يُشكّك في هذا النموذج السائد. وتُشير الأبحاث حول نماذج اللغة الصغيرة باعتبارها مستقبل الذكاء الاصطناعي القائم على الوكلاء إلى أن النماذج التي تحتوي على أقل من 10 مليارات مُعامل ليست كافية فحسب، بل تتفوق عملياً على الغالبية العظمى من تطبيقات الذكاء الاصطناعي. وقد كشفت دراسة أجريت على ثلاثة أنظمة وكلاء مفتوحة المصدر واسعة النطاق أنه يُمكن استبدال ما بين 40 و70 بالمئة من استدعاءات نماذج اللغة الكبيرة بنماذج صغيرة مُتخصصة دون أي تراجع في الأداء.
تُزعزع هذه النتائج الافتراضات الأساسية لاستراتيجية الاستثمار الحالية. فإذا استطاع MetaGPT استبدال 60% من استدعاءات LLM، و40% من Open Operator، و70% من Cradle بنماذج لغة صغيرة (SLMs)، فسيكون قد تم بناء بنية تحتية قادرة على تلبية طلبات غير موجودة بهذا الحجم. وتتغير الجدوى الاقتصادية بشكل جذري: إذ تُكلّف عملية تشغيل نموذج لغة صغير Llama 3.1B من 10 إلى 30 ضعفًا أقل من نظيره الأكبر Llama 3.3 405B. ويمكن إنجاز الضبط الدقيق في غضون ساعات قليلة من استخدام وحدة معالجة الرسومات (GPU) بدلًا من أسابيع. وتعمل العديد من نماذج اللغة الصغيرة على أجهزة المستهلكين، مما يُلغي الاعتماد على الحوسبة السحابية تمامًا.
يُعدّ هذا التحوّل الاستراتيجي جوهريًا. فالسيطرة تنتقل من مزوّدي البنية التحتية إلى المشغّلين. فبينما كانت البنية السابقة تُجبر الشركات على الاعتماد على عدد قليل من مزوّدي خدمات الحوسبة السحابية العملاقة، يُتيح تطبيق اللامركزية من خلال أنظمة إدارة دورة حياة البرمجيات (SLMs) استقلالية جديدة. إذ يُمكن تشغيل النماذج محليًا، وتبقى البيانات داخل الشركة، وتُلغى تكاليف واجهات برمجة التطبيقات (APIs)، ويُكسر احتكار المورّدين. هذا ليس مجرد تحوّل تكنولوجي، بل هو تحوّل في ديناميكيات القوة.
كان الرهان السابق على النماذج المركزية واسعة النطاق قائمًا على افتراض تأثيرات التوسع الأسي. إلا أن البيانات التجريبية تُناقض هذا الافتراض بشكل متزايد. فمعالج مايكروسوفت فاي-3، الذي يحتوي على 7 مليارات مُعامل، يُحقق أداءً في توليد التعليمات البرمجية يُضاهي أداء نماذج تحتوي على 70 مليار مُعامل. أما معالج إنفيديا نيموترون نانو 2، الذي يحتوي على 9 مليارات مُعامل، فيتفوق على معالج كوين 3-8 بي في معايير الاستدلال بستة أضعاف الإنتاجية. وتزداد كفاءة كل مُعامل مع النماذج الأصغر حجمًا، بينما غالبًا ما تُفعّل النماذج الكبيرة جزءًا صغيرًا فقط من مُعاملاتها لمدخل مُحدد، وهو ما يُعدّ قصورًا مُتأصلًا.
التفوق الاقتصادي لنماذج اللغة الصغيرة
يكشف هيكل التكاليف عن الواقع الاقتصادي بوضوحٍ صارخ. تُقدّر تكلفة تدريب نماذج GPT-4 بأكثر من 100 مليون دولار، بينما قد تصل تكلفة Gemini Ultra إلى 191 مليون دولار. حتى ضبط النماذج الكبيرة لمجالات محددة قد يُكلّف عشرات الآلاف من الدولارات من وقت وحدة معالجة الرسومات (GPU). في المقابل، يمكن تدريب نماذج SLM وضبطها بدقة مقابل بضعة آلاف من الدولارات فقط، وغالبًا باستخدام وحدة معالجة رسومات واحدة عالية الأداء.
تكشف تكاليف الاستدلال عن اختلافاتٍ أكبر. تبلغ تكلفة GPT-4 حوالي 0.03 دولار لكل 1000 رمز مُدخل و0.06 دولار لكل 1000 رمز مُخرج، أي ما مجموعه 0.09 دولار لكل استعلام في المتوسط. أما Mistral 7B، كمثال على نموذج SLM، فتبلغ تكلفته 0.0001 دولار لكل 1000 رمز مُدخل و0.0003 دولار لكل 1000 رمز مُخرج، أي 0.0004 دولار لكل استعلام. وهذا يُمثل انخفاضًا في التكلفة بمقدار 225 ضعفًا. ومع ملايين الاستعلامات، يتراكم هذا الفرق ليُشكّل مبالغ كبيرة تُؤثر بشكل مباشر على الربحية.
تكشف التكلفة الإجمالية للملكية عن أبعاد أخرى. تبلغ تكلفة استضافة نموذج يحتوي على 7 مليارات مُعامل على خوادم فعلية مزودة بوحدات معالجة رسومية L40S حوالي 953 دولارًا أمريكيًا شهريًا. أما الضبط الدقيق السحابي باستخدام AWS SageMaker على مثيلات g5.2xlarge فيبلغ 1.32 دولارًا أمريكيًا في الساعة، مع تكاليف تدريب محتملة تبدأ من 13 دولارًا أمريكيًا للنماذج الأصغر. وتبلغ تكلفة نشر الاستدلال على مدار الساعة حوالي 950 دولارًا أمريكيًا شهريًا. بالمقارنة مع تكاليف واجهة برمجة التطبيقات (API) للاستخدام المستمر للنماذج الكبيرة، والتي قد تصل بسهولة إلى عشرات الآلاف من الدولارات شهريًا، تتضح الميزة الاقتصادية.
تُعدّ سرعة التنفيذ عاملاً اقتصادياً غالباً ما يُستهان به. فبينما قد يستغرق ضبط نموذج لغة كبير أسابيع، تكون نماذج لغة البرمجيات جاهزة للاستخدام في غضون ساعات أو أيام قليلة. وتُصبح القدرة على الاستجابة السريعة للمتطلبات الجديدة، وإضافة إمكانيات جديدة، أو تعديل السلوك، ميزة تنافسية. في الأسواق سريعة التغير، قد يكون هذا الفارق الزمني هو الفيصل بين النجاح والفشل.
يشهد مفهوم وفورات الحجم تحولاً جذرياً. ففي السابق، كانت هذه الوفورات تُعتبر ميزةً حصريةً لشركات الحوسبة السحابية العملاقة، التي تمتلك قدرات هائلة وتوزعها على عدد كبير من العملاء. أما الآن، وبفضل نماذج إدارة دورة حياة البرمجيات (SLMs)، بات بإمكان حتى المؤسسات الصغيرة التوسع بكفاءة عالية، نظراً لانخفاض متطلبات الأجهزة بشكل كبير. إذ يُمكن لشركة ناشئة بناء نموذج SLM متخصص بميزانية محدودة، يتفوق أداؤه على النماذج العامة الكبيرة في أداء مهمته المحددة. وبذلك، بات تطوير الذكاء الاصطناعي متاحاً للجميع، وهو ما يُصبح واقعاً اقتصادياً ملموساً.
الأساسيات التقنية للاضطراب
تُعدّ الابتكارات التكنولوجية التي تُمكّن نماذج التعلم الموجه ذاتيًا (SLMs) ذات أهمية بالغة، تمامًا كآثارها الاقتصادية. وقد أثبتت تقنية تقطير المعرفة، التي يتم فيها دمج المعرفة من نموذج تعليمي أكبر في نموذج طالب أصغر، فعاليتها العالية. نجح نموذج DistilBERT في ضغط نموذج BERT، واتبع نموذج TinyBERT مبادئ مماثلة. تعمل المناهج الحديثة على تقطير قدرات النماذج التوليدية الكبيرة، مثل GPT-3، إلى نسخ أصغر بكثير تُظهر أداءً مماثلاً أو أفضل في مهام محددة.
تستفيد هذه العملية من كلٍّ من التصنيفات المرنة (توزيعات الاحتمالات) لنموذج التدريب والتصنيفات الثابتة للبيانات الأصلية. يُمكّن هذا المزيج النموذج الأصغر من استخلاص أنماط دقيقة قد تضيع في أزواج المدخلات والمخرجات البسيطة. وقد أظهرت تقنيات التقطير المتقدمة، مثل التقطير التدريجي، أن النماذج الصغيرة قادرة على تحقيق نتائج أفضل من نماذج التعلم الخطي حتى مع بيانات تدريب أقل. يُغيّر هذا الأمر جوهريًا من الناحية الاقتصادية: فبدلًا من عمليات التدريب المكلفة والطويلة على آلاف وحدات معالجة الرسومات، تكفي عمليات التقطير المُوجّهة.
يقلل التكميم من دقة التمثيل العددي لأوزان النموذج. فبدلاً من استخدام أرقام الفاصلة العائمة 32 بت أو 16 بت، تستخدم النماذج المُكمّمة تمثيلات عددية صحيحة 8 بت أو حتى 4 بت. تنخفض متطلبات الذاكرة تناسبياً، وتزداد سرعة الاستدلال، وينخفض استهلاك الطاقة. تُقلل تقنيات التكميم الحديثة من فقدان الدقة، وغالباً ما تُبقي الأداء دون تغيير يُذكر. وهذا يُتيح النشر على الأجهزة الطرفية والهواتف الذكية والأنظمة المُدمجة، وهو أمرٌ كان مستحيلاً مع النماذج الكبيرة ذات الدقة الكاملة.
تُزيل عملية التقليم الروابط والمعلمات الزائدة من الشبكات العصبية. وكما هو الحال عند تحرير نص طويل جدًا، يتم تحديد العناصر غير الأساسية وحذفها. يُزيل التقليم المنظم خلايا عصبية أو طبقات كاملة، بينما يُزيل التقليم غير المنظم الأوزان الفردية. وتكون بنية الشبكة الناتجة أكثر كفاءة، إذ تتطلب ذاكرة وقدرة معالجة أقل، مع الحفاظ على قدراتها الأساسية. وبالجمع بين التقليم وتقنيات الضغط الأخرى، تُحقق النماذج المُقلمة مكاسب هائلة في الكفاءة.
تُفكك عملية التحليل إلى عوامل منخفضة الرتبة مصفوفات الأوزان الكبيرة إلى نواتج ضرب مصفوفات أصغر. فبدلاً من مصفوفة واحدة تحتوي على ملايين العناصر، يخزن النظام ويعالج مصفوفتين أصغر بكثير. تبقى العملية الحسابية كما هي تقريبًا، ولكن الجهد الحسابي ينخفض بشكل كبير. تُعد هذه التقنية فعالة بشكل خاص في بنى المحولات، حيث تهيمن آليات الانتباه على عمليات ضرب المصفوفات الكبيرة. يسمح توفير الذاكرة بنوافذ سياق أكبر أو أحجام دفعات أكبر بنفس ميزانية الأجهزة.
يُظهر دمج هذه التقنيات في نماذج التعلم الاجتماعي الحديثة، مثل سلسلة مايكروسوفت فاي، وجوجل جيما، وإنفيديا نيموترون، الإمكانات الكامنة. يتفوق نموذج فاي-2، الذي يحتوي على 2.7 مليار مُعامل فقط، على نموذجي ميسترال ولاما-2 اللذين يحتويان على 7 و13 مليار مُعامل على التوالي، في معايير الأداء المُجمّعة، ويحقق أداءً أفضل من نموذج لاما-2-70B الأكبر منه بـ 25 ضعفًا في مهام الاستدلال متعددة الخطوات. وقد تحقق ذلك من خلال اختيار البيانات الاستراتيجي، وتوليد بيانات اصطناعية عالية الجودة، وتقنيات توسيع نطاق مبتكرة. الرسالة واضحة: لم يعد الحجم مؤشرًا على القدرة.
ديناميكيات السوق وإمكانات الاستبدال
تدعم النتائج التجريبية من التطبيقات العملية الاعتبارات النظرية. فقد كشف تحليل شركة NVIDIA لإطار عمل MetaGPT، وهو إطار عمل لتطوير البرمجيات متعددة الوكلاء، أن حوالي 60% من طلبات نماذج التعلم الموجه (LLM) قابلة للاستبدال. وتشمل هذه المهام توليد التعليمات البرمجية النمطية، وإنشاء الوثائق، والإخراج المنظم - وكلها مجالات تتفوق فيها نماذج التعلم الموجه المتخصصة (SLM) من حيث السرعة والفعالية من حيث التكلفة على النماذج العامة واسعة النطاق.
يُبرهن نظام Open Operator، وهو نظام لأتمتة سير العمل، من خلال قدرته على استبدال 40% من العمليات، على أنه حتى في سيناريوهات التنسيق المعقدة، لا تتطلب العديد من المهام الفرعية كامل قدرة نماذج التعلم المنطقية. إذ يُمكن معالجة تحليل النوايا، والإخراج القائم على القوالب، وقرارات التوجيه بكفاءة أكبر باستخدام نماذج صغيرة مُحسّنة بدقة. أما النسبة المتبقية البالغة 60%، والتي تتطلب في الواقع تفكيرًا عميقًا أو معرفة واسعة بالعالم، فتُبرر استخدام النماذج الكبيرة.
يُظهر نظام Cradle، وهو نظام أتمتة واجهة المستخدم الرسومية، أعلى إمكانية للاستبدال بنسبة 70%. تُعدّ تفاعلات واجهة المستخدم المتكررة، وتسلسلات النقرات، وإدخالات النماذج، مثاليةً لنماذج التعلم الاجتماعي. تتميز هذه النماذج بتحديد دقيق للمهام، وقلة التباين، وانخفاض متطلبات الفهم السياقي. يتفوق النموذج المتخصص المُدرّب على تفاعلات واجهة المستخدم الرسومية على نموذج التعلم العام من حيث السرعة والموثوقية والتكلفة.
تتكرر هذه الأنماط في مختلف مجالات التطبيق. روبوتات الدردشة لخدمة العملاء، مثل روبوتات الأسئلة الشائعة، وتصنيف المستندات، وتحليل المشاعر، والتعرف على الكيانات المسماة، والترجمات البسيطة، والاستعلامات عن قواعد البيانات باللغة الطبيعية، جميعها تستفيد من نماذج إدارة دورة حياة البرمجيات (SLMs). تشير إحدى الدراسات إلى أن ما بين 60 و80 بالمئة من الاستفسارات في تطبيقات الذكاء الاصطناعي النموذجية للمؤسسات تندرج ضمن فئات تكفيها نماذج إدارة دورة حياة البرمجيات. ولهذا الأمر آثارٌ بالغة الأهمية على متطلبات البنية التحتية.
يكتسب مفهوم توجيه النماذج أهمية متزايدة. تقوم الأنظمة الذكية بتحليل الاستعلامات الواردة وتوجيهها إلى النموذج المناسب. تُوجَّه الاستعلامات البسيطة إلى نماذج التعلم الآلي منخفضة التكلفة، بينما تُعالَج المهام المعقدة بواسطة نماذج التعلم الآلي عالية الأداء. يُحسِّن هذا النهج الهجين التوازن بين الجودة والتكلفة. وتشير التطبيقات الأولية إلى توفير في التكاليف يصل إلى 75% مع الحفاظ على نفس الأداء العام أو حتى تحسينه. ويمكن أن يكون منطق التوجيه نفسه نموذجًا صغيرًا للتعلم الآلي يأخذ في الاعتبار تعقيد الاستعلام وسياقه وتفضيلات المستخدم.
يُسهم انتشار منصات الضبط الدقيق كخدمة في تسريع تبني هذه التقنية. فبإمكان الشركات التي لا تمتلك خبرة متعمقة في مجال التعلم الآلي بناء أنظمة إدارة التعلم المتخصصة التي تتضمن بياناتها الخاصة وخصائص مجالها. وبذلك، يتقلص الوقت اللازم من شهور إلى أيام، والتكلفة من مئات آلاف الدولارات إلى آلاف. هذه السهولة في الوصول تُضفي طابعًا ديمقراطيًا على ابتكارات الذكاء الاصطناعي، وتنقل عملية خلق القيمة من مزودي البنية التحتية إلى مطوري التطبيقات.
بُعد جديد للتحول الرقمي مع "الذكاء الاصطناعي المُدار" - منصة وحلول B2B | إكسبرت للاستشارات

بُعد جديد للتحول الرقمي مع "الذكاء الاصطناعي المُدار" - منصة وحلول B2B | إكسبرت للاستشارات - الصورة: Xpert.Digital
ستتعلم هنا كيف يمكن لشركتك تطبيق حلول الذكاء الاصطناعي المخصصة بسرعة وأمان ودون عوائق دخول عالية.
تُعدّ منصة الذكاء الاصطناعي المُدارة حلاً شاملاً ومريحاً لمشاكل الذكاء الاصطناعي. فبدلاً من التعامل مع التكنولوجيا المعقدة والبنية التحتية المكلفة وعمليات التطوير المطولة، ستحصل على حل جاهز مصمم خصيصاً لتلبية احتياجاتك من شريك متخصص، غالباً في غضون أيام قليلة فقط.
المزايا الرئيسية باختصار:
⚡ تنفيذ سريع: من الفكرة إلى التطبيق الجاهز للاستخدام في أيام، وليس شهورًا. نقدم حلولًا عملية تُحقق قيمة مضافة فورية.
🔒 أقصى درجات أمان البيانات: بياناتك الحساسة تبقى معك. نضمن معالجة آمنة ومتوافقة مع الأنظمة دون مشاركة البيانات مع أي جهات خارجية.
💸 لا مخاطر مالية: أنت تدفع فقط مقابل النتائج. يتم التخلص تماماً من الاستثمارات الأولية الكبيرة في الأجهزة أو البرامج أو الموظفين.
🎯 ركّز على جوهر عملك: انصبّ اهتمامك على ما تُجيده. نحن نتولّى جميع جوانب التنفيذ التقني والتشغيل والصيانة لحلول الذكاء الاصطناعي الخاصة بك.
📈 حلول مستقبلية وقابلة للتطوير: يتطور نظام الذكاء الاصطناعي الخاص بك معك. نضمن التحسين المستمر وقابلية التوسع، ونقوم بتكييف النماذج بمرونة مع المتطلبات الجديدة.
للمزيد من المعلومات، انقر هنا:
كيف توفر تقنيات الذكاء الاصطناعي اللامركزية مليارات الدولارات للشركات
التكاليف الخفية للهياكل المركزية
إن التركيز فقط على تكاليف الحوسبة المباشرة يقلل من تقدير التكلفة الإجمالية لبنى إدارة دورة حياة البرمجيات المركزية. وتُسبب تبعيات واجهات برمجة التطبيقات (APIs) عيوبًا هيكلية. فكل طلب يُولّد تكاليف تتزايد مع الاستخدام. وبالنسبة للتطبيقات الناجحة التي تضم ملايين المستخدمين، تُصبح رسوم واجهات برمجة التطبيقات العاملَ المهيمن في التكلفة، مما يُقلل من هوامش الربح. وتُصبح الشركات عالقة في هيكل تكلفة ينمو بشكل متناسب مع النجاح، دون تحقيق وفورات الحجم المُقابلة.
يشكل تقلب أسعار مزودي واجهات برمجة التطبيقات (APIs) خطرًا على الأعمال. فزيادة الأسعار، أو فرض قيود على الحصص، أو تغيير شروط الخدمة، قد يؤدي إلى انهيار ربحية التطبيق بين عشية وضحاها. وتُظهر القيود التي أعلنتها مؤخرًا كبرى الشركات المزودة على السعة، والتي تُجبر المستخدمين على ترشيد مواردهم، مدى هشاشة هذا الاعتماد. وتُزيل أنظمة إدارة دورة حياة الخدمة (SLMs) المخصصة هذا الخطر تمامًا.
تزداد أهمية سيادة البيانات والامتثال لها. فاللائحة العامة لحماية البيانات (GDPR) في أوروبا، واللوائح المماثلة عالميًا، ومتطلبات توطين البيانات المتزايدة، تُنشئ أطرًا قانونية معقدة. ويحمل إرسال بيانات الشركات الحساسة إلى واجهات برمجة التطبيقات الخارجية التي قد تعمل في ولايات قضائية أجنبية مخاطر تنظيمية وقانونية. غالبًا ما تفرض قطاعات الرعاية الصحية والمالية والحكومية متطلبات صارمة تستبعد أو تقيد بشدة استخدام واجهات برمجة التطبيقات الخارجية. وتُقدم حلول إدارة دورة حياة البيانات (SLM) المحلية حلًا جذريًا لهذه المشكلات.
إن مخاوف الملكية الفكرية حقيقية. فكل طلب يُرسل إلى مزود واجهة برمجة التطبيقات (API) قد يُعرّض معلومات سرية للخطر. منطق الأعمال، وتطوير المنتجات، ومعلومات العملاء - كل هذا يُمكن نظريًا استخراجه واستخدامه من قِبل المزود. توفر بنود العقد حماية محدودة ضد التسريبات العرضية أو الجهات الخبيثة. الحل الآمن الوحيد هو عدم مشاركة البيانات مع أي جهة خارجية.
تتأثر سرعة الاستجابة والموثوقية سلبًا بسبب اعتمادية الشبكة. فكل طلب من واجهة برمجة تطبيقات السحابة يمر عبر بنية الإنترنت التحتية، مما يعرضه لتقلبات الشبكة وفقدان الحزم وتفاوت أوقات الاستجابة. بالنسبة للتطبيقات التي تعمل في الوقت الفعلي، مثل أنظمة الذكاء الاصطناعي التفاعلية أو أنظمة التحكم، تُعد هذه التأخيرات غير مقبولة. تستجيب وحدات إدارة دورة حياة الخدمة المحلية (SLMs) في أجزاء من الثانية بدلًا من ثوانٍ، بغض النظر عن حالة الشبكة، مما يُحسّن تجربة المستخدم بشكل ملحوظ.
يؤدي الاعتماد الاستراتيجي على عدد قليل من مزودي خدمات الحوسبة السحابية العملاقة إلى تركيز السلطة وخلق مخاطر هيكلية. تهيمن شركات مثل AWS ومايكروسوفت أزور وجوجل كلاود، وغيرها، على السوق. وتتسبب انقطاعات هذه الخدمات في آثار متتالية على آلاف التطبيقات المعتمدة عليها. يتبدد وهم التكرار عند الأخذ في الاعتبار أن معظم الخدمات البديلة تعتمد في نهاية المطاف على نفس المجموعة المحدودة من مزودي الخدمات. تتطلب المرونة الحقيقية تنويعًا، ويشمل ذلك، في أفضل الأحوال، القدرات الداخلية.
ذو صلة بهذا الموضوع:
- أيهما أفضل: بنية تحتية للذكاء الاصطناعي لامركزية وموحدة ومضادة للهشاشة، أم مصنع ضخم للذكاء الاصطناعي، أم مركز بيانات للذكاء الاصطناعي فائق التوسع؟
الحوسبة الطرفية كنقطة تحول استراتيجية
يُحدث التقارب بين أنظمة إدارة دورة حياة البرمجيات (SLMs) والحوسبة الطرفية تحولاً جذرياً. إذ يُتيح نشر الحوسبة الطرفية إمكانية إجراء العمليات الحسابية في مصادر البيانات، مثل أجهزة استشعار إنترنت الأشياء، والأجهزة المحمولة، ووحدات التحكم الصناعية، والمركبات. ويُعدّ هذا التخفيض في زمن الاستجابة هائلاً، إذ ينتقل من ثوانٍ إلى أجزاء من الثانية، ومن زمن استجابة السحابة إلى المعالجة المحلية. وبالنسبة للأنظمة ذاتية التشغيل، والواقع المعزز، والأتمتة الصناعية، والأجهزة الطبية، فإن هذا ليس مرغوباً فيه فحسب، بل ضروري أيضاً.
تُحقق هذه التقنية وفورات كبيرة في عرض النطاق الترددي. فبدلاً من تدفق البيانات المستمر إلى السحابة، حيث تتم معالجتها وإرسال النتائج، تتم المعالجة محلياً. ويتم إرسال المعلومات المُجمّعة ذات الصلة فقط. في سيناريوهات تضم آلاف الأجهزة الطرفية، يُقلل هذا من حركة مرور الشبكة بشكل كبير. كما تنخفض تكاليف البنية التحتية، ويتم تجنب ازدحام الشبكة، وتزداد الموثوقية.
تُحفظ الخصوصية بشكلٍ تلقائي. لا تغادر البيانات الجهاز. يمكن معالجة كل من بث الكاميرا، والتسجيلات الصوتية، والمعلومات البيومترية، وبيانات الموقع محليًا دون الحاجة إلى الوصول إلى خوادم مركزية. هذا يُزيل المخاوف الأساسية المتعلقة بالخصوصية التي تُثيرها حلول الذكاء الاصطناعي السحابية. بالنسبة لتطبيقات المستهلكين، يُصبح هذا عاملًا مُميزًا؛ أما بالنسبة للصناعات الخاضعة للتنظيم، فيُصبح شرطًا أساسيًا.
تتحسن كفاءة الطاقة على مستويات متعددة. تستهلك رقائق الذكاء الاصطناعي الطرفية المتخصصة، والمُحسّنة لاستنتاج النماذج الصغيرة، جزءًا ضئيلاً من طاقة وحدات معالجة الرسومات في مراكز البيانات. كما أن إلغاء نقل البيانات يوفر الطاقة في البنية التحتية للشبكة. بالنسبة للأجهزة التي تعمل بالبطاريات، أصبح هذا الأمر وظيفة أساسية. يمكن للهواتف الذكية والأجهزة القابلة للارتداء والطائرات المسيّرة وأجهزة استشعار إنترنت الأشياء أداء وظائف الذكاء الاصطناعي دون التأثير بشكل كبير على عمر البطارية.
تُعزز إمكانية العمل دون اتصال بالإنترنت من موثوقية الأنظمة. يعمل الذكاء الاصطناعي على الحافة حتى بدون اتصال بالإنترنت، مما يضمن استمرارية الأداء في المناطق النائية، والبنى التحتية الحيوية، وحالات الكوارث. هذا الاستقلال عن توفر الشبكة ضروري للعديد من التطبيقات. لا يمكن للمركبة ذاتية القيادة الاعتماد على الاتصال السحابي، كما يجب ألا يتعطل الجهاز الطبي بسبب عدم استقرار شبكة الواي فاي.
تتحول نماذج التكاليف من النفقات التشغيلية إلى النفقات الرأسمالية. فبدلاً من تكاليف الحوسبة السحابية المستمرة، يتم الاستثمار لمرة واحدة في أجهزة الحوسبة الطرفية. وهذا ما يجعله خيارًا اقتصاديًا جذابًا للتطبيقات طويلة الأمد وعالية الأداء. كما أن التكاليف القابلة للتنبؤ تُحسّن تخطيط الميزانية وتقلل المخاطر المالية، مما يُتيح للشركات استعادة السيطرة على إنفاقها على البنية التحتية للذكاء الاصطناعي.
تُظهر الأمثلة الإمكانيات الكامنة. تُمكّن تقنية NVIDIA ChatRTX من استنتاج نماذج التعلم العميق المحلية على وحدات معالجة الرسومات الاستهلاكية. تُدمج Apple الذكاء الاصطناعي على أجهزتها في أجهزة iPhone وiPad، مع تشغيل نماذج أصغر مباشرةً على الجهاز. تُطوّر Qualcomm وحدات معالجة عصبية للهواتف الذكية خصيصًا لتطبيقات الذكاء الاصطناعي على الحافة. تستهدف Google Coral والمنصات المماثلة تطبيقات إنترنت الأشياء والتطبيقات الصناعية. تُشير ديناميكيات السوق إلى اتجاه واضح نحو اللامركزية.
بنى الذكاء الاصطناعي غير المتجانسة كنموذج مستقبلي
لا يكمن المستقبل في اللامركزية المطلقة، بل في البنى الهجينة الذكية. تجمع الأنظمة غير المتجانسة بين وحدات إدارة دورة حياة النظام الطرفية (SLMs) للمهام الروتينية الحساسة للتأخير، ووحدات إدارة دورة حياة النظام السحابية (LLMs) لمتطلبات الاستدلال المعقدة. هذا التكامل يُعظّم الكفاءة مع الحفاظ على المرونة والقدرة.
يتألف تصميم النظام من عدة طبقات. في طبقة الحوسبة الطرفية، توفر نماذج إدارة دورة حياة الخدمة (SLMs) عالية الكفاءة استجابات فورية. ومن المتوقع أن تعالج هذه النماذج ما بين 60 و80% من الطلبات بشكل مستقل. أما بالنسبة للاستعلامات الغامضة أو المعقدة التي لا تستوفي معايير الثقة المحلية، فيتم تصعيدها إلى طبقة الحوسبة الضبابية - وهي عبارة عن خوادم إقليمية مزودة بنماذج متوسطة المدى. ولا تصل إلى البنية التحتية السحابية المركزية المزودة بنماذج كبيرة متعددة الأغراض إلا الحالات الصعبة للغاية.
أصبح توجيه النماذج عنصرًا بالغ الأهمية. تقوم أجهزة التوجيه القائمة على التعلم الآلي بتحليل خصائص الطلب: طول النص، ومؤشرات التعقيد، وإشارات المجال، وسجل المستخدم. وبناءً على هذه الخصائص، يُسند الطلب إلى النموذج المناسب. تحقق أجهزة التوجيه الحديثة دقة تزيد عن 95% في تقدير التعقيد، وتُحسّن أداءها باستمرار بناءً على الأداء الفعلي وموازنة التكلفة والجودة.
تُصمّم آليات الانتباه المتبادل في أنظمة التوجيه المتقدمة تفاعلات الاستعلام مع النموذج بشكل صريح. وهذا يُتيح اتخاذ قرارات دقيقة: هل يكفي نموذج Mistral-7B، أم أن GPT-4 ضروري؟ هل يستطيع Phi-3 التعامل مع هذا، أم أن Claude مطلوب؟ إن دقة هذه القرارات، عند تطبيقها على ملايين الاستعلامات، تُحقق وفورات كبيرة في التكاليف مع الحفاظ على رضا المستخدم أو تحسينه.
يُعدّ توصيف عبء العمل أساسيًا. تتألف أنظمة الذكاء الاصطناعي الوكيل من التنسيق، والاستدلال، واستدعاء الأدوات، وعمليات الذاكرة، وتوليد المخرجات. لا تتطلب جميع المكونات نفس القدرة الحاسوبية. غالبًا ما يكون التنسيق واستدعاء الأدوات قائمين على قواعد أو يتطلبان حدًا أدنى من الذكاء، وهو ما يُعدّ مثاليًا لأنظمة إدارة دورة حياة البرمجيات (SLMs). يمكن أن يكون الاستدلال هجينًا: استدلال بسيط في أنظمة إدارة دورة حياة البرمجيات، واستدلال معقد متعدد الخطوات في أنظمة إدارة دورة حياة البرمجيات. يستخدم توليد المخرجات للقوالب أنظمة إدارة دورة حياة البرمجيات، بينما يستخدم توليد النصوص الإبداعية أنظمة إدارة دورة حياة البرمجيات.
يُراعي تحسين التكلفة الإجمالية للملكية (TCO) تباين مكونات الأجهزة. تُستخدم وحدات معالجة الرسومات H100 عالية الأداء لأحمال العمل الحرجة في نماذج التعلم العميق للذاكرة (LLM)، ووحدات A100 أو L40S متوسطة الأداء للنماذج متوسطة المدى، ووحدات T4 منخفضة التكلفة أو رقائق مُحسّنة للاستدلال لنماذج التعلم العميق للذاكرة (SLM). يتيح هذا التفاوت الدقيق مطابقة متطلبات أحمال العمل مع إمكانيات الأجهزة بدقة. تُشير الدراسات الأولية إلى انخفاض في التكلفة الإجمالية للملكية بنسبة تتراوح بين 40 و60% مقارنةً بعمليات النشر المتجانسة عالية الأداء.
تتطلب عملية التنسيق بنى برمجية متطورة. وتُعد أنظمة إدارة المجموعات القائمة على Kubernetes، والمُدعمة بجدولة خاصة بالذكاء الاصطناعي تُدرك خصائص النماذج، أساسيةً في هذا الصدد. ولا يقتصر توازن الأحمال على مراعاة عدد الطلبات في الثانية فحسب، بل يشمل أيضًا أطوال الرموز، وحجم ذاكرة النماذج، وأهداف زمن الاستجابة. ويستجيب التوسع التلقائي لأنماط الطلب، حيث يُوفر سعة إضافية أو يُقلل السعة خلال فترات انخفاض الاستخدام.
الاستدامة وكفاءة الطاقة
أصبح الأثر البيئي للبنية التحتية للذكاء الاصطناعي قضية محورية. إذ يمكن لتدريب نموذج لغوي واحد ضخم أن يستهلك طاقة تعادل استهلاك بلدة صغيرة في عام كامل. وقد تستحوذ مراكز البيانات التي تُشغّل تطبيقات الذكاء الاصطناعي على ما بين 20 و27 بالمئة من الطلب العالمي على الطاقة لمراكز البيانات بحلول عام 2028. وتشير التوقعات إلى أنه بحلول عام 2030، قد تحتاج مراكز بيانات الذكاء الاصطناعي إلى 8 جيجاوات لتشغيل كل دورة تدريب على حدة. وسيكون البصمة الكربونية الناتجة مماثلة لتلك الخاصة بقطاع الطيران.
يتزايد استهلاك الطاقة في النماذج الكبيرة بشكل غير متناسب. فقد تضاعف استهلاك الطاقة لوحدات معالجة الرسومات من 400 إلى أكثر من 1000 واط خلال ثلاث سنوات. وتتطلب أنظمة NVIDIA GB300 NVL72، على الرغم من تقنية تنعيم الطاقة المبتكرة التي تقلل ذروة الحمل بنسبة 30%، كميات هائلة من الطاقة. وتضيف بنية التبريد التحتية ما بين 30 و40% أخرى إلى الطلب على الطاقة. وقد يرتفع إجمالي انبعاثات ثاني أكسيد الكربون من البنية التحتية للذكاء الاصطناعي بمقدار 220 مليون طن بحلول عام 2030، حتى مع افتراضات متفائلة بشأن إزالة الكربون من شبكة الكهرباء.
تُحقق نماذج اللغة الصغيرة (SLMs) مكاسب جوهرية في الكفاءة. يتطلب تدريبها ما بين 30 و40 بالمئة فقط من القدرة الحاسوبية التي تتطلبها نماذج اللغة الكبيرة (LLMs) المماثلة. تبلغ تكلفة تدريب نموذج BERT حوالي 10,000 يورو، مقارنةً بمئات الملايين لنماذج GPT-4. كما أن طاقة الاستدلال أقل نسبيًا. إذ يمكن أن يستهلك استعلام نموذج اللغة الصغيرة طاقة أقل بمقدار 100 إلى 1000 مرة من استعلام نموذج اللغة الكبيرة. وعلى مدار ملايين الاستعلامات، يُحقق هذا وفورات هائلة.
تُعزز الحوسبة الطرفية هذه المزايا. فالمعالجة المحلية تُغني عن الطاقة اللازمة لنقل البيانات عبر الشبكات والبنية التحتية الأساسية. وتحقق رقائق الذكاء الاصطناعي الطرفية المتخصصة كفاءة طاقة تفوق بكثير كفاءة وحدات معالجة الرسومات في مراكز البيانات. وتُظهر الهواتف الذكية وأجهزة إنترنت الأشياء المزودة بوحدات معالجة عصبية (NPUs) بقدرة ميلي واط، بدلاً من مئات الواط في الخوادم، الفرق الشاسع في الحجم.
أصبح استخدام الطاقة المتجددة أولوية متزايدة. تلتزم جوجل بتحقيق طاقة خالية من الكربون بنسبة 100% بحلول عام 2030، وتلتزم مايكروسوفت بتحقيق انبعاثات كربونية سلبية. مع ذلك، يُمثل حجم الطلب الهائل على الطاقة تحدياتٍ جمة. فحتى مع وجود مصادر الطاقة المتجددة، تبقى مسألة سعة الشبكة وتخزين الطاقة وعدم انتظامها قائمة. تعمل أنظمة إدارة الطاقة المستدامة (SLMs) على خفض الطلب المطلق، مما يجعل الانتقال إلى الذكاء الاصطناعي الأخضر أكثر جدوى.
تعمل الحوسبة الواعية بالكربون على تحسين جدولة أحمال العمل بناءً على كثافة الكربون في الشبكة. تبدأ عمليات التدريب عندما تكون نسبة الطاقة المتجددة في الشبكة في ذروتها. تُوجّه طلبات الاستدلال إلى المناطق ذات الطاقة الأنظف. هذه المرونة الزمنية والجغرافية، بالإضافة إلى كفاءة نماذج إدارة دورة حياة البرمجيات، يمكن أن تُقلل انبعاثات ثاني أكسيد الكربون بنسبة تتراوح بين 50 و70 بالمئة.
يزداد الإطار التنظيمي صرامةً. يتضمن قانون الذكاء الاصطناعي في الاتحاد الأوروبي تقييمات إلزامية للأثر البيئي لبعض أنظمة الذكاء الاصطناعي. كما أصبح الإبلاغ عن انبعاثات الكربون معيارًا أساسيًا. وتواجه الشركات التي تمتلك بنى تحتية غير فعالة وتستهلك كميات كبيرة من الطاقة مخاطر تتعلق بالامتثال وتشويه السمعة. ويتطور تبني أنظمة إدارة دورة حياة البرمجيات والحوسبة الطرفية من كونه ميزة إضافية إلى ضرورة حتمية.
الديمقراطية مقابل التركيز
أدت التطورات السابقة إلى تركيز قوة الذكاء الاصطناعي في أيدي عدد قليل من اللاعبين الرئيسيين. تهيمن الشركات السبع الكبرى - مايكروسوفت، وجوجل، وميتا، وأمازون، وآبل، وإنفيديا، وتسلا - على هذا المجال. تسيطر هذه الشركات العملاقة على البنية التحتية، والنماذج، وبشكل متزايد على سلسلة القيمة بأكملها. تتجاوز قيمتها السوقية الإجمالية 15 تريليون دولار. وهي تمثل ما يقرب من 35% من القيمة السوقية لمؤشر ستاندرد آند بورز 500، مما يشكل خطر تركيز غير مسبوق في التاريخ.
لهذا التركيز آثارٌ هيكلية. فعددٌ قليلٌ من الشركات يضع المعايير، ويُحدد واجهات برمجة التطبيقات، ويتحكم في الوصول إليها. وتصبح الشركات الصغيرة والدول النامية مُعتمدةً عليها. ويُهدد هذا الوضع السيادة الرقمية للدول. وتستجيب أوروبا وآسيا وأمريكا اللاتينية باستراتيجيات وطنية للذكاء الاصطناعي، لكن هيمنة الشركات العملاقة الأمريكية لا تزال طاغية.
تُغيّر نماذج اللغات المصغّرة (SLMs) واللامركزية هذا الواقع. تُتيح نماذج اللغات المصغّرة مفتوحة المصدر، مثل Phi-3 وGemma وMistral وLlama، الوصول إلى أحدث التقنيات للجميع. يُمكن للجامعات والشركات الناشئة والشركات المتوسطة الحجم تطوير تطبيقات تنافسية دون الحاجة إلى موارد مراكز البيانات الضخمة. وبذلك، انخفضت عوائق الابتكار بشكل كبير. يُمكن لفريق صغير إنشاء نموذج لغة مصغّرة متخصص يتفوق على جوجل أو مايكروسوفت في مجاله.
يتجه الجدوى الاقتصادية نحو الشركات الصغيرة. فبينما يتطلب تطوير التعلم القائم على التعلم مدى الحياة ميزانيات بمئات الملايين، يُمكن تطوير التعلم القائم على التعلم المتخصص بميزانيات تتراوح بين خمسة وستة أرقام. كما يُتيح انتشار الحوسبة السحابية الوصول الفوري إلى بنية التدريب التحتية. وتُبسط خدمات الضبط الدقيق العمليات المعقدة. وبذلك، تتناقص عوائق دخول مجال ابتكارات الذكاء الاصطناعي من كونها باهظة للغاية إلى أن أصبحت في متناول اليد.
أصبحت سيادة البيانات واقعاً ملموساً. بات بإمكان الشركات والحكومات استضافة نماذج لا تصل أبداً إلى خوادم خارجية، ما يضمن بقاء البيانات الحساسة تحت سيطرتها. كما أصبح الامتثال للائحة العامة لحماية البيانات (GDPR) أسهل. وأصبح قانون الذكاء الاصطناعي للاتحاد الأوروبي، الذي يفرض متطلبات صارمة للشفافية والمساءلة، أكثر قابلية للإدارة مع النماذج الخاصة بدلاً من واجهات برمجة التطبيقات (APIs) المبهمة.
يتزايد تنوع الابتكارات. فبدلاً من هيمنة نماذج أحادية النمط تشبه نماذج التعلم الآلي العامة، تظهر آلاف النماذج المتخصصة في إدارة دورة حياة البرمجيات (SLMs) لمجالات ولغات ومهام محددة. هذا التنوع يُعزز القدرة على مواجهة الأخطاء المنهجية، ويزيد من حدة المنافسة، ويُسرّع وتيرة التقدم. ويتحول مشهد الابتكار من كونه هرمياً إلى مشهد متعدد المراكز.
تتضح مخاطر التركيز المتزايد. فالاعتماد على عدد قليل من مزودي الخدمات يخلق نقاط ضعف مركزية. وتؤدي انقطاعات الخدمة في منصات مثل AWS أو Azure إلى شلّ الخدمات العالمية. كما أن للقرارات السياسية التي تتخذها شركات الحوسبة السحابية العملاقة، مثل فرض قيود على الاستخدام أو إغلاق بعض المناطق، آثارًا متسلسلة. ويُسهم تطبيق اللامركزية من خلال إدارة دورة حياة الخدمات (SLM) بشكل جذري في الحد من هذه المخاطر النظامية.
إعادة التنظيم الاستراتيجي
بالنسبة للشركات، يستلزم هذا التحليل تعديلات استراتيجية جوهرية. إذ تتحول أولويات الاستثمار من البنية التحتية السحابية المركزية إلى بنى تحتية موزعة ومتنوعة. وبدلاً من الاعتماد الكامل على واجهات برمجة التطبيقات (APIs) الخاصة بمزودي خدمات الحوسبة السحابية العملاقة، يتمثل الهدف في تحقيق الاستقلالية من خلال أنظمة إدارة دورة حياة البرمجيات (SLMs) الداخلية. ويركز تطوير المهارات على تحسين النماذج، ونشرها على الحافة، والتنسيق الهجين.
يتغير مفهوم المفاضلة بين التطوير الداخلي والشراء. فبينما كان شراء الوصول إلى واجهة برمجة التطبيقات (API) يُعتبر خيارًا منطقيًا في السابق، أصبح تطوير أنظمة إدارة دورة حياة البرمجيات (SLMs) المتخصصة داخليًا أكثر جاذبية. وتُشير التكلفة الإجمالية للملكية على مدى ثلاث إلى خمس سنوات بوضوح إلى تفضيل النماذج الداخلية. كما تُضيف ميزات التحكم الاستراتيجي، وأمن البيانات، وقابلية التكيف مزايا نوعية إضافية.
بالنسبة للمستثمرين، يشير هذا التوزيع غير المتوازن إلى ضرورة توخي الحذر عند الاستثمار في البنية التحتية البحتة. فقد تواجه صناديق الاستثمار العقاري المتخصصة في مراكز البيانات، ومصنّعو وحدات معالجة الرسومات، ومزوّدو خدمات الحوسبة السحابية الضخمة، فائضًا في الطاقة الإنتاجية وانخفاضًا في الاستخدام إذا لم يتحقق الطلب كما هو متوقع. ويتجه التركيز حاليًا نحو مزوّدي تقنية إدارة دورة حياة البرمجيات، ورقائق الذكاء الاصطناعي الطرفية، وبرامج إدارة العمليات، وتطبيقات الذكاء الاصطناعي المتخصصة.
يُعدّ البُعد الجيوسياسي بالغ الأهمية. فالدول التي تُعطي الأولوية لسيادتها الوطنية في مجال الذكاء الاصطناعي تستفيد من التحوّل نحو إدارة الذكاء الاصطناعي. تستثمر الصين 138 مليار دولار في التكنولوجيا المحلية، بينما تستثمر أوروبا 200 مليار دولار في InvestAI. ستكون هذه الاستثمارات أكثر فعالية عندما لا يكون الحجم المطلق هو العامل الحاسم، بل الحلول الذكية والفعّالة والمتخصصة. عالم الذكاء الاصطناعي متعدد الأقطاب يُصبح واقعًا ملموسًا.
يتطور الإطار التنظيمي بالتوازي مع ذلك. حماية البيانات، والمساءلة الخوارزمية، والمعايير البيئية - جميعها تدعم الأنظمة اللامركزية والشفافة والفعالة. الشركات التي تتبنى أنظمة إدارة دورة حياة البرمجيات والحوسبة الطرفية مبكراً تضع نفسها في موقع متميز للامتثال للوائح المستقبلية.
يشهد سوق المواهب تحولاً جذرياً. فبينما كانت الجامعات المرموقة وشركات التكنولوجيا الرائدة فقط هي من تمتلك الموارد اللازمة لأبحاث ماجستير القانون، أصبح بإمكان أي مؤسسة تقريباً تطوير برامج ماجستير العلوم في إدارة الأعمال. ويجري التخفيف من حدة نقص المهارات الذي يعيق 87% من المؤسسات عن توظيف الذكاء الاصطناعي، وذلك بفضل انخفاض مستوى التعقيد وتوفر أدوات أفضل. وتُعزز مكاسب الإنتاجية الناتجة عن التطوير المدعوم بالذكاء الاصطناعي هذا التأثير.
يتغير أسلوبنا في قياس عائد الاستثمار في الذكاء الاصطناعي. فبدلاً من التركيز على القدرة الحاسوبية الخام، أصبحت كفاءة كل مهمة هي المقياس الأساسي. وتشير التقارير إلى أن متوسط عائد الاستثمار في مبادرات الذكاء الاصطناعي يبلغ 5.9%، وهو أقل بكثير من التوقعات. ويعود السبب في ذلك غالباً إلى استخدام حلول ضخمة ومكلفة لمشاكل بسيطة. ويمكن للتحول إلى نماذج إدارة دورة حياة البرمجيات المُحسّنة حسب المهام أن يُحسّن عائد الاستثمار هذا بشكل كبير.
يكشف التحليل عن صناعةٍ تقف على مفترق طرق. إنّ خسارة 57 مليار دولار من الاستثمار ليست مجرد مبالغة في تقدير الطلب، بل هي خطأ استراتيجي جوهري في فهم بنية الذكاء الاصطناعي. فالمستقبل ليس حكرًا على الشركات العملاقة المركزية، بل على الأنظمة اللامركزية والمتخصصة والفعّالة. نماذج اللغة الصغيرة ليست أقل شأنًا من نماذج اللغة الكبيرة، بل هي متفوقة عليها في الغالبية العظمى من التطبيقات العملية. وتتلاقى الحجج الاقتصادية والتقنية والبيئية والاستراتيجية لتُفضي إلى نتيجة واضحة: ستكون ثورة الذكاء الاصطناعي لامركزية.
يمثل تحول مركزية السلطة من مزودي الخدمات إلى المشغلين، ومن شركات الحوسبة السحابية العملاقة إلى مطوري التطبيقات، ومن المركزية إلى التوزيع، مرحلة جديدة في تطور الذكاء الاصطناعي. سيكون الفائزون هم من يدركون هذا التحول ويتبنونه مبكراً. أما من يتمسكون بالمنطق القديم، فيخاطرون بتحويل بنيتهم التحتية المكلفة إلى أصول مهملة، تتفوق عليها بدائل أكثر مرونة وكفاءة. إن مبلغ 57 مليار دولار ليس مجرد هدر، بل هو بداية النهاية لنموذج عفا عليه الزمن.
شريكك العالمي في التسويق وتطوير الأعمال
☑️ لغة أعمالنا هي الإنجليزية أو الألمانية
☑️ جديد: مراسلات بلغتك الأم!
يسعدني أنا وفريقي أن نكون متاحين لكم بصفتنا مستشاركم الشخصي.
يمكنكم التواصل معي عبر ملء نموذج الاتصال هنا أو الاتصال بي مباشرةً +49 89 89 674 804 ( ميونخ) . عنوان بريدي الإلكتروني هو: [email protected]
أتطلع إلى مشروعنا المشترك.
☑️ دعم الشركات الصغيرة والمتوسطة في مجالات الاستراتيجية والاستشارات والتخطيط والتنفيذ
☑️ إنشاء أو إعادة تنظيم الاستراتيجية الرقمية والتحول الرقمي
☑️ توسيع وتحسين عمليات المبيعات الدولية
☑️ منصات التداول العالمية والرقمية بين الشركات
☑️ تطوير الأعمال الرائدة / التسويق / العلاقات العامة / المعارض التجارية
🎯🎯🎯 استفد من خبرة Xpert.Digital الواسعة والمتعددة الجوانب في باقة خدمات شاملة واحدة | تطوير الأعمال، البحث والتطوير، الواقع الممتد، العلاقات العامة، وتحسين الظهور الرقمي

استفد من خبرة Xpert.Digital الواسعة والمتعددة الجوانب في باقة خدمات شاملة | البحث والتطوير، والواقع الممتد، والعلاقات العامة، وتحسين الظهور الرقمي - الصورة: Xpert.Digital
تتمتع شركة Xpert.Digital بمعرفة متعمقة في مختلف القطاعات، مما يُمكّننا من تطوير استراتيجيات مُصممة خصيصًا لتتوافق بدقة مع متطلبات وتحديات قطاع السوق الخاص بكم. ومن خلال التحليل المستمر لاتجاهات السوق ومتابعة تطورات القطاع، نستطيع اتخاذ إجراءات استباقية وتقديم حلول مبتكرة. إن الجمع بين الخبرة والكفاءة يُولّد قيمة مضافة ويمنح عملاءنا ميزة تنافسية حاسمة.
للمزيد من المعلومات، انقر هنا:

























