⭐️ الذكاء الاصطناعي (AI) - مدونة الذكاء الاصطناعي، ونقطة اتصال، ومركز محتوى ⭐️ الصين ⭐️ XPaper

Available in 27 languages 📢

نموذج Kimi K2 للذكاء الاصطناعي من شركة Moonshot AI: النموذج الرائد الجديد مفتوح المصدر من الصين – علامة فارقة أخرى لأنظمة الذكاء الاصطناعي المفتوحة

تاريخ النشر: ١٣ يوليو ٢٠٢٥ / تاريخ التحديث: ١٣ يوليو ٢٠٢٥ - المؤلف: Konrad Wolfenstein

نموذج الذكاء الاصطناعي كيمي كيه 2: الرائد الجديد مفتوح المصدر من الصين - علامة فارقة أخرى لأنظمة الذكاء الاصطناعي المفتوحة - الصورة: إكسبرت ديجيتال

يمهد نموذج كيمي كيه 2، الذي يحتوي على تريليون معلمة، الطريق لتطوير الذكاء الاصطناعي السيادي في أوروبا

ثورة أخرى في مجال المصادر المفتوحة: كيمي كيه 2 تُدخل الذكاء الاصطناعي عالمي المستوى إلى مراكز البيانات الأوروبية

يرتقي نظام Kimi K2 بنظام الذكاء الاصطناعي المفتوح إلى مستوى جديد. يقدم نموذجه، الذي يجمع بين خبرات متعددة ويحتوي على تريليون مُعامل، نتائج في البرمجة الواقعية والرياضيات ومعايير أداء الوكلاء تُضاهي أداء الأنظمة الاحتكارية الرائدة، وذلك بتكلفة أقل بكثير وبأوزان مُعلنة بالكامل. يتيح هذا للمطورين والشركات في ألمانيا فرصة استضافة خدمات الذكاء الاصطناعي عالية الأداء ذاتيًا، ودمجها في العمليات الحالية، وتطوير منتجات جديدة.

مناسب ل:

AI Open Source AI من Deepseek الصين-Sofseek يغرق عالم التكنولوجيا في وحدات معالجة الرسومات التي لا تقل عن الفوضى ، المزيد من قوة الذكاء الاصطناعي

لماذا تُعتبر كيمي كيه 2 أكثر من مجرد نموذج الذكاء الاصطناعي الكبير التالي

بينما تُخفي مختبرات غربية مثل OpenAI وAnthropic أفضل نماذجها خلف واجهات برمجة تطبيقات مدفوعة، تتبنى Moonshot AI نهجًا مختلفًا: جميع الأوزان متاحة للعموم بموجب ترخيص MIT مُعدّل. هذا لا يُمكّن فقط من إمكانية تكرار النتائج العلمية، بل يسمح أيضًا للشركات الصغيرة والمتوسطة ببناء مجموعات استدلال خاصة بها أو استخدام Kimi K2 في بيئات الحوسبة الطرفية. يتزامن إطلاق هذا النموذج مع فترة تُرسّخ فيها الصين مكانتها كشركة رائدة في مجال نماذج التعلم الآلي مفتوحة المصدر؛ حيث كان DeepSeek V3 يُعتبر المعيار حتى يونيو، والآن يرفع Kimi K2 سقف التوقعات مرة أخرى.

أساليب الهندسة المعمارية والتدريب

مزيج من الخبراء على مستوى قياسي

يعتمد نظام Kimi K2 على نظام خبير مبتكر يضم 384 خبيرًا، حيث يعمل ثمانية خبراء فقط وخبير "مشترك" عالمي واحد لكل رمز. تتيح هذه البنية لمحرك الاستدلال تحميل 32 مليار مُعامل فقط في الذاكرة في وقت واحد، مما يقلل بشكل كبير من حمل وحدة معالجة الرسومات (GPU). في حين أن نموذجًا كثيفًا يحتوي على 70 مليار مُعامل ويعمل بدقة كاملة يتطلب بالفعل وحدتي معالجة رسومات H100، يحقق Kimi K2 جودة مماثلة أو حتى أفضل مع تشغيل ثلث الحمل فقط على نفس وحدات معالجة الرسومات.

بالمقارنة مع النماذج الأخرى، تتجلى كفاءة Kimi K2 بوضوح: فمع تريليون مُعامل، يتفوق على DeepSeek V3-Base الذي يحتوي على 671 مليار مُعامل، بينما يقل عن القيمة التقديرية لـ GPT-4.1 الذي يحتوي على حوالي 1.8 تريليون مُعامل. علاوة على ذلك، يستخدم Kimi K2 32 مليار مُعامل فقط لكل رمز، مقارنةً بـ 37 مليار مُعامل لـ DeepSeek V3-Base. يستخدم نظام Kimi K2 الخبير 384 خبيرًا، يتم اختيار ثمانية منهم، بينما يستخدم DeepSeek V3-Base 240 خبيرًا، يتم اختيار ثمانية منهم أيضًا. تدعم النماذج الثلاثة جميعها طول سياق يبلغ 128,000 رمز.

يُظهر هذا التطور أن Moonshot تُصدر نموذجًا عامًا يحتوي على تريليون معلمة لأول مرة، مع بقائها أقل من حد 40 مليار معلمة لكل رمز، مما يمثل تقدمًا كبيرًا في كفاءة نماذج اللغة الكبيرة.

MuonClip – تثبيت على نطاق جديد

غالبًا ما يُعاني تدريب مُحوِّلات MoE فائقة القوة من ارتفاعٍ مُفرط في سجلات الانتباه. ولذلك، يجمع Moonshot بين مُحسِّن Muon الفعال من حيث استخدام الرموز وعملية إعادة تحجيم "qk-clip" اللاحقة التي تُعيد تطبيع مصفوفات الاستعلام والمفتاح بعد كل خطوة. ووفقًا لـ Moonshot، لم تحدث أي زيادة مفاجئة في الخسارة خلال 15.5 تريليون رمز تدريبي. والنتيجة هي منحنى تعلُّم سلس للغاية ونموذج مستقر منذ إصداره الأولي.

قاعدة البيانات

بفضل 15.5 تريليون رمز، يحقق Kimi K2 حجم بيانات يُضاهي نماذج GPT-4. بالإضافة إلى النصوص والرموز البرمجية التقليدية على الويب، تم دمج محاكاة استدعاءات الأدوات وحوارات سير العمل في مرحلة التدريب المسبق لترسيخ كفاءة النموذج. على عكس DeepSeek R1، لا تعتمد كفاءة النموذج بشكل أساسي على الإشراف على تسلسل الأفكار، بل على سيناريوهات التعلم التي تتطلب من النموذج تنسيق واجهات برمجة تطبيقات متعددة.

أداء معياري بالتفصيل

تُظهر نتائج الاختبارات المعيارية مقارنات تفصيلية بين ثلاثة نماذج ذكاء اصطناعي في مجالات مهام متنوعة. في البرمجة، حقق نموذج Kimi K2-Instr. نسبة نجاح بلغت 65.8% في اختبار SWE-bench Verified، بينما سجل DeepSeek V3 نسبة 38.8% وGPT-4.1 نسبة 54.6%. في اختبار LiveCodeBench v6، يتصدر Kimi K2-Instr. بنسبة 53.7%، يليه DeepSeek V3 بنسبة 49.2% ثم GPT-4.1 بنسبة 44.7%. في اختبار ربط الأدوات Tau2 Retail، بمتوسط أربع محاولات، حقق GPT-4.1 أفضل أداء بنسبة 74.8%، متقدمًا بفارق ضئيل على Kimi K2-Instr. بنسبة 70.6% وDeepSeek V3 بنسبة 69.1%. في فئة الرياضيات MATH-500، مع المطابقة التامة، يتفوق Kimi K2-Instr. بنسبة 97.4%، تلاه DeepSeek V3 بنسبة 94.0%، ثم GPT-4.1 بنسبة 92.4%. في اختبار المعرفة العامة MMLU بدون حد زمني، حقق GPT-4.1 أفضل أداء بنسبة 90.4%، يليه Kimi K2-Instr. بنسبة 89.5%، بينما جاء DeepSeek V3 في ذيل القائمة بنسبة 81.2%.

تفسير النتائج

في سيناريوهات البرمجة الواقعية، يتفوق Kimi K2 بشكل واضح على جميع نماذج المصادر المفتوحة السابقة ويتفوق على GPT-4.1 في SWE-bench Verified.
الرياضيات والتفكير الرمزي مثاليان تقريبًا؛ ويتفوق النموذج حتى على الأنظمة الاحتكارية في هذا الصدد.
من حيث المعرفة العالمية البحتة، لا يزال GPT-4.1 متقدماً قليلاً، لكن الفجوة أصغر من أي وقت مضى.

مهارات الوكيل في الحياة اليومية

تشرح العديد من برامج التعلم الآلي الأمور بشكل جيد ولكنها لا تتخذ إجراءات. تم تدريب كيمي كي 2 باستمرار على إكمال المهام بشكل مستقل - بما في ذلك استدعاء الأدوات وتنفيذ التعليمات البرمجية ومعالجة الملفات.

مثال 1: تخطيط رحلة عمل

يقوم النموذج بتقسيم الطلب ("حجز رحلة طيران وفندق وطاولة لثلاثة أشخاص في برلين") إلى 17 استدعاء API: التقويم، ومجمع الرحلات الجوية، وواجهة برمجة تطبيقات القطارات، وOpenTable، والبريد الإلكتروني للشركة، وجداول بيانات جوجل - دون هندسة يدوية للمطالبة.

المثال الثاني: تحليل البيانات

يتم استيراد ملف CSV يحتوي على 50,000 سجل بيانات رواتب، ثم يتم تحليله إحصائياً، وإنشاء رسم بياني، وحفظه كصفحة HTML تفاعلية. تتم العملية برمتها في محادثة واحدة.

لماذا هذا مهم؟

الإنتاجية: لا يقتصر نموذج الاستجابة على النص فقط، بل هو إجراء قابل للتنفيذ.
مقاومة الأخطاء: من خلال التدريب على التعلم المعزز في سير العمل، يتعلم Kimi K2 تفسير رسائل الخطأ وتصحيح نفسه.
التكاليف: يوفر النظام الآلي تكاليف عمليات التسليم البشري ويقلل من تكاليف السياق، حيث تقل الحاجة إلى الرحلات ذهابًا وإيابًا.

الترخيص والتكاليف والتبعات التشغيلية

رخصة

تخضع الأوزان لترخيص مشابه لترخيص معهد ماساتشوستس للتكنولوجيا. لا يشترط برنامج Moonshot سوى ظهور إشعار "Kimi K2" في واجهة المستخدم للمنتجات التي يزيد عدد مستخدميها النشطين شهريًا عن 100 مليون مستخدم أو التي تتجاوز إيراداتها الشهرية 20 مليون دولار. وهذا غير ذي صلة بمعظم الشركات الألمانية.

أسعار واجهة برمجة التطبيقات والاستضافة الذاتية

تختلف أسعار واجهات برمجة التطبيقات (APIs) والاستضافة الذاتية اختلافًا كبيرًا بين مزودي الخدمة. فبينما تتقاضى واجهة Moonshot API مبلغ 0.15 دولارًا أمريكيًا لكل مليون رمز مُدخل و2.50 دولارًا أمريكيًا لكل مليون رمز مُخرج، تبلغ تكلفة واجهة DeepSeek API 0.27 دولارًا أمريكيًا لكل رمز مُدخل و1.10 دولارًا أمريكيًا لكل رمز مُخرج. أما واجهة GPT-4 API فهي أغلى بكثير، حيث يبلغ متوسط تكلفتها 10.00 دولارات أمريكية لكل رمز مُدخل و30.00 دولارًا أمريكيًا لكل رمز مُخرج.

ومن الجدير بالذكر بشكل خاص الكفاءة الاقتصادية التي توفرها تقنية MoE: فقد أصبحت تكاليف الحوسبة السحابية تنافسية للغاية. ويوضح ذلك مثال عملي: يدفع المطور حوالي 0.005 دولار فقط مقابل محادثة بقيمة 2000 رمز مع Kimi K2، بينما تكلف المحادثة نفسها 4 دولارات مع GPT-4.

مواصفات الأجهزة للتشغيل الداخلي

النموذج الكامل (FP16): على الأقل 8 × H100 80 جيجابايت أو 4 × B200.
التكميم 4 بت: يعمل بثبات على 2 × H100 أو 2 × Apple M3 Ultra 512 GB.
محركات الاستدلال: تدعم كل من vLLM و SGLang و TensorRT-LLM بشكل أصلي Kimi K2.

التطبيقات العملية في أوروبا

الصناعة 4.0: يمكن نمذجة جداول الصيانة الآلية وتشخيص الأعطال وطلبات قطع الغيار كتدفق وكيل.
الشركات الصغيرة والمتوسطة: تقوم روبوتات الدردشة المحلية بالإجابة على استفسارات الموردين والعملاء في الوقت الفعلي دون إرسال البيانات إلى خوادم الولايات المتحدة.
الرعاية الصحية: تستخدم العيادات نظام Kimi K2 لترميز الرسائل الطبية، وحساب حالات DRG، وتنسيق المواعيد - كل ذلك في الموقع.
البحث والتدريس: تستضيف الجامعات النموذج في مجموعات الحوسبة عالية الأداء للسماح للطلاب بإجراء تجارب مجانية باستخدام أحدث نماذج LLM.
السلطات: تستفيد المؤسسات العامة من الأوزان مفتوحة المصدر، حيث تجعل لوائح حماية البيانات من الصعب استخدام نماذج الحوسبة السحابية الاحتكارية.

أفضل الممارسات للتشغيل الإنتاجي

تم وضع العديد من أفضل الممارسات لضمان التشغيل الفعال لأنظمة الذكاء الاصطناعي. بالنسبة لمساعدي الدردشة، يُنصح بضبط درجة الحرارة بين 0.2 و0.3 لضمان دقة الإجابات، مع ألا تتجاوز قيمة p العليا 0.8. أما بالنسبة لتوليد التعليمات البرمجية، فمن الضروري تحديد موجه النظام بوضوح، على سبيل المثال، باستخدام عبارة "أنت مساعد بايثون دقيق"، وإجراء اختبارات موثوقة. بالنسبة لاستدعاءات الأدوات، يجب تحديد مخطط JSON بدقة لضمان تنسيق النموذج لاستدعاءات الدوال بشكل صحيح. تعمل مسارات RAG بكفاءة عالية مع حجم بيانات لا يتجاوز 800 رمز، وإعادة ترتيب النتائج باستخدام مُشفِّر متقاطع مثل bge-RERANK-L قبل الاسترجاع. ولأغراض الأمان، من الضروري تنفيذ الأوامر الصادرة في بيئة معزولة، مثلاً في جهاز افتراضي يعمل بنظام Firecracker، لتقليل مخاطر حقن البرامج الضارة.

مناسب ل:

اقتصاد الذكاء الاصطناعي كقوة اقتصادية: تحليل التحول العالمي والتوقعات والأولويات الجيوسياسية

التحديات والحدود

بصمة الذاكرة

على الرغم من أن 32 مُعاملًا فقط من مُعاملات B نشطة، إلا أنه يجب على جهاز التوجيه الاحتفاظ بجميع أوزان الخبراء. لذلك، فإن الاستدلال باستخدام وحدة المعالجة المركزية فقط غير واقعي.

الاعتماد على الأدوات

تؤدي الأدوات المُعرّفة بشكل غير صحيح إلى حلقات لا نهاية لها؛ لذا فإن معالجة الأخطاء القوية أمر ضروري.

الهلوسة

مع وجود واجهات برمجة تطبيقات غير معروفة تمامًا، يمكن للنموذج أن يبتكر وظائف وهمية. هناك حاجة إلى مدقق صارم.

بند الترخيص

مع النمو القوي في عدد المستخدمين، قد يصبح شرط العلامة التجارية موضوعًا للنقاش.

الأخلاقيات وضوابط التصدير

كما أن هذه الانفتاحية تسهل التطبيقات التي قد تنطوي على إساءة استخدام؛ وتتحمل الشركات مسؤولية أنظمة التصفية.

المصادر المفتوحة كمحرك للابتكار

تُظهر خطوة شركة Moonshot AI أن النماذج المفتوحة لا تتخلف فقط عن البدائل الاحتكارية، بل إنها تهيمن بالفعل على بعض المجالات. ففي الصين، ينشأ نظام بيئي يضم جامعات وشركات ناشئة ومزودي خدمات سحابية، مما يُسرّع وتيرة التطوير من خلال البحث التعاوني والأسعار التنافسية.

وهذا يمنح أوروبا ميزة مزدوجة:

الوصول التكنولوجي دون احتكار من قبل مورد واحد وتحت سيادة البيانات الأوروبية.
يشير ضغط التكاليف على مقدمي الخدمات التجارية إلى أنه يمكن توقع أسعار عادلة للخدمات المماثلة على المدى المتوسط.

على المدى البعيد، يُتوقع ظهور نماذج وجودية (MoE) بقيمة تريليونات الدولارات، وربما نماذج متعددة الوسائط. إذا سار مشروع مونشوت على هذا النهج، فقد تُكشف تحسينات في مجال الرؤية أو الصوت. حينها، ستصبح المنافسة على أفضل "وكيل مفتوح المصدر" المحرك الرئيسي لاقتصاد الذكاء الاصطناعي.

لا مزيد من واجهات برمجة التطبيقات (APIs) باهظة الثمن ذات الصندوق الأسود: كيمي كيه 2 تُضفي طابعًا ديمقراطيًا على تطوير الذكاء الاصطناعي

يمثل Kimi K2 نقطة تحول: فهو يجمع بين الأداء المتميز والمرونة وإمكانية الوصول المفتوح إلى الأوزان في حزمة واحدة. بالنسبة للمطورين والباحثين والشركات في أوروبا، يعني هذا حرية اختيار حقيقية: فبدلاً من الاعتماد على واجهات برمجة التطبيقات (APIs) المعقدة والمكلفة، يمكنهم تشغيل وتخصيص ودمج بنية تحتية للذكاء الاصطناعي عالية الأداء وبأسعار معقولة في منتجاتهم. سيتمكن أولئك الذين يكتسبون خبرة مبكرة في سير العمل القائم على الوكلاء وبنى MoE التحتية من خلق ميزة تنافسية مستدامة في السوق الأوروبية.

مناسب ل:

شريكك العالمي في التسويق وتطوير الأعمال

☑️ لغة العمل لدينا هي الإنجليزية أو الألمانية

☑️ جديد: المراسلات بلغتك الوطنية!

Konrad Wolfenstein

سأكون سعيدًا بخدمتك وفريقي كمستشار شخصي.

يمكنك الاتصال بي عن طريق ملء نموذج الاتصال أو ببساطة اتصل بي على +49 89 89 674 804 (ميونخ) . عنوان بريدي الإلكتروني هو: ولفنشتاين ∂ xpert.digital

إنني أتطلع إلى مشروعنا المشترك.