MoonShot AI'dan Ki Model Kimi K2: Çin'den yeni açık kaynak amiral gemisi-açık AI Systems için başka bir kilometre taşı

Konrad Wolfenstein

5 ay önce

KI Modeli Kimi K2: Çin'den yeni açık kaynak amiral gemisi-Açık Ki Sistemleri için başka bir kilometre taşı-IMAGE: Xpert.digital

Trilyon parametre modeli Kimi K2 Avrupa'da egemen AI gelişimi için uzağa kaldırıldı

Başka bir Açık Kaynak Devrimi: Kimi K2, Avrupa Veri Merkezlerine Dünya Sınıfı Yapay zeka getiriyor

Kimi K2 açık AI ekosistemini yeni bir seviyeye getiriyor. Bir trilyon parametreli ekspertler modeli, gerçekçi programlamada, matematik ve ajan ölçümlerinde maliyetlerin bir kısmı ve tam olarak yayınlanmış ağırlıklarla tescilli ağır ağırlıklarla sonuçlar verir. Almanya'daki geliştiriciler için bu, yüksek performanslı AI hizmetlerine ev sahipliği yapma, mevcut süreçleri yerleştirme ve yeni ürünler geliştirme fırsatı açıyor.

İçin uygun:

Çin'den açık kaynaklı yapay zeka – DeepSeek teknoloji dünyasını bu şekilde kaosa sürükleiyor: daha az GPU, daha fazla yapay zeka gücü

Kimi K2 neden bir sonraki Big AI modelinden daha fazlası

OpenAAI ve Antropik gibi Batılı laboratuvarlar ücretli arayüzlerin arkasındaki en iyi modellerini saklarken, Monshot AI farklı bir kurs izliyor: Tüm ağırlıklar modifiye edilmiş bir ortak lisans altında herkese açıktır. Bu adım sadece bilimsel tekrarlanabilirliği mümkün kılmakla kalmaz, aynı zamanda küçük ve orta ölçekli şirketlerin kendi çıkarım kümelerini oluşturmalarını veya Kimi K2'yi kenar senaryolarında kullanmalarını sağlar. Başlangıç, Çin'in açık kaynak LLM hareketinin saati olarak kurulduğu bir aşamaya girer; Deepseek V3, Haziran ayına kadar bir ölçüt olarak kabul edildi, şimdi Kimi K2 çapraz çubuğu tekrar ayarlıyor.

Mimarlık ve Eğitim Süreci

Kayıt seviyesinde uzman karışımı

Kimi K2, 384 uzmanla yenilikçi bir uzman sistemine dayanır, burada sadece sekiz uzman ve küresel bir "ortak uzman" jeton başına aktiftir. Bu mimari, çıkarım motorunun aynı anda RAM'e sadece 32 milyar parametre yüklemesini sağlar, bu da GPU yükünü büyük ölçüde azaltır. Tam hassasiyette yoğun 70 milyar parametre modeli zaten iki H100 GPU gerektirirken, KIMI K2, aynı GPU'lardaki ağırlıkların sadece üçte birini yürütmesine rağmen karşılaştırılabilir veya daha iyi kalite elde eder.

Diğer modellerle karşılaştırıldığında, KIMI K2'nin verimliliği belirgindir: Toplam 1000 milyar parametre ile Deepseek V3-baz 671 milyar parametreyi aşar ve yaklaşık 1.800 milyar parametreye sahip GPT-4.1'in tahmini değerinin altındadır. Kimi K2 ile, Deepseek V3 tabanında 37 milyar'a kıyasla jeton başına sadece 32 milyar parametre aktif kalıyor. KIMI K2 uzman sistemi, sekizi seçilen 384 uzman kullanırken, Deepseek V3-temel sekiz seçilmiş 240 uzman kullanıyor. Her üç model de 128k jeton bağlam uzunluğunu desteklemektedir.

Bu gelişme, MoonShot'un ilk kez trilyon parametreleri olan bir kamu modelini yayınladığını ve hala büyük dil modellerinin verimliliğinde önemli bir ilerleme olan jeton başına 40 milyar parametre sınırının altında kaldığını gösteriyor.

Muonclip - Yeni bir standartta stabilizasyon

Süper güçlü MOE transformatörlerinin eğitimi genellikle dikkat kayıtlarını patlatır. Bu nedenle MoonShot, jeton etkili muon optimizerini, her adımdan sonra sorguyu ve anahtar matrislerini normalleştiren bir akış aşağı "QK-Clip" frralizasyonu ile birleştirir. MoonShot'a göre, 15.5 trilyon eğitim jetonunda tek bir kayıp artışı görünmedi. Sonuç, son derece pürüzsüz bir öğrenme eğrisi ve ilk sürümden stabil çalışan bir modeldir.

Veritabanı

15.5 trilyon jeton ile KIMI K2, GPT-4 sınıf modellerinin veri hacmine ulaşır. Klasik Web metni ve koduna ek olarak, simüle edilmiş araç çağrıları ve iş akışı diyalogları, harekete geçme yeteneğine sabitlemek için ön eğitime aktı. Deepseek R1'in aksine, ajan yeterliliği öncelikle sallama zinciri denetimine dayanmaktadır, ancak modelin birkaç API'yi düzenlemesi gereken öğrenme senaryolarına dayanmaktadır.

Benchmark hizmetleri ayrıntılı

Benchmark hizmetleri, farklı sorumluluk alanlarındaki üç AI modeli arasında ayrıntılı karşılaştırmalar göstermektedir. Programlama alanında, Kimi K2-Instr. SWE-Bench doğrulanmış testte, yüzde 65,8 başarı oranı, Deepseek V3 ise yüzde 38,8 ve GPT-4.1 ile yüzde 54.6 ile gerçekleştirildi. LiveCodebench V6, Kimi K2-Instr. Yüzde 53,7 ile, bunu yüzde 49.2 ile Deepseek V3 ve yüzde 44.7 ile GPT-4.1. Tau2 perakende testinde ortalama dört denemeyle takım bağlantısında, GPT-4.1, KIMI K2-Instr'in hemen önünde yüzde 74,8 ile en iyi performansı elde eder. Yüzde 70,6 ve Deepseek V3 ile yüzde 69,1 ile. Math-500 Matematik kategorisinde kesin bir anlaşma ile Kimi K2-Instr. Yüzde 97,4 ile yüzde 94.0 ile Deepseek V3 ve yüzde 92.4 ile GPT-4.1. Yansıma dönemi olmayan genel bilgi testinde MMLU, GPT-4.1 yüzde 90.4'ü en iyi şekilde yapar ve bunu Kimi K2-Instr izler. Yüzde 89,5 ile Deepseek V3, yüzde 81,2 ile dipleri oluşturur.

Sonuçların yorumlanması

Gerçekçi kodlama senaryolarında, KIMI K2 açıkça önceki tüm açık kaynak modellerinin önündedir ve SWE-Bench'te GPT-4 .1'i doğrular.
Matematik ve sembolik düşünme neredeyse mükemmeldir; Model ayrıca tescilli sistemleri aşıyor.
Saf dünya bilgisi ile GPT-4 .1 hala önde, ancak mesafe her zamankinden daha küçük.

Günlük yaşamda ajan becerileri

Birçok LLM iyi açıklar, ancak hareket etmeyin. Kimi K2, araç çağrıları, kod versiyonu ve dosya uyarlaması da dahil olmak üzere görevleri özerk bir şekilde bitirmek için sürekli olarak eğitildi.

Örnek 1: İş gezisi planlaması

Model, 17 API çağrısında bir soruşturmayı ("Berlin'de üç kişi için kitap uçuşu, otel ve masa") söküyor: takvim, uçuş toplayıcısı, tren API, OpenTable, Şirket e-postası, Google sayfaları manuel hızlı mühendislik.

Örnek 2: Veri analizi

50.000 maaş veri setine sahip bir CSV okunur, istatistiksel olarak değerlendirilir, üretilen ve etkileşimli bir HTML sayfası olarak kaydedilen bir arsa. Tüm zincir tek bir sohbet spor salonunda çalışır.

Bu neden önemli?

Verimlilik: Model yanıtı sadece metin değil, yürütülebilir bir eylemdir.
Hata Sağlamlığı: İş akışları üzerindeki RL eğitimi aracılığıyla Kimi K2, hata mesajlarını yorumlamayı ve kendilerini düzeltmeyi öğrenir.
Maliyet: Otomatik bir ajan, daha az tur gezisi gerekli olduğundan insan devirini tasarrufu sağlar ve bağlam maliyetlerini azaltır.

Lisans, maliyetler ve operasyonel sonuçlar

Lisans

Ağırlıklar MIT benzeri bir lisansa tabidir. Yalnızca aylık 100 milyondan fazla aktif kullanıcısı veya ayda 20 milyon dolardan fazla satışa sahip ürünler için MoonShot'u kullanıcı arayüzünde görünür bir "Kimi K2" notu gerektirir. Bu çoğu Alman şirketi için alakasızdır.

API ve kendi kendine barınma fiyatları

API ve kendi kendine barındırma fiyatları sağlayıcılar arasında açık farklılıklar göstermektedir. Monshot API, girdi jetonları için 0,15 $ ve milyon başına çıktı jetonları için 2,50 $ hesaplarken, Deepseek-APi giriş için 0.27 $ ve çıktı için 1.10 USD'dir. Girdi için ortalama 10,00 dolar ve çıktı için 30,00 $ ile GPT-4 O API önemli ölçüde daha pahalıdır.

MOE teknolojisi yoluyla maliyet verimliliği özellikle dikkat çekicidir: bulut maliyetleri son derece rekabetçi hale geldi. Pratik bir örnek şunu gösteriyor: Bir geliştirici, Kimi K2 ile 2.000 token sohbeti için sadece yaklaşık 0,005 $ öderken, GPT-4 ile aynı sohbet dört dolara mal oluyor.

Şirket içi çalışma için donanım profili

Tam model (FP16): En az 8 × H100 80 GB veya 4 × B200.
4 bit nicemleme: 2 × H100 veya 2 × Apple M3 Ultra 512 GB üzerinde sabit çalışır.
Çıkarım Motoru: VLLM, Sglang ve Tensorrt-LLM Destek Kimi K2'yi yerel olarak destekler.

Avrupa'da pratik uygulama alanları

Endüstri 4.0: Otomatik bakım planları, hata teşhisleri ve yedek parça siparişleri bir ajan akışı olarak modellenebilir.
Orta ölçekli işletmeler: Yerel sohbet botları, ABD sunucularına veri göndermeden tedarikçi ve müşteri sorularını gerçek zamanlı olarak cevaplar.
Sağlık Hizmetleri: Klinikler, doktorun mektuplarını kodlamak için KIMI K2'yi, DRG vakalarının hesaplanmasını ve tesislerde her şey randevu koordinasyonunu kullanır.
Araştırma ve Öğretim: Üniversiteler, öğrencilerin en son LLM'lerle ücretsiz deneyler sağlamak için HPC kümelerinde modeli ağırlamaktadır.
Yetkililer: Veri koruma gereksinimleri tescilli bulut modellerini kullanmayı zorlaştırdığı için kamu kurumları kaynak açısından açık ağırlıklardan yararlanmaktadır.

Üretken operasyon için en iyi uygulamalar

Çeşitli kanıtlanmış uygulamalar kendilerini AI sistemlerinin üretken çalışması için oluşturmuştur. Sohbet asistanları söz konusu olduğunda, gerçek cevaplar sağlamak için sıcaklık 0.2 ila 0.3 olarak ayarlanmalıdır, en üst p değeri maksimum 0,8 olmalıdır. Kod üretimi için, örneğin “Kesin bir Python Asistansınız” öğretimiyle sistem istemini açıkça tanımlamak ve güvenilir testler uygulamak çok önemlidir. Araç çağrıları söz konusu olduğunda, JSON şeması, model formatlarının doğru şekilde çağrılarını oluşturması için kesinlikle belirtilmelidir. RAG boru hatları en iyi 800 jeton ve geri almadan önce BGE-Rerank-L gibi çapraz kodlayıcı ile yeniden rütbe ile çalışır. Güvenlik için, enjeksiyon risklerini en aza indirmek için, örneğin bir havai fişek VM'de bir kum havuzunda giden komutları yapmak önemlidir.

İçin uygun:

Ekonomik bir güç olarak AI ekonomisi: küresel dönüşüm, tahminler ve jeopolitik önceliklerin analizi

Zorluklar ve sınırlar

Hafıza Ayak İzi

Sadece 32 b parametre aktif olmasına rağmen, yönlendirici tüm uzman ağırlıklarını tutmalıdır. Bu nedenle saf bir CPU çıkarımı gerçekçi değildir.

Araç Bağımlılığı

Yanlış tanımlanmış araçlar sonsuz döngülere yol açar; Sağlam hata işleme zorunludur.

Halüsinasyonlar

Tamamen bilinmeyen API'lerde, model işlevleri icat edebilir. Sıkı bir doğrulayıcı gereklidir.

Lisans Maddesi

Güçlü kullanıcı büyümesi ile marka yükümlülüğü tartışmalı olabilir.

Etik ve İhracat Kontrolleri

Açıklık da potansiyel olarak uygunsuz uygulamalar yapar; Şirketler filtre sistemlerinden sorumludur.

İnovasyon motoru olarak açık kaynak

MoonShot AI'nın adımı, açık modellerin sadece tescilli alternatiflerden sonra değil, aynı zamanda belirli alanlara da hakim olduğunu göstermektedir. Çin'de, gelişimi ortak araştırmalar ve agresif fiyatlandırma ile hızlandıran üniversitelerden, yeni başlayanlardan ve bulut sağlayıcılarından bir ekosistem oluşturuluyor.

Avrupa için çifte bir avantaj var:

Tedarikçi kilitlenmeden ve Avrupa veri egemenliği altında teknolojik erişim.
Ticari sağlayıcıların maliyet baskısı, karşılaştırılabilir performansla orta vadeli adil fiyatlarda beklenebilecek.

Uzun vadede, belki de çok modlu olan diğer trilyon-moe modellerinin görünmesi beklenebilir. MoonShot eğilimi takip ederse, vizyon veya ses uzantıları açılabilir. En geç o zaman en iyi “açık ajan” yarışma AI ekonomisinin merkezi itici gücü oldu.

Daha pahalı kara kutu API'leri yok: Kimi K2 Demokratik AI gelişimi

Kimi K2 bir dönüm noktasını işaret eder: En iyi performansı, hareket etme yeteneği ve ağırlıkları tek bir pakette birleştirir. Avrupa'daki geliştiriciler, araştırmacılar ve şirketler için bu gerçek seçim özgürlüğü anlamına gelir: Pahalı kara kutu API'lerine güvenmek yerine, uygun fiyatlı, güçlü bir AI temeli kendiniz işletebilir, uyarlayabilir ve entegre edebilirsiniz. Erken bir aşamada ajan iş akışları ve MOE altyapıları ile deneyim kazanan herkes, Avrupa pazarında sürdürülebilir bir rekabet avantajı yaratır.

İçin uygun:

Küresel pazarlama ve iş geliştirme ortağınız

☑️İş dilimiz İngilizce veya Almancadır

☑️ YENİ: Ulusal dilinizde yazışmalar!

Konrad Wolfenstein

Size ve ekibime kişisel danışman olarak hizmet etmekten mutluluk duyarım.

iletişim formunu doldurarak benimle iletişime geçebilir +49 89 89 674 804 (Münih) numaralı telefondan beni arayabilirsiniz . E-posta adresim: wolfenstein ∂ xpert.digital

Ortak projemizi sabırsızlıkla bekliyorum.

MoonShot AI'dan Ki Model Kimi K2: Çin'den yeni açık kaynak amiral gemisi-açık AI Systems için başka bir kilometre taşı

Trilyon parametre modeli Kimi K2 Avrupa'da egemen AI gelişimi için uzağa kaldırıldı

Başka bir Açık Kaynak Devrimi: Kimi K2, Avrupa Veri Merkezlerine Dünya Sınıfı Yapay zeka getiriyor