Moonshot AI Kimi K2 tehisintellekti mudel: Hiina uus avatud lähtekoodiga lipulaev – järjekordne verstapost avatud tehisintellekti süsteemide jaoks

Konrad Wolfenstein

1 aasta tagasi

Tehisintellekti mudel Kimi K2: Hiina uus avatud lähtekoodiga lipulaev – järjekordne verstapost avatud tehisintellekti süsteemide jaoks – Pilt: Xpert.Digital

Triljoni parameetriga mudel Kimi K2 sillutab teed suveräänse tehisintellekti arendamisele Euroopas

Veel üks avatud lähtekoodiga revolutsioon: Kimi K2 toob Euroopa andmekeskustesse maailmatasemel tehisintellekti

Kimi K2 viib avatud tehisintellekti ökosüsteemi uuele tasemele. Selle ekspertide segu mudel triljoni parameetriga annab realistlikke programmeerimise, matemaatika ja agentide võrdlusnäitajaid, mis on võrdväärsed patenteeritud raskekahurväelastega – murdosa hinnaga ja täielikult avalikustatud kaaludega. See avab Saksamaa arendajatele ja ettevõtetele võimaluse ise hostida suure jõudlusega tehisintellekti teenuseid, integreerida neid olemasolevatesse protsessidesse ja arendada uusi tooteid.

Sellega seotud:

Hiinast pärit avatud lähtekoodiga tehisintellekt – kuidas DeepSeek tehnoloogiamaailma kaosesse ajab – vähem graafikaprotsessoreid, rohkem tehisintellekti võimsust

Miks Kimi K2 on midagi enamat kui lihtsalt järgmine suur tehisintellekti mudel

Samal ajal kui lääne laborid nagu OpenAI ja Anthropic peidavad oma parimaid mudeleid tasuliste API-de taha, kasutab Moonshot AI teistsugust lähenemisviisi: kõik kaalud on avalikult kättesaadavad modifitseeritud MIT-litsentsi alusel. See mitte ainult ei võimalda teaduslikku reprodutseeritavust, vaid võimaldab ka väikestel ja keskmise suurusega ettevõtetel luua oma järeldusklastreid või kasutada Kimi K2-te servastsenaariumides. Turuletoomine langeb kokku perioodiga, mil Hiina on end avatud lähtekoodiga õigusteaduse liikumise teerajajana kehtestamas; DeepSeek V3 peeti kuni juunini etaloniks ja nüüd tõstab Kimi K2 lati taas kõrgemale.

Arhitektuur ja koolitusmeetodid

Rekordtasemel ekspertide segu

Kimi K2 on üles ehitatud uuenduslikule ekspertsüsteemile, millel on 384 eksperti, kus iga märgi kohta on aktiivsed ainult kaheksa eksperti ja üks globaalne "jagatud ekspert". See arhitektuur võimaldab järeldusmootoril laadida mällu samaaegselt ainult 32 miljardit parameetrit, vähendades drastiliselt GPU koormust. Kuigi tihe 70 miljardi parameetriga mudel, mis töötab täistäpsusega, vajab juba kahte H100 GPU-d, saavutab Kimi K2 võrreldava või isegi parema kvaliteedi, hoolimata sellest, et sama GPU-ga töötab see vaid kolmandiku võrra väiksema koormusega.

Võrreldes teiste mudelitega on Kimi K2 efektiivsus selgelt ilmne: kokku 1 triljoni parameetriga ületab see DeepSeek V3-Base'i 671 miljardi parameetriga ja jääb alla GPT-4.1 hinnangulisele väärtusele, mis on umbes 1,8 triljonit parameetrit. Lisaks kasutab Kimi K2 tokeni kohta ainult 32 miljardit parameetrit, võrreldes DeepSeek V3-Base'i 37 miljardiga. Kimi K2 ekspertsüsteem kasutab 384 eksperti, kellest valitakse kaheksa, samas kui DeepSeek V3-Base kasutab 240 eksperti, kellest samuti valitakse kaheksa. Kõik kolm mudelit toetavad konteksti pikkust 128 000 tokenit.

See areng näitab, et Moonshot avaldab esmakordselt avaliku mudeli, millel on triljon parameetrit, jäädes samal ajal alla 40 miljardi parameetri piiri tokeni kohta, mis kujutab endast märkimisväärset edasiminekut suurte keelemudelite efektiivsuses.

MuonClip – stabiliseerimine uuel skaalal

Ülivõimsate MoE-trafode treenimine kannatab sageli tähelepanulogide plahvatusliku suurenemise all. Seetõttu ühendab Moonshot tokenipõhise efektiivse Muoni optimeerija allavoolu suunatud "qk-clip" ümberskaleerimisprotsessiga, mis normaliseerib päringu ja võtme maatriksid pärast iga sammu. Moonshot'i andmetel ei esinenud 15,5 triljoni treeningtokeni jooksul ühtegi kadude kasvu. Tulemuseks on äärmiselt sujuv õppimiskõver ja mudel, mis on olnud stabiilne alates selle esmasest avaldamisest.

andmebaas

15,5 triljoni tokeniga saavutab Kimi K2 GPT-4 klassi mudelite andmemahu. Lisaks klassikalisele veebitekstile ja -koodile kaasati eelkoolitusse agendi pädevuse kindlakstegemiseks simuleeritud tööriistakõned ja töövoo dialoogid. Erinevalt DeepSeek R1-st ei põhine agendi pädevus seega peamiselt mõtteahela järelevalvel, vaid pigem õppestsenaariumidel, kus mudel pidi orkestreerima mitut API-t.

Võrdlustulemuste üksikasjalik kirjeldus

Võrdlustulemused näitavad kolme tehisintellekti mudeli detailseid võrdlusi erinevates ülesannete valdkondades. Programmeerimises saavutab Kimi K2-Instr. SWE-bench Verified Testis edukuse määra 65,8 protsenti, samas kui DeepSeek V3 saab tulemuseks 38,8 protsenti ja GPT-4.1 54,6 protsenti. LiveCodeBench v6-s juhib Kimi K2-Instr. 53,7 protsendiga, millele järgnevad DeepSeek V3 49,2 protsendiga ja GPT-4.1 44,7 protsendiga. Tööriistade sidumise testis saavutab Tau2 Retail nelja katse keskmisega parima tulemuse GPT-4.1 74,8 protsendiga, edestades napilt Kimi K2-Instr.-i 70,6 protsendiga ja DeepSeek V3 69,1 protsendiga. Matemaatikakategoorias MATH-500 täpse vaste leidmisega domineerib Kimi K2-Instr. 97,4 protsendiga järgnesid DeepSeek V3 94,0 protsendiga ja GPT-4.1 92,4 protsendiga. MMLU üldteadmiste testis ilma ajapiiranguta saavutas parima tulemuse GPT-4.1 90,4 protsendiga, talle järgnes tihedalt Kimi K2-Instr. 89,5 protsendiga, samas kui DeepSeek V3 oli 81,2 protsendiga viimane.

Tulemuste tõlgendamine

Realistlikes kodeerimisstsenaariumides edestab Kimi K2 selgelt kõiki varasemaid avatud lähtekoodiga mudeleid ja edestab SWE-bench Verified testis GPT-4 .1.
Matemaatika ja sümboolne mõtlemine on peaaegu täiuslikud; mudel ületab selles osas isegi patenteeritud süsteeme.
Puhtalt maailma tundmise poolest on GPT-4 .1 endiselt veidi ees, kuid vahe on väiksem kui kunagi varem.

Agendioskused igapäevaelus

Paljud õigusteaduse magistrid selgitavad asju hästi, aga ei tegutse. Kimi K2-t treeniti järjepidevalt ülesannete autonoomseks täitmiseks – sealhulgas tööriistade kutsumiseks, koodi käivitamiseks ja failidega manipuleerimiseks.

Näide 1: Ärireisi planeerimine

Mudel jagab päringu („Broneeri lend, hotell ja laud kolmele inimesele Berliinis“) 17 API-päringuks: kalender, lendude koondaja, rongi API, OpenTable, ettevõtte e-post, Google Sheets – ilma käsitsi päringute loomiseta.

Näide 2: Andmete analüüs

Imporditakse 50 000 palgaandmekirjet sisaldav CSV-fail, mida analüüsitakse statistiliselt, genereeritakse graafik ja salvestatakse interaktiivse HTML-lehena. Kogu protsess toimub ühe vestlusvooru jooksul.

Miks see oluline on?

Produktiivsus: Mudeli vastus ei ole lihtsalt tekst, vaid käivitatav toiming.
Vigade kindlus: RL-koolituse kaudu töövoogude kohta õpib Kimi K2 veateateid tõlgendama ja ennast parandama.
Kulud: Automaatne agent säästab inimeste poolt tehtavatelt andmeedastustelt ja vähendab kontekstikulusid, kuna on vaja vähem edasi-tagasi reise.

Litsentsimine, kulud ja tegevusega seotud tagajärjed

Litsents

Kaaludele kehtib MIT-laadne litsents. Moonshot nõuab kasutajaliideses nähtavat "Kimi K2" teadet ainult toodete puhul, millel on üle 100 miljoni aktiivse kasutaja kuus või üle 20 miljoni dollari suurune kuusissetulek. See on enamiku Saksa ettevõtete jaoks ebaoluline.

API ja isehostimise hinnakujundus

API ja isehostimise hinnad on pakkujate lõikes väga erinevad. Kui Moonshot API maksab 0,15 dollarit miljoni sisendtokeni ja 2,50 dollarit miljoni väljundtokeni kohta, siis DeepSeek API maksab 0,27 dollarit sisendi ja 1,10 dollarit väljundi kohta. GPT-4 API on märkimisväärselt kallim, keskmiselt 10,00 dollarit sisendi ja 30,00 dollarit väljundi kohta.

Eriti tähelepanuväärne on MoE-tehnoloogia pakutav kulutõhusus: pilveteenuste hinnad on muutunud äärmiselt konkurentsivõimeliseks. Seda illustreerib praktiline näide: arendaja maksab Kimi K2-ga 2000-žetoonilise vestluse eest vaid umbes 0,005 dollarit, samas kui GPT-4-ga maksab sama vestlus neli dollarit.

Riistvaraprofiil ettevõttesiseseks kasutamiseks

Täismudel (FP16): vähemalt 8 × H100 80 GB või 4 × B200.
4-bitine kvantiseerimine: töötab stabiilselt 2 × H100 või 2 × Apple M3 Ultra 512 GB kõvakettal.
Järeldusmootorid: vLLM, SGLang ja TensorRT-LLM toetavad natiivselt Kimi K2.

Praktilised rakendused Euroopas

Tööstus 4.0: Automatiseeritud hooldusgraafikuid, rikete diagnostikat ja varuosade tellimusi saab modelleerida agendivoona.
Väikesed ja keskmise suurusega ettevõtted (VKEd): Kohalikud vestlusrobotid vastavad tarnijate ja klientide päringutele reaalajas ilma andmeid USA serveritesse saatmata.
Tervishoid: Kliinikud kasutavad Kimi K2-e meditsiiniliste kirjade kodeerimiseks, DRG-juhtude arvutamiseks ja vastuvõttude koordineerimiseks – kõik kohapeal.
Teadustöö ja õpetamine: Ülikoolid majutavad mudelit HPC klastrites, et võimaldada üliõpilastel teha tasuta katseid tipptasemel õigusteaduse magistriõppe üliõpilastega.
Ametivõimud: Avalikud asutused saavad avatud lähtekoodiga tarkvarast kasu, kuna andmekaitse-eeskirjad raskendavad patenteeritud pilvemudelite kasutamist.

Parimad tavad produktiivseks tööks

Tehisintellekti süsteemide produktiivseks tööks on kehtestatud mitu parimat tava. Vestlusassistentide puhul peaks temperatuur olema seatud vahemikku 0,2–0,3, et tagada faktilised vastused, samas kui maksimaalne p-väärtus peaks olema maksimaalselt 0,8. Koodi genereerimiseks on oluline süsteemiviiba selgelt määratleda, näiteks käsuga „Sa oled täpne Pythoni assistent“, ja rakendada usaldusväärseid teste. Tööriistakõnede puhul tuleb JSON-skeem rangelt määratleda, et mudel vormindaks funktsioonikõnesid õigesti. RAG-torustikud toimivad kõige paremini, kui tüki suurus ei ületa 800 märki ja enne otsingut toimub ümberjärjestamine ristkodeerijaga, näiteks bge-RERANK-L. Turvalisuse huvides on oluline väljaminevaid käske käivitada liivakastis, näiteks Firecrackeri virtuaalmasinas, et minimeerida süstimisriske.

Sellega seotud:

Tehisintellekti majandus kui majandusjõud: globaalsete muutuste analüüs, prognoosid ja geopoliitilised prioriteedid

Väljakutsed ja piirangud

Mälu jalajälg

Kuigi aktiivsed on ainult 32 B-parameetrit, peab ruuter säilitama kõik ekspertkaalud. Seega on puhas protsessoripõhine järeldamine ebareaalne.

Tööriista sõltuvus

Valesti defineeritud tööriistad viivad lõputute tsükliteni; töökindel veakäsitlus on hädavajalik.

Hallutsinatsioonid

Täiesti tundmatute API-de korral saab mudel leiutada fantoomfunktsioone. Vaja on ranget validaatorit.

Litsentsiklausel

Tugeva kasutajaskonna kasvu korral võib brändingu nõue muutuda aruteluteemaks.

Eetika ja ekspordikontroll

See avatus soodustab ka potentsiaalselt kuritahtlikke rakendusi; ettevõtted vastutavad filtrisüsteemide eest.

Avatud lähtekood innovatsiooni mootorina

Moonshot AI samm näitab, et avatud mudelid mitte ainult ei jää patenteeritud alternatiividest maha, vaid domineerivad juba teatud valdkondades. Hiinas on tekkimas ülikoolide, idufirmade ja pilveteenuse pakkujate ökosüsteem, mis kiirendab arengut koostööl põhineva uurimistöö ja agressiivse hinnakujunduse kaudu.

See annab Euroopale kahekordse eelise:

Tehnoloogiline juurdepääs ilma tarnijast sõltuvuseta ja Euroopa andmesuveräänsuse alusel.
Kommertsteenuse pakkujatele avaldatav kulusurve viitab sellele, et keskpikas perspektiivis võib oodata võrreldavate teenuste õiglasi hindu.

Pikemas perspektiivis võime oodata triljonite dollarite väärtuses eksistentsimudelite (MoE) tekkimist, võib-olla isegi multimodaalsete mudelite tekkimist. Kui Moonshot seda trendi järgib, võidakse avalikustada nägemis- või heli täiustusi. Sel hetkel saab parima "avatud agendi" nimel peetavast konkurentsist tehisintellekti majanduse keskne liikumapanev jõud.

Kallimad musta kasti API-d enam puuduvad: Kimi K2 demokratiseerib tehisintellekti arendust

Kimi K2 tähistab pöördepunkti: see ühendab tippjõudluse, paindlikkuse ja avatud raskusastmed ühes paketis. Euroopa arendajatele, teadlastele ja ettevõtetele tähendab see tõelist valikuvabadust: kallite musta kasti API-de asemel saavad nad hallata, kohandada ja integreerida taskukohase ja suure jõudlusega tehisintellekti aluse oma toodetesse. Need, kes saavad varase kogemuse agendipõhiste töövoogude ja MoE infrastruktuuridega, loovad Euroopa turul jätkusuutliku konkurentsieelise.

Sellega seotud:

Teie globaalne turundus- ja äriarenduspartner

☑️ Meie ärikeel on inglise või saksa keel

☑️ UUS: Kirjavahetus teie emakeeles!

Konrad Wolfenstein

Mina ja minu meeskond oleme hea meelega teie käsutuses teie isikliku nõustajana.

Võite minuga ühendust võtta, täites siinse kontaktvormi wolfenstein@xpert.digital:või helistades mulle numbril +49 7348 4088 965. Minu e-posti aadress on

Ootan põnevusega meie ühist projekti.

Moonshot AI Kimi K2 tehisintellekti mudel: Hiina uus avatud lähtekoodiga lipulaev – järjekordne verstapost avatud tehisintellekti süsteemide jaoks

Triljoni parameetriga mudel Kimi K2 sillutab teed suveräänse tehisintellekti arendamisele Euroopas

Veel üks avatud lähtekoodiga revolutsioon: Kimi K2 toob Euroopa andmekeskustesse maailmatasemel tehisintellekti