DeepSeek-R1-0528: Ажурирање DeepSeek-а враћа кинески модел вештачке интелигенције на ранг са западним лидерима индустрије

Објављено: 31. маја 2025. / Ажурирано: 31. маја 2025. – Аутор: Konrad Wolfenstein

DeepSeek-R1-0528: Ажурирање DeepSeek-а враћа кинески модел вештачке интелигенције на ранг са западним лидерима у индустрији – Слика: Xpert.Digital

Вештачка интелигенција отвореног кода на својим границама: DeepSeek засенује OpenAI и Google

Од 60 до 68: DeepSeek катапултира кинеску вештачку интелигенцију назад на врх

Кинески стартап за вештачку интелигенцију DeepSeek достигао је значајну прекретницу објављивањем DeepSeek-R1-0528 28. маја 2025. године, редефинишући глобални пејзаж вештачке интелигенције. Ажурирање модела резоновања отвореног кода показује драматична побољшања перформанси, позиционирајући DeepSeek по први пут у ранг са OpenAI-јевим o3 и Google Gemini 2.5 Pro. Посебно је вредно напоменути да се ове врхунске перформансе постижу уз делић трошкова и са потпуно отвореним тежинама модела, што покреће фундаментална питања о будућности власничких вештачких система. Независна платформа за оцењивање Artificial Analysis оценила је нови модел са 68 поена – скок са 60 на 68 поена што одговара разлици у перформансама између OpenAI o1 и o3.

У вези са овим:

DeepSeek и Alibaba: Пробој на специјалистичком нивоу? Кинески продор вештачке интелигенције у здравству

Ажурирање и његова техничка побољшања

DeepSeek-R1-0528 представља значајно побољшање које постиже значајна побољшања перформанси кроз алгоритамске оптимизације и повећано коришћење рачунарских ресурса у пост-тренингу, без промене основне архитектуре. Ажурирање се првенствено фокусира на побољшање способности расуђивања, омогућавајући, према DeepSeek-у, „значајно дубље процесе размишљања“. Посебно импресиван пример овог побољшања види се на тесту из математике AIME 2025, где је тачност повећана са 70 процената на 87,5 процената. Истовремено, просечан број токена по питању повећан је са 12.000 на 23.000 токена, што указује на интензивнију обраду.

Поред побољшања резоновања, ажурирање уводи важне нове функционалности, укључујући JSON излаз и позиве функција, оптимизован кориснички интерфејс и смањене халуцинације. Ова побољшања чине модел знатно практичнијим за програмере и значајно проширују његов обим. Доступност остаје непромењена: Постојећи корисници API-ја ће аутоматски добити ажурирање, док ће тежине модела и даље бити доступне под отвореном MIT лиценцом на Hugging Face-у.

Референтне перформансе и поређења перформанси

Резултати бенчмарк тестова за DeepSeek-R1-0528 показују импресивна побољшања у свим категоријама евалуације. У математичким задацима, резултат на AIME-2024 тесту се повећао са 79,8 на 91,4 процента, на HMMT-2025 са 41,7 на 79,4 процента, а на CNMO-2024 са 78,8 на 86,9 процената. Ови резултати позиционирају модел као један од најмоћнијих вештачких система за решавање математичких проблема широм света.

DeepSeek-R1-0528 такође показује значајан напредак у програмским бенчмарковима. LiveCodeBench се побољшао са 63,5 на 73,3 процента, Aider-Polyglot са 53,3 на 71,6 процената, а SWE Verified са 49,2 на 57,6 процената. Codeforces оцена се попела са 1.530 на 1.930 поена, стављајући модел међу најбоље алгоритамске решаваче проблема. У поређењу са конкурентским моделима, DeepSeek-R1 постиже 49,2 процента у SWE Verified, стављајући га одмах испред OpenAI o1-1217 са 48,9 процената, док се у Codeforces-у, са 96,3 процентила и Elo оценом од 2.029 поена, веома приближава водећем моделу OpenAI-ја.

Тестови општег знања и логике потврђују опште побољшање перформанси: GPQA-Diamond је повећан са 71,5 на 81,0 проценат, Humanity's Last Exam са 8,5 на 17,7 процената, MMLU-Pro са 84,0 на 85,0 процената и MMLU-Redux са 92,9 на 93,4 процента. Само је OpenAI-јев SimpleQA показао благи пад са 30,1 на 27,8 процената. Ова свеобухватна побољшања показују да је DeepSeek-R1-0528 конкурентан не само у специјализованим областима већ и у целом спектру когнитивних задатака.

Техничка архитектура и иновације

Техничка основа DeepSeek-R1-0528 заснована је на софистицираној MoE (мешавина стручњака) архитектури са 37 милијарди активних параметара од укупно 671 милијарде параметара и дужином контекста од 128.000 токена. Модел имплементира напредно учење појачавањем како би се постигла самоверификација, вишестепена рефлексија и могућности резоновања сличне људским. Ова архитектура омогућава моделу да се носи са сложеним задацима резоновања кроз итеративне процесе размишљања, што га разликује од традиционалних језичких модела.

Посебно иновативан аспект је развој дестиловане варијанте, DeepSeek-R1-0528-Qwen3-8B, која је настала дестилацијом мисаоног процеса DeepSeek-R1-0528 за Qwen3-8B-Base након обуке. Ова мања верзија постиже импресивне перформансе са знатно нижим захтевима за ресурсима и ради на графичким процесорима са 8-12 GB VRAM-а. У тесту AIME 2024, модел је постигао најсавременије перформансе међу моделима отвореног кода, са побољшањем од 10 процената у односу на Qwen3-8B и упоредивим перформансама са Qwen3-235B-Thinking.

Методологија развоја показује да се DeepSeek све више ослања на пост-обуку са учењем појачањем, што је довело до повећања потрошње токена за 40% током евалуације – са 71 на 99 милиона токена. Ово сугерише да модел генерише дуже и дубље одговоре без потребе за фундаменталним архитектонским променама.

Тржишна позиција и конкурентска динамика

DeepSeek-R1-0528 се етаблира као озбиљан конкурент водећим власничким моделима западних технолошких компанија. Према подацима компаније Artificial Analysis, модел осваја 68 поена, што га ставља у ранг са Google Gemini 2.5 Pro и испред модела попут xAI-јевог Grok 3 mini, Meta-иног Llama 4 Maverick и Nvidia-иног Nemotron Ultra. У категорији кода, DeepSeek-R1-0528 достиже ниво одмах испод OpenAI-јевих o4-mini и o3.

Објављивање ажурирања имало је значајан утицај на глобални пејзаж вештачке интелигенције. Прво издање DeepSeek-R1 у јануару 2025. године већ је довело до пада акција технолошких компанија ван Кине и довело у питање претпоставку да скалирање вештачке интелигенције захтева огромну рачунарску снагу и инвестиције. Западни конкуренти су брзо реаговали: Google је увео снижене цене приступа за Gemini, док је OpenAI снизио цене и представио модел o3 Mini који захтева мање рачунарске снаге.

Занимљиво је да анализе стила текста из EQBench-а показују да је стил DeepSeek-R1 под јачим утицајем Google-а него OpenAI-а, што сугерише да је у његовом развоју можда коришћено више синтетичких Gemini излаза. Ово запажање наглашава сложене утицаје и трансфер технологије између различитих програмера вештачке интелигенције.

Исплативост и доступност

Кључна конкурентска предност DeepSeek-R1-0528 лежи у његовој изузетној исплативости. Његова структура цена је знатно повољнија од OpenAI-ове: улазни токени коштају 0,14 долара по милиону токена за погодке у кешу и 0,55 долара за промашаје кеша, док излазни токени коштају 2,19 долара по милиону токена. Поређења ради, OpenAI o1 наплаћује 15 долара за улазне токене и 60 долара за излазне токене по милиону, што DeepSeek-R1 чини 90-95 процената јефтинијим.

Мајкрософт Азуре такође нуди DeepSeek-R1 по конкурентним ценама: Глобална верзија кошта 0,00135 долара за улазне токене и 0,0054 долара за излазне токене на 1.000 токена, док регионална верзија има нешто више цене. Оваква цена чини модел посебно атрактивним за компаније и програмере који желе да искористе висококвалитетне функционалности вештачке интелигенције без високих трошкова власничких решења.

Његова доступност као модела отвореног кода под МИТ лиценцом такође омогућава комерцијалну употребу и модификацију без накнада за лиценцу. Програмери могу да покрећу модел локално или да га користе преко различитих АПИ-ја, нудећи флексибилност и контролу над имплементацијом. За кориснике са ограниченим ресурсима, доступна је дестилована верзија са 8 милијарди параметара, која ради на потрошачком хардверу са 24 ГБ меморије.

У вези са овим:

Кинески сустизај у вештачкој интелигенцији: Случај DeepSeek и стратешка употреба података

Кинески сустизање вештачке интелигенције: Шта значи успех DeepSeek-а

DeepSeek-R1-0528 означава прекретницу у глобалном развоју вештачке интелигенције, показујући да кинеске компаније могу да развију моделе који се такмиче са најбољим западним системима упркос америчким ограничењима извоза. Ажурирање доказује да су значајна побољшања перформанси могућа без фундаменталних архитектонских промена када се ефикасно примене оптимизације након обуке и учење са појачањем. Комбинација врхунских перформанси, драстично смањених трошкова и доступности отвореног кода фундаментално доводи у питање устаљене пословне моделе у индустрији вештачке интелигенције.

Реакције западних конкурената на успех DeepSeek-а већ показују почетне промене на тржишту: смањење цена од стране OpenAI-а и Google-а, као и развој модела који ефикасније користе ресурсе. Са очекиваним објављивањем DeepSeek-R2, првобитно планираним за мај 2025. године, овај конкурентски притисак би могао да се додатно појача. Прича о успеху DeepSeek-R1-0528 илуструје да иновације у вештачкој интелигенцији не захтевају нужно огромна улагања и рачунарске ресурсе, већ се могу постићи паметним алгоритмима и ефикасним методама развоја.

У вези са овим:

Ваш стручњак за трансформацију вештачке интелигенције, интеграцију вештачке интелигенције и индустрију платформи за вештачку интелигенцију

☑️ Наш пословни језик је енглески или немачки

☑️ НОВО: Преписка на вашем матерњем језику!

Konrad Wolfenstein

Ја и мој тим смо срећни што вам можемо бити на располагању као ваш лични саветник.

Можете ме контактирати попуњавањем контакт форме овде или једноставно позовите на +49 89 89 674 804 ( Минхен) . Моја имејл адреса је: [email protected]

Радујем се нашем заједничком пројекту.