DeepSeek-R1-0528: Актуализацията на DeepSeek връща китайския модел на изкуствен интелект наравно със западните лидери в индустрията

Публикувано на: 31 май 2025 г. / Актуализирано на: 31 май 2025 г. – Автор: Konrad Wolfenstein

DeepSeek-R1-0528: Актуализацията на DeepSeek връща китайския модел на изкуствен интелект наравно със западните лидери в индустрията – Изображение: Xpert.Digital

Изкуствен интелект с отворен код на предела си: DeepSeek засенчва OpenAI и Google

От 60 до 68: DeepSeek катапултира китайския изкуствен интелект обратно на върха

Китайският стартъп за изкуствен интелект DeepSeek достигна значителен етап с пускането на DeepSeek-R1-0528 на 28 май 2025 г., предефинирайки глобалния пейзаж на изкуствения интелект. Актуализацията на модела за разсъждение с отворен код демонстрира драматични подобрения в производителността, позиционирайки DeepSeek за първи път наравно с o3 на OpenAI и Google Gemini 2.5 Pro. Особено забележително е, че тази пикова производителност се постига на част от цената и с напълно отворени тегла на модела, което повдига фундаментални въпроси относно бъдещето на собствените системи с изкуствен интелект. Независимата платформа за оценки Artificial Analysis оцени новия модел с 68 точки – скок от 60 на 68 точки, което съответства на разликата в производителността между OpenAI o1 и o3.

Свързано с това:

DeepSeek и Alibaba: Пробив на специализирано ниво? Китайският тласък на изкуствения интелект в здравеопазването

Актуализацията и нейните технически подобрения

DeepSeek-R1-0528 представлява съществено подобрение, което постига значителни подобрения в производителността чрез алгоритмични оптимизации и увеличено използване на изчислителни ресурси в пост-обучителния процес, без да променя основната архитектура. Актуализацията се фокусира основно върху подобряване на способностите за разсъждение, което според DeepSeek позволява „значително по-задълбочени мисловни процеси“. Особено впечатляващ пример за това подобрение се вижда в теста по математика AIME 2025, където точността се е увеличила от 70% на 87,5%. Едновременно с това средният брой токени на въпрос се е увеличил от 12 000 на 23 000 токена, което показва по-интензивна обработка.

В допълнение към подобренията в разсъжденията, актуализацията въвежда важни нови функционалности, включително JSON изход и извиквания на функции, оптимизиран потребителски интерфейс и намалени халюцинации. Тези подобрения правят модела значително по-практичен за разработчиците и значително разширяват обхвата му. Наличността остава непроменена: Съществуващите потребители на API ще получават актуализацията автоматично, докато теглата на модела ще продължат да бъдат достъпни под отворения MIT лиценз на Hugging Face.

Сравнение на производителността и бенчмарк резултати

Резултатите от бенчмарк тестовете за DeepSeek-R1-0528 показват впечатляващи подобрения във всички категории за оценяване. При математическите задачи резултатът на AIME-2024 се е увеличил от 79,8 на 91,4%, на HMMT-2025 от 41,7 на 79,4%, а на CNMO-2024 от 78,8 на 86,9%. Тези резултати позиционират модела като една от най-мощните системи с изкуствен интелект за решаване на математически проблеми в световен мащаб.

DeepSeek-R1-0528 също показва значителен напредък в бенчмарковете за програмиране. LiveCodeBench се подобри от 63,5 на 73,3 процента, Aider-Polyglot от 53,3 на 71,6 процента, а SWE Verified от 49,2 на 57,6 процента. Рейтингът на Codeforces се покачи от 1530 на 1930 точки, което поставя модела сред най-добрите алгоритмични решавачи на проблеми. В сравнение с конкурентните модели, DeepSeek-R1 постига 49,2 процента в SWE Verified, което го поставя точно пред OpenAI o1-1217 с 48,9 процента, докато в Codeforces, с 96,3 процентила и Elo рейтинг от 2029 точки, той се доближава много до водещия модел на OpenAI.

Тестовете за общи знания и логика потвърждават широкото подобрение в производителността: GPQA-Diamond се е увеличил от 71,5 на 81,0 процента, Humanity's Last Exam от 8,5 на 17,7 процента, MMLU-Pro от 84,0 на 85,0 процента и MMLU-Redux от 92,9 на 93,4 процента. Само SimpleQA на OpenAI показа лек спад от 30,1 на 27,8 процента. Тези всеобхватни подобрения показват, че DeepSeek-R1-0528 е конкурентен не само в специализирани области, но и в целия спектър от когнитивни задачи.

Техническа архитектура и иновации

Техническата основа на DeepSeek-R1-0528 е базирана на усъвършенствана MoE (Mixture of Experts) архитектура с 37 милиарда активни параметъра от общо 671 милиарда параметъра и дължина на контекста от 128 000 токена. Моделът внедрява усъвършенствано обучение с подсилване, за да постигне самопроверка, многоетапно отражение и човешки възможности за разсъждение. Тази архитектура позволява на модела да се справя със сложни задачи за разсъждение чрез итеративни процеси на мислене, което го отличава от традиционните езикови модели.

Особено иновативен аспект е разработването на дестилиран вариант, DeepSeek-R1-0528-Qwen3-8B, който е създаден чрез дестилиране на мисловния процес на DeepSeek-R1-0528 за пост-обучение Qwen3-8B-Base. Тази по-малка версия постига впечатляваща производителност със значително по-ниски изисквания за ресурси и работи на графични процесори с 8-12 GB VRAM. В теста AIME 2024 моделът постигна най-съвременна производителност сред моделите с отворен код, с 10% подобрение спрямо Qwen3-8B и сравнима производителност с Qwen3-235B-Thinking.

Методологията на разработка показва, че DeepSeek все повече разчита на последващо обучение с подсилващо обучение, което е довело до 40% увеличение на потреблението на токени по време на оценката – от 71 на 99 милиона токена. Това предполага, че моделът генерира по-дълги и по-задълбочени отговори, без да се изискват фундаментални архитектурни промени.

Пазарна позиция и конкурентна динамика

DeepSeek-R1-0528 се утвърждава като сериозен конкурент на водещите собствени модели на западните технологични компании. Според Artificial Analysis, моделът получава 68 точки, което го поставя наравно с Gemini 2.5 Pro на Google и пред модели като Grok 3 mini на xAI, Llama 4 Maverick на Meta и Nemotron Ultra на Nvidia. В категорията код, DeepSeek-R1-0528 постига ниво точно под o4-mini и o3 на OpenAI.

Пускането на актуализацията оказа значително влияние върху глобалния пейзаж на изкуствения интелект. Първоначалното пускане на DeepSeek-R1 през януари 2025 г. вече доведе до спад на технологичните акции извън Китай и оспори предположението, че мащабирането на изкуствения интелект изисква огромна изчислителна мощност и инвестиции. Западните конкуренти реагираха бързо: Google въведе намалени цени за достъп за Gemini, докато OpenAI понижи цените и представи модела o3 Mini, който изисква по-малко изчислителна мощност.

Интересното е, че анализите на стила на текста от EQBench показват, че стилът на DeepSeek-R1 е по-силно повлиян от Google, отколкото от OpenAI, което предполага, че при разработването му може да са използвани повече синтетични изходи от Gemini. Това наблюдение подчертава сложните влияния и трансфери на технологии между различните разработчици на ИИ.

Ефективност на разходите и наличност

Ключово конкурентно предимство на DeepSeek-R1-0528 се крие в изключителната му икономическа ефективност. Ценовата му структура е значително по-благоприятна от тази на OpenAI: Входните токени струват $0,14 на милион токена за попадения в кеша и $0,55 за пропуски в кеша, докато изходните токени струват $2,19 на милион токена. За сравнение, OpenAI o1 таксува $15 за входни токени и $60 за изходни токени на милион, което прави DeepSeek-R1 с 90-95 процента по-евтин.

Microsoft Azure предлага DeepSeek-R1 и на конкурентни цени: Глобалната версия струва $0,00135 за входни токени и $0,0054 за изходни токени на 1000 токена, докато регионалната версия има малко по-високи цени. Това ценообразуване прави модела особено привлекателен за компании и разработчици, които искат да се възползват от висококачествени функционалности на изкуствения интелект, без високите разходи за собствени решения.

Наличността му като модел с отворен код под лиценза на MIT позволява и търговска употреба и модификация без лицензионни такси. Разработчиците могат да стартират модела локално или да го използват чрез различни API, предлагайки гъвкавост и контрол върху внедряването. За потребители с ограничени ресурси е налична дестилирана версия с 8 милиарда параметъра, която работи на потребителски хардуер с 24 GB памет.

Свързано с това:

Наваксването на Китай в областта на изкуствения интелект: Случаят DeepSeek и стратегическото използване на данни

Наваксването на Китай с изкуствен интелект: Какво означава успехът на DeepSeek

DeepSeek-R1-0528 бележи повратна точка в глобалното развитие на изкуствения интелект, демонстрирайки, че китайските компании могат да разработват модели, които се конкурират с най-добрите западни системи, въпреки ограниченията за износ на САЩ. Актуализацията доказва, че значителни подобрения в производителността са възможни без фундаментални архитектурни промени, когато оптимизациите след обучение и обучението с подсилване се използват ефективно. Комбинацията от максимална производителност, драстично намалени разходи и достъпност на отворен код фундаментално оспорва установените бизнес модели в индустрията за изкуствен интелект.

Реакциите на западните конкуренти към успеха на DeepSeek вече показват първоначални промени на пазара: намаления на цените от OpenAI и Google, както и разработването на по-ресурсно-ефективни модели. С очакваното пускане на DeepSeek-R2, първоначално планирано за май 2025 г., този конкурентен натиск може да се засили допълнително. Историята на успеха на DeepSeek-R1-0528 илюстрира, че иновациите в областта на изкуствения интелект не изискват непременно огромни инвестиции и изчислителни ресурси, а могат да бъдат постигнати чрез интелигентни алгоритми и ефикасни методи за разработка.

Свързано с това:

Вашият експерт в индустрията за трансформация, интеграция и платформи с изкуствен интелект

☑️ Нашият бизнес език е английски или немски

☑️ НОВО: Кореспонденция на родния ви език!

Konrad Wolfenstein

Аз и моят екип с удоволствие ще бъдем на ваше разположение като ваш личен съветник.

Можете да се свържете с мен, като попълните формата за контакт тук или просто ми се обадите на +49 89 89 674 804 ( Мюнхен) . Моят имейл адрес е: [email protected]

Очаквам с нетърпение нашия съвместен проект.