DeepSeek-R1-0528: Оновлення DeepSeek повертає китайську модель штучного інтелекту на рівень західних лідерів галузі

Опубліковано: 31 травня 2025 р. / Оновлено: 31 травня 2025 р. – Автор: Konrad Wolfenstein

DeepSeek-R1-0528: Оновлення DeepSeek повертає китайську модель штучного інтелекту на рівень західних лідерів галузі – Зображення: Xpert.Digital

Штучний інтелект з відкритим кодом на межі своїх можливостей: DeepSeek затьмарює OpenAI та Google

З 60 до 68: DeepSeek катапультує китайський ШІ назад на вершину

Китайський стартап у сфері штучного інтелекту DeepSeek досяг значної віхи з випуском DeepSeek-R1-0528 28 травня 2025 року, переосмисливши світовий ландшафт штучного інтелекту. Оновлення моделі міркувань з відкритим кодом демонструє разюче покращення продуктивності, вперше позиціонуючи DeepSeek нарівні з OpenAI o3 та Google Gemini 2.5 Pro. Особливо варто зазначити, що ця пікова продуктивність досягається за значно меншу вартість та з повністю відкритими вагами моделі, що ставить фундаментальні питання щодо майбутнього власницьких систем штучного інтелекту. Незалежна рейтингова платформа Artificial Analysis оцінила нову модель у 68 балів – стрибок з 60 до 68 балів, що відповідає різниці в продуктивності між OpenAI o1 та o3.

Підходить для цього:

DeepSeek та Alibaba: прорив на спеціалізованому рівні? Китайський поштовх штучного інтелекту в охороні здоров'я

Оновлення та його технічні покращення

DeepSeek-R1-0528 являє собою суттєве вдосконалення, яке забезпечує значне підвищення продуктивності завдяки алгоритмічній оптимізації та збільшенню використання обчислювальних ресурсів у пост-навчальній роботі, без зміни базової архітектури. Оновлення в першу чергу зосереджено на покращенні можливостей міркування, що, за даними DeepSeek, дозволяє «значно глибше розуміти». Особливо вражаючим прикладом цього покращення є тест з математики AIME 2025, де точність зросла з 70 до 87,5 відсотка. Одночасно середня кількість токенів на запитання збільшилася з 12 000 до 23 000 токенів, що свідчить про інтенсивнішу обробку.

Окрім покращень міркувань, оновлення запроваджує важливі нові функції, зокрема вивід JSON та виклики функцій, оптимізований інтерфейс користувача та зменшення галюцинацій. Ці покращення роблять модель значно практичнішою для розробників і значно розширюють її сферу застосування. Доступність залишається незмінною: існуючі користувачі API отримають оновлення автоматично, тоді як ваги моделі залишатимуться доступними за відкритою ліцензією MIT на Hugging Face.

Порівняння продуктивності та тестування бенчмарків

Результати бенчмарків для DeepSeek-R1-0528 демонструють вражаючі покращення у всіх категоріях оцінювання. У математичних завданнях бал за AIME-2024 збільшився з 79,8 до 91,4 відсотка, за HMMT-2025 – з 41,7 до 79,4 відсотка, а за CNMO-2024 – з 78,8 до 86,9 відсотка. Ці результати позиціонують модель як одну з найпотужніших систем штучного інтелекту для вирішення математичних задач у світі.

DeepSeek-R1-0528 також демонструє значний прогрес у бенчмарках програмування. LiveCodeBench покращився з 63,5 до 73,3 відсотка, Aider-Polyglot — з 53,3 до 71,6 відсотка, а SWE Verified — з 49,2 до 57,6 відсотка. Рейтинг Codeforces піднявся з 1530 до 1930 балів, що ставить модель серед найкращих алгоритмічних розв'язувачів задач. Порівняно з конкуруючими моделями, DeepSeek-R1 досягає 49,2 відсотка в SWE Verified, що ставить її трохи вище OpenAI o1-1217 з 48,9 відсотка, тоді як у Codeforces з 96,3 процентилями та рейтингом Elo 2029 балів вона дуже близька до провідної моделі OpenAI.

Тести на загальні знання та логіку підтверджують значне покращення продуктивності: GPQA-Diamond збільшився з 71,5 до 81,0 відсотка, Humanity's Last Exam — з 8,5 до 17,7 відсотка, MMLU-Pro — з 84,0 до 85,0 відсотка, а MMLU-Redux — з 92,9 до 93,4 відсотка. Тільки SimpleQA від OpenAI продемонстрував незначне зниження з 30,1 до 27,8 відсотка. Ці комплексні покращення демонструють, що DeepSeek-R1-0528 є конкурентоспроможним не лише у спеціалізованих галузях, але й у всьому спектрі когнітивних завдань.

Технічна архітектура та інновації

Технічна основа DeepSeek-R1-0528 базується на складній архітектурі MoE (Суміш експертів) з 37 мільярдами активних параметрів із загальної кількості 671 мільярда параметрів та довжиною контексту 128 000 токенів. Модель реалізує розширене навчання з підкріпленням для досягнення самоперевірки, багатоетапної рефлексії та можливостей мислення, подібних до людських. Ця архітектура дозволяє моделі вирішувати складні завдання мислення за допомогою ітеративних процесів мислення, що відрізняє її від традиційних мовних моделей.

Особливо інноваційним аспектом є розробка дистильованого варіанту DeepSeek-R1-0528-Qwen3-8B, який був створений шляхом дистиляції думок DeepSeek-R1-0528 для пост-навчального Qwen3-8B-Base. Ця зменшена версія досягає вражаючої продуктивності зі значно меншими вимогами до ресурсів і працює на графічних процесорах з 8-12 ГБ відеопам'яті. У тесті AIME 2024 модель досягла найсучаснішої продуктивності серед моделей з відкритим кодом, з 10-відсотковим покращенням порівняно з Qwen3-8B та порівнянною продуктивністю з Qwen3-235B-Thinking.

Методологія розробки показує, що DeepSeek дедалі більше спирається на пост-навчання з підкріпленням навчання, що призвело до 40% збільшення споживання токенів під час оцінювання – з 71 до 99 мільйонів токенів. Це свідчить про те, що модель генерує довші та глибші відповіді, не вимагаючи фундаментальних архітектурних змін.

Позиція на ринку та конкурентна динаміка

DeepSeek-R1-0528 зарекомендував себе як серйозний конкурент провідним пропрієтарним моделям західних технологічних компаній. Згідно з даними Artificial Analysis, модель набрала 68 балів, що ставить її на один рівень з Gemini 2.5 Pro від Google та випереджає такі моделі, як Grok 3 mini від xAI, Llama 4 Maverick від Meta та Nemotron Ultra від Nvidia. У категорії коду DeepSeek-R1-0528 досягає рівня, трохи нижчого за o4-mini та o3 від OpenAI.

Випуск оновлення мав значний вплив на світовий ландшафт штучного інтелекту. Перший випуск DeepSeek-R1 у січні 2025 року вже призвів до падіння технологічних акцій за межами Китаю та поставив під сумнів припущення, що масштабування ШІ вимагає величезної обчислювальної потужності та інвестицій. Західні конкуренти швидко відреагували: Google запровадив знижені тарифи на доступ для Gemini, тоді як OpenAI знизив ціни та представив модель o3 Mini, яка вимагає меншої обчислювальної потужності.

Цікаво, що аналіз стилю тексту від EQBench показує, що стиль DeepSeek-R1 більше залежить від Google, ніж від OpenAI, що свідчить про те, що в його розробці могло бути використано більше синтетичних виходів Gemini. Це спостереження підкреслює складний вплив та передачу технологій між різними розробниками ШІ.

Економічна ефективність та доступність

Ключова конкурентна перевага DeepSeek-R1-0528 полягає у винятковій економічній ефективності. Його цінова структура значно вигідніша, ніж у OpenAI: вхідні токени коштують 0,14 долара за мільйон токенів за потрапляння до кешу та 0,55 долара за промахи, тоді як вихідні токени коштують 2,19 долара за мільйон токенів. Для порівняння, OpenAI o1 стягує 15 доларів за вхідні токени та 60 доларів за вихідні токени за мільйон, що робить DeepSeek-R1 на 90-95 відсотків дешевшим.

Microsoft Azure також пропонує DeepSeek-R1 за конкурентними цінами: глобальна версія коштує $0,00135 за вхідні токени та $0,0054 за вихідні токени за 1000 токенів, тоді як регіональна версія має дещо вищі ціни. Таке ціноутворення робить модель особливо привабливою для компаній та розробників, які хочуть використовувати високоякісні функції штучного інтелекту без високих витрат на пропрієтарні рішення.

Його доступність як моделі з відкритим вихідним кодом за ліцензією MIT також дозволяє комерційне використання та модифікацію без ліцензійних платежів. Розробники можуть запускати модель локально або використовувати її через різні API, що забезпечує гнучкість та контроль над впровадженням. Для користувачів з обмеженими ресурсами доступна дистильована версія з 8 мільярдами параметрів, яка працює на споживчому обладнанні з 24 ГБ пам'яті.

Підходить для цього:

Наздоганяючи Китай у сфері штучного інтелекту: випадок DeepSeek та стратегічне використання даних

Наздоганяючи ШІ, Китай: що означає успіх DeepSeek

DeepSeek-R1-0528 знаменує собою поворотний момент у світовому розвитку штучного інтелекту, демонструючи, що китайські компанії можуть розробляти моделі, які конкурують з найкращими західними системами, незважаючи на експортні обмеження США. Оновлення доводить, що значне покращення продуктивності можливе без фундаментальних архітектурних змін, коли ефективно використовуються оптимізація після навчання та навчання з підкріпленням. Поєднання пікової продуктивності, різкого зниження витрат та доступності відкритого коду ставить під сумнів усталені бізнес-моделі в галузі штучного інтелекту.

Реакція західних конкурентів на успіх DeepSeek вже демонструє перші зміни на ринку: зниження цін з боку OpenAI та Google, а також розробка більш ресурсоефективних моделей. З очікуваним випуском DeepSeek-R2, спочатку запланованим на травень 2025 року, цей конкурентний тиск може ще більше посилитися. Історія успіху DeepSeek-R1-0528 ілюструє, що інновації у штучному інтелекті не обов'язково вимагають величезних інвестицій та обчислювальних ресурсів, а можуть бути досягнуті за допомогою розумних алгоритмів та ефективних методів розробки.

Підходить для цього:

Ваша трансформація AI, інтеграція AI та експерт з питань індустрії платформ AI

☑ Наша ділова мова - англійська чи німецька

☑ Нове: листування на вашій національній мові!

Konrad Wolfenstein

Я радий бути доступним вам та моїй команді як особистого консультанта.

Ви можете зв’язатися зі мною, заповнивши тут контактну форму або просто зателефонуйте мені за номером +49 89 674 804 (Мюнхен) . Моя електронна адреса: Вольфенштейн ∂ xpert.digital

Я з нетерпінням чекаю нашого спільного проекту.