DeepSeek-R1-0528: Обновление DeepSeek возвращает китайскую модель ИИ на один уровень с лидерами западной индустрии

Konrad Wolfenstein

1 год назад

DeepSeek-R1-0528: Обновление DeepSeek возвращает китайскую модель ИИ на один уровень с лидерами западной индустрии – Изображение: Xpert.Digital

Искусственный интеллект с открытым исходным кодом на пределе своих возможностей: DeepSeek затмевает OpenAI и Google

От 60 до 68: DeepSeek возвращает китайский ИИ на вершину

Китайский стартап DeepSeek, занимающийся разработкой искусственного интеллекта, достиг важной вехи, выпустив 28 мая 2025 года DeepSeek-R1-0528, что изменило глобальный ландшафт ИИ. Обновление модели рассуждений с открытым исходным кодом демонстрирует значительное улучшение производительности, впервые поставив DeepSeek на один уровень с OpenAI o3 и Google Gemini 2.5 Pro. Особенно примечательно, что эта пиковая производительность достигается при значительно меньших затратах и с полностью открытыми весами модели, что поднимает фундаментальные вопросы о будущем проприетарных систем ИИ. Независимая рейтинговая платформа Artificial Analysis оценила новую модель в 68 баллов – скачок с 60 до 68 баллов, что соответствует разнице в производительности между OpenAI o1 и o3.

В связи с этим:

DeepSeek и Alibaba: прорыв на уровне специалистов? Китайский прорыв в области ИИ в здравоохранении

Обновление и его технические улучшения

DeepSeek-R1-0528 представляет собой существенное улучшение, обеспечивающее значительное повышение производительности за счет оптимизации алгоритмов и более эффективного использования вычислительных ресурсов после обучения, без изменения базовой архитектуры. Обновление в первую очередь направлено на улучшение возможностей рассуждения, что, по словам DeepSeek, позволяет «значительно углубить мыслительные процессы». Особенно впечатляющим примером этого улучшения является тест по математике AIME 2025, где точность повысилась с 70% до 87,5%. Одновременно среднее количество токенов на вопрос увеличилось с 12 000 до 23 000, что указывает на более интенсивную обработку.

Помимо улучшений в логике, обновление добавляет важные новые функции, включая вывод в формате JSON и вызовы функций, оптимизированный пользовательский интерфейс и уменьшение количества ошибок. Эти улучшения делают модель значительно более практичной для разработчиков и существенно расширяют её возможности. Доступность остаётся неизменной: существующие пользователи API получат обновление автоматически, а веса модели по-прежнему будут доступны под открытой лицензией MIT на Hugging Face.

Сравнительная оценка производительности и тестовые показатели

Результаты бенчмарка DeepSeek-R1-0528 демонстрируют впечатляющие улучшения во всех категориях оценки. В математических задачах оценка AIME-2024 выросла с 79,8 до 91,4%, HMMT-2025 — с 41,7 до 79,4%, а CNMO-2024 — с 78,8 до 86,9%. Эти результаты позволяют отнести модель к числу самых мощных систем искусственного интеллекта для решения математических задач в мире.

DeepSeek-R1-0528 также демонстрирует значительный прогресс в тестах программирования. Показатель LiveCodeBench улучшился с 63,5 до 73,3%, Aider-Polyglot — с 53,3 до 71,6%, а SWE Verified — с 49,2 до 57,6%. Рейтинг на Codeforces вырос с 1530 до 1930 баллов, что ставит модель в число лучших алгоритмических решателей задач. По сравнению с конкурирующими моделями, DeepSeek-R1 достигает 49,2% в SWE Verified, немного опережая OpenAI o1-1217 с 48,9%, а на Codeforces, с 96,3 процентилями и рейтингом Эло в 2029 баллов, он очень близок к ведущей модели OpenAI.

Тесты на общие знания и логику подтверждают значительное улучшение результатов: GPQA-Diamond показал рост с 71,5 до 81,0%, Humanity's Last Exam — с 8,5 до 17,7%, MMLU-Pro — с 84,0 до 85,0%, а MMLU-Redux — с 92,9 до 93,4%. Только SimpleQA от OpenAI продемонстрировал небольшое снижение с 30,1 до 27,8%. Эти комплексные улучшения показывают, что DeepSeek-R1-0528 конкурентоспособен не только в специализированных областях, но и во всем спектре когнитивных задач.

Техническая архитектура и инновации

Техническая основа DeepSeek-R1-0528 базируется на сложной архитектуре MoE (Mixture of Experts) с 37 миллиардами активных параметров из общего числа 671 миллиарда параметров и длиной контекста в 128 000 токенов. Модель использует передовые методы обучения с подкреплением для достижения самопроверки, многоэтапного анализа и возможностей рассуждения, подобных человеческим. Эта архитектура позволяет модели решать сложные задачи рассуждения посредством итеративных мыслительных процессов, что отличает её от традиционных языковых моделей.

Особенно инновационным аспектом является разработка упрощенного варианта DeepSeek-R1-0528-Qwen3-8B, созданного путем обобщения идеи DeepSeek-R1-0528 для постобучения Qwen3-8B-Base. Эта уменьшенная версия демонстрирует впечатляющую производительность при значительно меньших требованиях к ресурсам и работает на графических процессорах с 8-12 ГБ видеопамяти. В тесте AIME 2024 модель показала лучшие результаты среди моделей с открытым исходным кодом, улучшив свои показатели на 10 процентов по сравнению с Qwen3-8B и сопоставимые с Qwen3-235B-Thinking.

Методология разработки показывает, что DeepSeek все больше полагается на постобучение с использованием обучения с подкреплением, что привело к увеличению потребления токенов на 40% во время оценки — с 71 до 99 миллионов токенов. Это говорит о том, что модель генерирует более длинные и глубокие ответы без необходимости внесения фундаментальных архитектурных изменений.

Позиция на рынке и конкурентная динамика

DeepSeek-R1-0528 становится серьёзным конкурентом ведущим проприетарным моделям западных технологических компаний. По данным Artificial Analysis, модель набирает 68 баллов, что ставит её на один уровень с Google Gemini 2.5 Pro и выше таких моделей, как xAI Grok 3 mini, Meta Llama 4 Maverick и Nvidia Nemotron Ultra. В категории кода DeepSeek-R1-0528 показывает результат чуть ниже, чем у OpenAI o4-mini и o3.

Выпуск обновления оказал значительное влияние на глобальную ситуацию в сфере искусственного интеллекта. Первоначальный релиз DeepSeek-R1 в январе 2025 года уже привел к падению акций технологических компаний за пределами Китая и поставил под сомнение предположение о том, что масштабирование ИИ требует огромных вычислительных мощностей и инвестиций. Западные конкуренты отреагировали быстро: Google ввел льготные тарифы на доступ к Gemini, а OpenAI снизила цены и представила модель o3 Mini, требующую меньших вычислительных мощностей.

Интересно, что анализ стиля текста, проведенный с помощью EQBench, показывает, что стиль DeepSeek-R1 в большей степени находится под влиянием Google, чем OpenAI, что позволяет предположить, что при его разработке могло быть использовано больше синтетических результатов Gemini. Это наблюдение подчеркивает сложность взаимовлияния и передачи технологий между различными разработчиками ИИ.

Экономическая эффективность и доступность

Ключевое конкурентное преимущество DeepSeek-R1-0528 заключается в его исключительной экономической эффективности. Его ценовая структура значительно выгоднее, чем у OpenAI: входные токены стоят 0,14 доллара за миллион токенов при попадании в кэш и 0,55 доллара при промахе кэша, а выходные токены — 2,19 доллара за миллион токенов. Для сравнения, OpenAI o1 взимает 15 долларов за входные токены и 60 долларов за выходные токены за миллион, что делает DeepSeek-R1 на 90-95 процентов дешевле.

Microsoft Azure также предлагает DeepSeek-R1 по конкурентоспособным ценам: глобальная версия стоит 0,00135 доллара США за входные токены и 0,0054 доллара США за выходные токены за 1000 токенов, в то время как региональная версия имеет несколько более высокие цены. Такая ценовая политика делает модель особенно привлекательной для компаний и разработчиков, которые хотят использовать высококачественные функции ИИ без высоких затрат на проприетарные решения.

Доступность модели в качестве модели с открытым исходным кодом под лицензией MIT также позволяет использовать ее в коммерческих целях и модифицировать без уплаты лицензионных сборов. Разработчики могут запускать модель локально или использовать ее через различные API, что обеспечивает гибкость и контроль над реализацией. Для пользователей с ограниченными ресурсами доступна упрощенная версия с 8 миллиардами параметров, работающая на потребительском оборудовании с 24 ГБ памяти.

В связи с этим:

Китай догоняет конкурентов в области искусственного интеллекта: дело DeepSeek и стратегическое использование данных

Китай догоняет DeepSeek в области искусственного интеллекта: что означает успех компании

DeepSeek-R1-0528 знаменует собой поворотный момент в глобальном развитии ИИ, демонстрируя, что китайские компании могут разрабатывать модели, конкурирующие с лучшими западными системами, несмотря на экспортные ограничения США. Обновление доказывает, что значительное повышение производительности возможно без фундаментальных архитектурных изменений при эффективном применении постобработки и обучения с подкреплением. Сочетание максимальной производительности, резко сниженных затрат и доступности открытого исходного кода коренным образом бросает вызов устоявшимся бизнес-моделям в индустрии ИИ.

Реакция западных конкурентов на успех DeepSeek уже демонстрирует первые изменения на рынке: снижение цен со стороны OpenAI и Google, а также разработка более ресурсоэффективных моделей. С ожидаемым выпуском DeepSeek-R2, первоначально запланированным на май 2025 года, это конкурентное давление может еще больше усилиться. История успеха DeepSeek-R1-0528 показывает, что инновации в области ИИ не обязательно требуют масштабных инвестиций и вычислительных ресурсов, а могут быть достигнуты с помощью умных алгоритмов и эффективных методов разработки.

В связи с этим:

Ваш эксперт в области трансформации с помощью ИИ, интеграции ИИ и создания платформ искусственного интеллекта

☑️ Язык ведения нашего бизнеса — английский или немецкий

☑️ НОВИНКА: Переписка на вашем родном языке!

Konrad Wolfenstein

Я и моя команда будем рады быть вашими личными консультантами.

Вы можете связаться со мной, заполнив контактную форму здесь wolfenstein@xpert.digital:или просто позвонив по номеру +49 7348 4088 965. Мой адрес электронной почты

Я с нетерпением жду начала нашего совместного проекта.

DeepSeek-R1-0528: Обновление DeepSeek возвращает китайскую модель ИИ на один уровень с лидерами западной индустрии

Искусственный интеллект с открытым исходным кодом на пределе своих возможностей: DeepSeek затмевает OpenAI и Google