DeepSeek V3.1 – тревога для OpenAI & Co: китайский ИИ с открытым исходным кодом создаёт новые проблемы для традиционных поставщиков
Предварительная версия Xpert
Выбор голоса 📢
Опубликовано: 21 августа 2025 г. / Обновлено: 21 августа 2025 г. – Автор: Конрад Вольфенштейн
DeepSeek V3.1 – тревога для OpenAI & Co: китайский ИИ с открытым исходным кодом ставит перед признанными поставщиками новые задачи – Изображение: Xpert.Digital
Новая модель искусственного интеллекта из Китая: эта бесплатная модель в 27 раз дешевле и напрямую бросает вызов ChatGPT.
### Тревога для OpenAI & Co: новый китайский ИИ столь же мощный – но невероятно дешёвый. Что за этим стоит? ### DeepSeek V3.1: Тихая атака ИИ, которая переворачивает мир технологий ### Забудьте о дорогом ИИ: почему эта китайская модель с открытым исходным кодом меняет всё ### Новый супер-ИИ Китая: как Пекин давит на Запад с помощью радикальной свободной стратегии ### Лучше и дешевле конкурентов? На что действительно способен новый чудо-ИИ Китая ###
DeepSeek V3.1 производит революцию в сфере ИИ (в очередной раз)
Китайский искусственный интеллект становится серьёзным вызовом для американских технологических гигантов. Стартап DeepSeek из Ханчжоу добился значительного прорыва со своей последней моделью V3.1, радикально переосмыслив традиционные представления о разработке и финансировании ИИ. Эта модель с открытым исходным кодом достигает производительности ведущих проприетарных систем при значительно меньших затратах на разработку, открывая путь к будущему искусственного интеллекта.
Подходит для:
Технические инновации с гибридной архитектурой
DeepSeek V3.1 основан на передовой архитектуре смешанного экспертного анализа с общим количеством параметров 685 миллиардов, из которых 37 миллиардов активируются для каждого токена. Эта технология обеспечивает значительно более эффективное использование ресурсов по сравнению с традиционными моделями без ущерба для производительности.
Отличительной особенностью новой модели является её гибридная архитектура вывода, которая может переключаться между «режимом размышления» и «режимом неразмышления». В режиме размышления система развивает более глубокие внутренние мыслительные процессы и идеально подходит для решения сложных задач, требующих многоуровневого логического мышления. Режим неразмышления, напротив, даёт прямые и краткие ответы для задач, где скорость критически важна.
Ещё одним техническим достижением является расширенное контекстное окно, вмещающее 128 000 токенов, что эквивалентно примерно 96 000 слов или двум 200-страничным романам. Эта возможность позволяет обрабатывать очень длинные документы, понимать целые репозитории кода и многошаговые диалоговые сценарии.
Дальнейшее развитие было достигнуто благодаря двухфазному подходу к расширению контекста. Фаза 32 000 токенов была расширена в десять раз до 630 миллиардов токенов, а фаза 128 000 токенов — в 3,3 раза до 209 миллиардов токенов. Кроме того, модель использует формат данных UE8M0 FP8 для оптимальной совместимости с современными аппаратными архитектурами.
Впечатляющие параметры производительности и тесты
В стандартизированных тестах DeepSeek V3.1 демонстрирует выдающиеся результаты. В известном тесте кодирования Aider модель набрала 71,6% – что сопоставимо с результатами ведущих моделей OpenAI и Anthropic. Этот результат особенно впечатляет, учитывая, что он достигается при значительно меньших затратах.
В математических задачах DeepSeek V3.1 даже превосходит конкурентов. В тесте Math 500 модель набрала 90,2%, в то время как GPT-4o — всего 74,6%. В тесте MMLU-Pro система улучшила свой результат на 5,3 балла до 81,2, а в бенчмарке GPQA — на целых 9,3 балла до 68,4.
Особого внимания заслуживает улучшение в задачах многошагового рассуждения, где V3.1 выполняет задачи на 43% лучше, чем предыдущая версия. Возможности программирования модели позволяют ей создавать безошибочный код длиной до 700 строк – производительность, сопоставимая с дорогостоящими проприетарными решениями.
Революционная экономическая эффективность
Структура затрат DeepSeek V3.1 переворачивает с ног на голову прежние представления о разработке ИИ. В то время как задача программирования в V3.1 стоит около одного доллара, аналогичные системы стоят почти 70 долларов за аналогичные задачи. Это значительное снижение затрат делает передовые технологии ИИ доступными для небольших компаний и разработчиков.
По данным компании, затраты на разработку базовой модели V3 составили всего около 5,6 млн долларов – малую долю от сотен миллионов долларов, потраченных американскими компаниями на аналогичные проекты. Такая эффективность была достигнута благодаря инновационным методам обучения и использованию менее мощного, но более экономичного оборудования.
Цена API DeepSeek значительно ниже, чем у конкурентов. Стоимость чат-модели составляет 0,07 доллара за миллион входящих токенов с кэш-попаданием и 1,10 доллара за миллион исходящих токенов. Стоимость модели рассуждений составляет 0,14 доллара за входящий токен и 2,19 доллара за исходящий токен. Для сравнения, OpenAI взимает от 2 до 2,50 доллара за миллион исходящих токенов, а цена DeepSeek составляет 0,014 доллара.
Стратегическое значение для глобальной конкуренции в области искусственного интеллекта
Успехи DeepSeek имеют далеко идущие последствия для мирового рынка искусственного интеллекта. Компания демонстрирует, что для повышения производительности ИИ больше не требуются огромные ресурсы и фирменные подходы, характерные для американской разработки ИИ до сих пор. Это развитие бросает вызов основам существующих бизнес-моделей.
Руководство Китая придаёт DeepSeek большое стратегическое значение, о чём свидетельствует приём, оказанный основателю компании Лян Вэньфэну премьером Ли Цяном. Компания рассматривается как ключевой элемент в реализации амбициозных планов Китая стать мировым лидером в области искусственного интеллекта к 2030 году.
Стратегия открытого исходного кода DeepSeek позволяет другим компаниям и исследователям по всему миру использовать её достижения и разрабатывать собственные инновации. Это способствует децентрализованной разработке технологий ИИ и снижает зависимость от отдельных технологических гигантов.
Предыстория и структура компании
Компания DeepSeek была основана в Ханчжоу в 2023 году Ляном Вэньфэном и полностью финансируется китайским хедж-фондом High-Flyer. Вэньфэн, родившийся в 1985 году в семье учителя начальной школы, заинтересовался применением искусственного интеллекта в финансовом секторе во время учёбы в Чжэцзянском университете.
В 2016 году Вэньфэн основал High-Flyer — хедж-фонд, использующий машинное обучение для разработки количественных торговых стратегий. К 2021 году компания полностью перешла на торговые подходы на основе искусственного интеллекта и стала одним из ведущих количественных фондов Китая с активами под управлением более 100 миллиардов юаней.
Ещё до основания DeepSeek Вэньфэн начал закупать тысячи видеокарт Nvidia – поначалу это высмеивалось как эксцентричное хобби миллиардера. Эти дальновидные инвестиции в оборудование впоследствии позволили компании разрабатывать конкурентоспособные модели искусственного интеллекта, несмотря на экспортные ограничения США.
Безопасность данных в ЕС и Германии | Интеграция независимой и кросс-источниковой платформы ИИ для всех бизнес-потребностей
Независимые платформы ИИ как стратегическая альтернатива для европейских компаний – Изображение: Xpert.Digital
Ki-GameChanger: наиболее гибкая платформа AI – специальные решения, которые снижают затраты, улучшают свои решения и повышают эффективность
Независимая платформа искусственного интеллекта: интегрирует все соответствующие источники данных компании
- Быстрая интеграция AI: специально разработанные решения для ИИ для компаний в течение нескольких часов или дней вместо месяцев
- Гибкая инфраструктура: облачный или хостинг в вашем собственном центре обработки данных (Германия, Европа, свободный выбор местоположения)
- Самая высокая безопасность данных: использование в юридических фирмах является безопасным доказательством
- Используйте в широком спектре источников данных компании
- Выбор ваших собственных или различных моделей искусственного интеллекта (DE, EU, USA, CN)
Подробнее об этом здесь:
Чипы, алгоритмы, инновации: путь DeepSeek к мировому лидерству
Влияние экспортного контроля США
Успех DeepSeek особенно примечателен на фоне ограничений США на экспорт мощных ИИ-чипов в Китай. Хотя санкции были направлены на ограничение возможностей Китая по разработке передовых систем ИИ, DeepSeek демонстрирует, что инновационные программные подходы и эффективное использование ресурсов способны преодолеть эти ограничения.
Компания использовала менее мощные чипы H800, одобренные для экспорта в Китай, но всё же достигла максимальной производительности благодаря оптимизированным алгоритмам и эффективным методам обучения. Такой подход ставит под сомнение эффективность технологических санкций и выявляет альтернативные пути развития ИИ.
Эксперты рассматривают прорыв DeepSeek как поворотный момент, который может кардинально изменить существующие оценки возможностей и потенциала искусственного интеллекта Китая. Это развитие предполагает, что инновации в оптимизации программного обеспечения могут быть важнее чистого аппаратного превосходства.
Подходит для:
Открытый исходный код как конкурентное преимущество
Стратегия открытого исходного кода DeepSeek даёт ряд стратегических преимуществ. Разработчики и компании по всему миру могут запускать модель локально, настраивать её и интегрировать в свои проекты, не прибегая к облачным сервисам. Это особенно важно для приложений, чувствительных к данным, и компаний, которые хотят сохранить контроль над своей информацией.
Разработка, основанная на сообществе, обеспечивает более быстрое исправление ошибок, постоянное совершенствование и широкую базу участников. В то же время, подход с открытым исходным кодом демократизирует доступ к передовым технологиям ИИ и способствует инновациям, даже среди небольших компаний и в развивающихся странах.
В отличие от проприетарных моделей, доступных только через API или облачные платформы, ИИ с открытым исходным кодом обеспечивает долгосрочную доступность и независимость от отдельных поставщиков. Пользователям не нужно беспокоиться о повышении цен, ограничениях доступа или прекращении обслуживания.
Технологические прорывы и инновации
DeepSeek V3.1 объединяет несколько инновационных технологий, обеспечивающих его исключительную эффективность. Многоголовочная архитектура латентного внимания сжимает кэши «ключ-значение» с помощью латентных векторов, снижая потребление памяти и вычислительные затраты при выводе.
Метод многотокенного прогнозирования позволяет каждому токену одновременно предсказывать несколько будущих токенов. Это устраняет существенное узкое место традиционных моделей авторегрессии и повышает как точность, так и скорость вывода.
Использование 8-битного обучения значительно снижает требования к памяти и затраты без ущерба для точности. Этот метод долгое время считался проблемным, но DeepSeek показывает, что при правильной реализации он даёт результаты, сопоставимые с результатами традиционных методов.
Реакции и воздействия рынка
Анонс DeepSeek V3.1 вызвал бурную реакцию на финансовых рынках. Nvidia потеряла более 600 миллиардов долларов рыночной капитализации – это крупнейший единовременный убыток в истории фондового рынка США. Другие компании, занимающиеся разработкой оборудования для ИИ, также зафиксировали значительное падение стоимости акций.
Инвесторы и аналитики пересматривают свои оценки отрасли искусственного интеллекта. Успех DeepSeek ставит под сомнение предположение, что масштабные инвестиции в оборудование и собственные разработки являются необходимыми условиями для создания передовых технологий искусственного интеллекта.
Западные компании уже тестируют модели DeepSeek в своих рабочих процессах. Ярким примером является компания Merck, директор по данным которой публично продемонстрировал интеграцию DeepSeek как одного из вариантов ИИ во внутренние процессы.
Будущее развитие и перспективы
DeepSeek позиционирует версию 3.1 как первый шаг к «эре агентов» ИИ. Модель специально оптимизирована для более эффективного использования инструментов и многоэтапных задач, выполняемых агентами. Оптимизация после обучения привела к значительному улучшению использования внешних инструментов и решения сложных задач поиска.
Скорость разработки DeepSeek позволяет предположить, что модель V4 может быть выпущена раньше следующего релиза OpenAI R2. Этот импульс может ускорить традиционные циклы разработки в индустрии ИИ и установить новые стандарты частоты обновлений.
Успехи DeepSeek уже вдохновляют другие китайские компании и исследователей в области ИИ по всему миру. Модели с открытым исходным кодом всё чаще рассматриваются как достойная альтернатива проприетарным решениям, что может привести к более диверсифицированному и конкурентоспособному ландшафту ИИ.
Проблемы и критика
Несмотря на впечатляющие результаты, DeepSeek также подвергается критике. Как и другие китайские модели искусственного интеллекта, DeepSeek подвергается определённым цензурным мерам, которые могут применяться в политически чувствительных областях. Однако эти ограничения часто можно обойти с помощью технических корректировок.
Прозрачность данных и методов обучения ограничена. Существуют предположения, что обучение частично основано на ответах ChatGPT, поскольку DeepSeek иногда выдаёт себя за ChatGPT. Эта неоднозначность вызывает вопросы об оригинальности и потенциальные проблемы с авторскими правами.
Быстрое развитие и низкая стоимость моделей DeepSeek также вызывают опасения по поводу устойчивости этой бизнес-модели. Критики сомневаются, смогут ли такие крайне низкие цены сохраниться в долгосрочной перспективе или же они являются частью стратегического плана по проникновению на рынок.
Глобальные последствия для индустрии ИИ
DeepSeek V3.1 знаменует собой поворотный момент в развитии мирового ИИ. Модель доказывает, что инновационные программные подходы и эффективное использование ресурсов могут быть важнее масштабных капиталовложений и доступа к новейшему оборудованию. Это понимание повлияет на стратегии всех крупных компаний в области ИИ.
Демократизация передовых технологий искусственного интеллекта посредством моделей с открытым исходным кодом может привести к более равномерному распределению возможностей ИИ по всему миру. Страны и компании, ранее не доступные из-за высоких затрат или технических барьеров, получат доступ к передовым технологиям.
В то же время успех DeepSeek ставит под сомнение эффективность технологических санкций и экспортного контроля. Возможность достижения мирового уровня производительности при ограниченных ресурсах может побудить другие страны использовать аналогичные подходы и разрабатывать собственные экосистемы искусственного интеллекта.
DeepSeek V3.1 — это больше, чем просто очередная модель ИИ – она символизирует фундаментальный сдвиг в подходах к разработке, финансированию и распространению ИИ. Сочетание технических инноваций, экономичной разработки и доступности открытого исходного кода создаёт новые возможности и бросает серьёзный вызов устоявшимся лидерам рынка. Дальнейшее развитие покажет, определит ли этот подход будущее индустрии ИИ.
Мы здесь для вас – Консультация – Планирование – Внедрение – Управление проектами
☑️ Поддержка МСП в разработке стратегии, консультировании, планировании и реализации.
☑ Создание или перестройка стратегии ИИ
☑️ Пионерское развитие бизнеса
Буду рад стать вашим личным консультантом.
Вы можете связаться со мной, заполнив контактную форму ниже, или просто позвонить мне по телефону +49 89 89 674 804 (Мюнхен) .
Я с нетерпением жду нашего совместного проекта.
Xpert.digital – Конрад Вольфенштейн
Xpert.Digital — это промышленный центр с упором на цифровизацию, машиностроение, логистику/внутреннюю логистику и фотоэлектрическую энергетику.
С помощью нашего решения для развития бизнеса на 360° мы поддерживаем известные компании, начиная с нового бизнеса и заканчивая послепродажным обслуживанием.
Аналитика рынка, маркетинг, автоматизация маркетинга, разработка контента, PR, почтовые кампании, персонализированные социальные сети и привлечение потенциальных клиентов являются частью наших цифровых инструментов.
Вы можете найти больше по адресу: www.xpert.digital – www.xpert.solar – www.xpert.plus