Ícone do site Especialista.Digital

DeepSeek-R1-0528: A atualização do DeepSeek coloca o modelo de IA chinês novamente em pé de igualdade com os líderes da indústria ocidental

DeepSeek-R1-0528: A atualização do DeepSeek coloca o modelo de IA chinês novamente em pé de igualdade com os líderes da indústria ocidental

DeepSeek-R1-0528: Atualização do DeepSeek coloca o modelo de IA chinês novamente em pé de igualdade com os líderes da indústria ocidental – Imagem: Xpert.Digital

Inteligência artificial de código aberto no seu limite: DeepSeek ofusca OpenAI e Google

De 60 para 68: DeepSeek catapulta a IA chinesa de volta ao topo

A startup chinesa de IA, DeepSeek, alcançou um marco significativo com o lançamento do DeepSeek-R1-0528 em 28 de maio de 2025, redefinindo o cenário global de IA. A atualização do modelo de raciocínio de código aberto demonstra melhorias drásticas de desempenho, posicionando o DeepSeek pela primeira vez em pé de igualdade com o OpenAI o3 e o Google Gemini 2.5 Pro. Particularmente notável é que esse desempenho máximo é alcançado a uma fração do custo e com pesos de modelo completamente abertos, levantando questões fundamentais sobre o futuro dos sistemas de IA proprietários. A plataforma independente de avaliação Artificial Analysis atribuiu ao novo modelo 68 pontos – um salto de 60 para 68 pontos que corresponde à diferença de desempenho entre o OpenAI o1 e o o3.

Relacionado a isto:

A atualização e suas melhorias técnicas

O DeepSeek-R1-0528 representa um aprimoramento substancial que alcança melhorias significativas de desempenho por meio de otimizações algorítmicas e maior utilização de recursos computacionais no pós-treinamento, sem alterar a arquitetura subjacente. A atualização concentra-se principalmente em melhorar as capacidades de raciocínio, permitindo, segundo a DeepSeek, "processos de pensamento significativamente mais profundos". Um exemplo particularmente impressionante dessa melhoria pode ser observado no teste de matemática AIME 2025, onde a precisão aumentou de 70% para 87,5%. Simultaneamente, o número médio de tokens por questão aumentou de 12.000 para 23.000 tokens, indicando um processamento mais intensivo.

Além das melhorias no raciocínio, a atualização introduz novas funcionalidades importantes, incluindo saída JSON e chamadas de função, uma interface de usuário otimizada e redução de alucinações. Esses aprimoramentos tornam o modelo significativamente mais prático para desenvolvedores e expandem consideravelmente seu escopo. A disponibilidade permanece inalterada: os usuários da API existentes receberão a atualização automaticamente, enquanto os pesos do modelo continuarão disponíveis sob a licença aberta MIT no Hugging Face.

Desempenho de referência e comparações de desempenho

Os resultados de referência do DeepSeek-R1-0528 mostram melhorias impressionantes em todas as categorias de avaliação. Em tarefas matemáticas, a pontuação no AIME-2024 aumentou de 79,8% para 91,4%, no HMMT-2025 de 41,7% para 79,4% e no CNMO-2024 de 78,8% para 86,9%. Esses resultados posicionam o modelo como um dos sistemas de IA mais poderosos para resolução de problemas matemáticos em todo o mundo.

O DeepSeek-R1-0528 também demonstra progresso significativo em benchmarks de programação. O LiveCodeBench melhorou de 63,5% para 73,3%, o Aider-Polyglot de 53,3% para 71,6% e o SWE Verified de 49,2% para 57,6%. A classificação no Codeforces subiu de 1.530 para 1.930 pontos, colocando o modelo entre os melhores solucionadores de problemas algorítmicos. Comparado a modelos concorrentes, o DeepSeek-R1 alcança 49,2% no SWE Verified, ficando ligeiramente à frente do OpenAI o1-1217, com 48,9%, enquanto no Codeforces, com percentil de 96,3% e uma classificação Elo de 2.029 pontos, ele se aproxima bastante do modelo líder da OpenAI.

Testes de conhecimento geral e lógica confirmam a ampla melhoria de desempenho: o GPQA-Diamond aumentou de 71,5% para 81,0%, o Humanity's Last Exam de 8,5% para 17,7%, o MMLU-Pro de 84,0% para 85,0% e o MMLU-Redux de 92,9% para 93,4%. Apenas o SimpleQA da OpenAI apresentou uma ligeira queda, de 30,1% para 27,8%. Essas melhorias abrangentes demonstram que o DeepSeek-R1-0528 é competitivo não apenas em áreas especializadas, mas em todo o espectro de tarefas cognitivas.

Arquitetura técnica e inovações

A base técnica do DeepSeek-R1-0528 é fundamentada em uma sofisticada arquitetura MoE (Mistura de Especialistas) com 37 bilhões de parâmetros ativos de um total de 671 bilhões e um comprimento de contexto de 128.000 tokens. O modelo implementa aprendizado por reforço avançado para alcançar autoverificação, reflexão em múltiplos estágios e capacidades de raciocínio semelhantes às humanas. Essa arquitetura permite que o modelo lide com tarefas complexas de raciocínio por meio de processos de pensamento iterativos, o que o diferencia dos modelos de linguagem tradicionais.

Um aspecto particularmente inovador é o desenvolvimento de uma variante simplificada, DeepSeek-R1-0528-Qwen3-8B, criada a partir da síntese do processo de raciocínio do DeepSeek-R1-0528 para o pós-treinamento do Qwen3-8B-Base. Essa versão reduzida alcança um desempenho impressionante com requisitos de recursos significativamente menores e funciona em GPUs com 8 a 12 GB de VRAM. No teste AIME 2024, o modelo obteve desempenho de ponta entre os modelos de código aberto, com uma melhoria de 10% em relação ao Qwen3-8B e desempenho comparável ao Qwen3-235B-Thinking.

A metodologia de desenvolvimento mostra que o DeepSeek depende cada vez mais do pós-treinamento com aprendizado por reforço, o que levou a um aumento de 40% no consumo de tokens durante a avaliação – de 71 para 99 milhões de tokens. Isso sugere que o modelo está gerando respostas mais longas e profundas sem exigir mudanças arquitetônicas fundamentais.

Posicionamento de mercado e dinâmica competitiva

O DeepSeek-R1-0528 está se consolidando como um concorrente de peso para os principais modelos proprietários de empresas de tecnologia ocidentais. De acordo com a Artificial Analysis, o modelo alcançou 68 pontos, equiparando-se ao Gemini 2.5 Pro do Google e superando modelos como o Grok 3 mini da xAI, o Llama 4 Maverick da Meta e o Nemotron Ultra da Nvidia. Na categoria de código, o DeepSeek-R1-0528 fica logo abaixo do o4-mini e do o3 da OpenAI.

O lançamento da atualização teve um impacto significativo no cenário global de IA. O lançamento inicial do DeepSeek-R1 em janeiro de 2025 já havia levado a uma queda nas ações de tecnologia fora da China e desafiado a premissa de que a escalabilidade da IA ​​exige enorme poder computacional e investimento. Os concorrentes ocidentais responderam rapidamente: o Google introduziu taxas de acesso com desconto para o Gemini, enquanto a OpenAI reduziu os preços e lançou um modelo o3 Mini que requer menos poder computacional.

Curiosamente, as análises de estilo de texto do EQBench mostram que o estilo do DeepSeek-R1 é mais fortemente influenciado pelo Google do que pelo OpenAI, sugerindo que mais saídas sintéticas do Gemini podem ter sido usadas em seu desenvolvimento. Essa observação ressalta as complexas influências e transferências de tecnologia entre diferentes desenvolvedores de IA.

Relação custo-benefício e disponibilidade

Uma das principais vantagens competitivas do DeepSeek-R1-0528 reside em sua excepcional relação custo-benefício. Sua estrutura de preços é significativamente mais vantajosa do que a da OpenAI: os tokens de entrada custam US$ 0,14 por milhão de tokens para acertos no cache e US$ 0,55 para erros no cache, enquanto os tokens de saída custam US$ 2,19 por milhão de tokens. Em comparação, a OpenAI cobra US$ 15 por milhão de tokens de entrada e US$ 60 por milhão de tokens de saída, tornando o DeepSeek-R1 de 90% a 95% mais barato.

O Microsoft Azure também oferece o DeepSeek-R1 a preços competitivos: a versão global custa US$ 0,00135 por token de entrada e US$ 0,0054 por token de saída a cada 1.000 tokens, enquanto a versão regional tem preços ligeiramente mais altos. Essa precificação torna o modelo particularmente atraente para empresas e desenvolvedores que desejam aproveitar funcionalidades de IA de alta qualidade sem os altos custos de soluções proprietárias.

Sua disponibilidade como modelo de código aberto sob a licença MIT também permite o uso comercial e a modificação sem taxas de licenciamento. Os desenvolvedores podem executar o modelo localmente ou usá-lo por meio de várias APIs, oferecendo flexibilidade e controle sobre a implementação. Para usuários com recursos limitados, está disponível uma versão simplificada com 8 bilhões de parâmetros, que roda em hardware comum com 24 GB de memória.

Relacionado a isto:

A recuperação da IA ​​na China: o que significa o sucesso da DeepSeek?

O DeepSeek-R1-0528 marca um ponto de virada no desenvolvimento global de IA, demonstrando que empresas chinesas podem desenvolver modelos que competem com os melhores sistemas ocidentais, apesar das restrições de exportação dos EUA. A atualização comprova que melhorias significativas de desempenho são possíveis sem mudanças arquitetônicas fundamentais, quando otimizações pós-treinamento e aprendizado por reforço são empregados de forma eficaz. A combinação de desempenho máximo, custos drasticamente reduzidos e disponibilidade de código aberto desafia fundamentalmente os modelos de negócios estabelecidos na indústria de IA.

As reações dos concorrentes ocidentais ao sucesso do DeepSeek já mostram mudanças iniciais no mercado: reduções de preços por parte da OpenAI e do Google, bem como o desenvolvimento de modelos mais eficientes em termos de recursos. Com o lançamento previsto do DeepSeek-R2, originalmente planejado para maio de 2025, essa pressão competitiva poderá se intensificar ainda mais. A história de sucesso do DeepSeek-R1-0528 ilustra que a inovação em IA não exige necessariamente investimentos massivos e recursos computacionais, mas pode ser alcançada por meio de algoritmos inteligentes e métodos de desenvolvimento eficientes.

Relacionado a isto:

 

Seu especialista em transformação, integração e plataforma de IA

☑️ Nosso idioma comercial é inglês ou alemão

☑️ NOVO: Correspondência em seu idioma nativo!

 

Konrad Wolfenstein

Eu e minha equipe teremos o prazer de estar à sua disposição como seu consultor pessoal.

Você pode entrar em contato comigo preenchendo o formulário de contato aqui simplesmente ligando para +49 7348 4088 965. Meu endereço de e-mail é wolfenstein@xpert.digital:ou

Estou ansioso pelo nosso projeto conjunto.

 

 

☑️ Apoio a PMEs em estratégia, consultoria, planejamento e implementação

☑️ Criação ou realinhamento da estratégia de IA

☑️ Desenvolvimento de Negócios Pioneiros

Sair da versão para celular