Permanentemente mais barata e 75% mais barata, a guerra de preços da IA se intensifica: como a DeepSeek, da China, está destruindo os cálculos das gigantes tecnológicas ocidentais

Xpert Pré-lançamento

Available in 27 languages 📢

Publicado em: 26 de maio de 2026 / Atualizado em: 26 de maio de 2026 – Autor: Konrad Wolfenstein

Permanentemente mais barata e 75% mais barata, a guerra de preços da IA se intensifica: como a DeepSeek, da China, está destruindo os cálculos das gigantes tecnológicas ocidentais

Permanentemente mais barato e 75% mais barato, a guerra de preços da IA se intensifica: como a DeepSeek, da China, está destruindo os cálculos das gigantes da tecnologia ocidentais – Imagem: Xpert.Digital

Quando uma startup chinesa revoluciona os preços de toda a indústria ocidental de IA – e as corporações ocidentais repentinamente perdem o controle de seus próprios orçamentos

A IA mais barata do mundo, mas um pesadelo para a GDPR? O que o choque da DeepSeek significa para as empresas alemãs?

O fim da dependência da Nvidia: como a Huawei e a DeepSeek estão remodelando o mercado global de IA

Uma guerra de preços sem precedentes está abalando a indústria global de IA: a startup chinesa DeepSeek causou um choque no mercado com um corte permanente de 75% no preço de seu modelo principal. Impulsionada por fundos soberanos nacionais e equipada com chips da Huawei, a empresa está se libertando da dependência do hardware da Nvidia – e, repentinamente, ditando os preços globais. Isso está se provando um teste crucial para fornecedores ocidentais como a Anthropic e o Google. Eles estão respondendo com aumentos de preços ocultos por meio de estruturas de tokens alteradas, o que já está causando um aumento exponencial nos orçamentos de grandes clientes como Uber e Microsoft. Mas, embora o custo incrivelmente baixo da IA chinesa pareça altamente atraente do ponto de vista comercial, está se revelando rapidamente um enorme pesadelo em relação ao GDPR para empresas alemãs. A única solução para o dilema entre os custos exorbitantes da IA e as iminentes multas por proteção de dados reside em um caminho que poucos tomadores de decisão ainda consideraram.

DeepSeek e a nova guerra de preços da IA

Preço permanentemente mais baixo: O que significa realmente a redução de preço da DeepSeek

Em 23 de maio de 2026, a startup chinesa de IA DeepSeek anunciou que estava fixando permanentemente o desconto temporário de 75% em seu token principal, o V4-Pro. Isso significa que o preço dos tokens emitidos permanecerá permanentemente em US$ 0,87 por milhão de tokens – um nível considerado simplesmente inimaginável há poucos meses. Para efeito de comparação, os custos da API para o token anterior, a preço integral, variavam de 0,1 a 24 yuans por milhão de tokens, o que equivalia a aproximadamente US$ 0,014 a US$ 3,30 – as taxas agora permanentes são de 0,025 a 6 yuans (aproximadamente US$ 0,0035 a US$ 0,83).

Essa decisão não é mera estratégia de marketing. É o resultado de um recálculo fundamental dos custos de produção, possibilitado por dois fatores: primeiro, o modelo V4-Pro agora roda nativamente nos chips Ascend 950 da Huawei, em vez do hardware da Nvidia. Isso fez da DeepSeek o primeiro modelo de IA de ponta chinês a ser totalmente otimizado em um chipset nacional. Segundo, a empresa anunciou que os preços devem cair significativamente com a produção em massa dos supernós Ascend 950 da Huawei no segundo semestre de 2026. A mensagem estratégica é clara: a DeepSeek aposta que a escalabilidade tecnológica e a tecnologia de semicondutores nacional permitirão uma espiral descendente de custos que os concorrentes ocidentais não poderão replicar em um futuro próximo.

Chips geopolíticos em vez de capital de Wall Street: a arquitetura de financiamento por trás do ataque aos preços

Para entender por que a DeepSeek pode se dar ao luxo de cortes de preços dessa magnitude enquanto busca simultaneamente uma rodada de financiamento de um bilhão de dólares, é preciso examinar a estrutura de capital e de propriedade incomum da empresa. Fundada como um laboratório privado pelo fundo de hedge chinês High-Flyer Capital Management, a DeepSeek adotou consistentemente uma estratégia de rejeitar financiamento externo por anos. Esse período de autofinanciamento deliberado parece agora ter chegado ao fim.

Segundo informações de diversas fontes confiáveis para o MarketScreener e o Financial Times, a DeepSeek pode ser avaliada em até US$ 50 bilhões em sua primeira rodada oficial de financiamento. Isso representaria um aumento drástico na avaliação em comparação com as estimativas anteriores de apenas US$ 10 a US$ 30 bilhões. Particularmente reveladora é a identidade do potencial investidor líder: o Fundo Nacional de IA da China, com aproximadamente US$ 8,8 bilhões em capital, está em negociações para liderar esta rodada. Enquanto isso, gigantes da tecnologia como Tencent e Alibaba já haviam explorado possíveis investimentos com uma avaliação de US$ 20 bilhões. A DeepSeek pode levantar um total de US$ 3 a US$ 4 bilhões nesta rodada de financiamento.

O que à primeira vista parece ser um financiamento normal para o crescimento é, na realidade, uma forma de alocação de capital estratégica de Estado. A China está posicionando a DeepSeek como a campeã nacional de IA em uma corrida que não é mais meramente tecnológica, mas geopolítica por natureza. A fabricante de chips Huawei fornece o hardware, o fundo soberano fornece o capital e a DeepSeek fornece os modelos – um ecossistema vertical significativamente mais resiliente aos controles de exportação e sanções dos EUA do que qualquer solução baseada em GPUs da Nvidia.

A estratégia de preços dos concorrentes ocidentais: quando os tokenizadores se tornam uma arma de preços

Enquanto a DeepSeek reduz drasticamente seus custos, a Anthropic e o Google estão seguindo na direção oposta – ainda que por meio de métodos tecnicamente disfarçados que recebem pouca atenção no debate público. Como revela um relatório detalhado da FAZ de abril de 2026, a Anthropic redesenhou fundamentalmente o tokenizador de seus modelos mais recentes, com a nova versão gerando de 32% a 45% mais tokens nativos com texto idêntico. Isso significa que qualquer pessoa que execute a mesma tarefa de antes está, na prática, pagando significativamente mais – sem que nenhum preço de tabela oficial tenha sido aumentado.

Esse método de aumentos de preços ocultos é particularmente insidioso do ponto de vista econômico, pois é difícil para muitos clientes corporativos prevê-los. Os orçamentos são planejados com base em padrões de uso históricos, e não em nuances tokenomics. O aumento efetivo de custos pode, portanto, facilmente chegar a 22% a 37%. Soma-se a isso a eliminação dos modelos de tarifa fixa. A Anthropic gradualmente fez a transição de seus clientes corporativos de assinaturas com preço fixo para cobrança por tokens baseada exclusivamente no uso. O que representa um fluxo de receita mais confiável para os provedores se torna um fator de custo fundamentalmente imprevisível para os clientes corporativos.

O Google está implementando uma estratégia semelhante com seus modelos Gemini: a variante Flash mais barata permanece competitiva, enquanto os modelos Pro de alto desempenho têm preços significativamente mais altos. O Gemini 3.1 Pro, por exemplo, custa US$ 2 de entrada e US$ 12 de saída por milhão de tokens – consideravelmente mais barato que o Claude Opus 4.7, com US$ 5 de entrada e US$ 25 de saída, mas ainda cerca de 14 vezes mais caro que o DeepSeek V4 Pro em seu preço perpétuo atual.

Ubiquidade e choque orçamentário: quando as ferramentas de IA sobrecarregam financeiramente a empresa

Talvez a ilustração mais marcante da nova realidade de custos venha da Uber. A empresa de transporte por aplicativo implementou o Claude Code, ferramenta de programação de terminais com inteligência artificial da Anthropic, para algumas equipes em dezembro de 2025 — sem um plano de implementação coordenado, mas impulsionada pela demanda orgânica. Em dezembro, 32% de seus engenheiros estavam usando a ferramenta. Em fevereiro de 2026, esse número havia subido para 63%. Em abril, o diretor de tecnologia, Praveen Neppalli Naga, anunciou que todo o orçamento para IA em 2026 — para aproximadamente 5.000 engenheiros — já havia sido completamente esgotado. Quatro meses, o orçamento de um ano inteiro. A empresa, segundo o diretor de tecnologia, estava "de volta à prancheta" em relação às suas projeções financeiras.

Este caso não é um incidente isolado, mas sim sintomático de uma falha estrutural nas operações financeiras (FinOps) de IA empresarial. As empresas aprenderam a orçar licenças de software. Ainda não aprenderam a prever e gerenciar os custos de uso baseados em tokens. O Claude Opus 4.7 — o modelo preferido para tarefas de programação complexas — custa US$ 5 em entrada e US$ 25 em saída por milhão de tokens. Quando 5.000 engenheiros processam repositórios de código complexos por meio do modelo diariamente, fluxos de dados são gerados em segundo plano, crescendo exponencialmente e, com ampla adoção, podem exceder os limites orçamentários em poucas semanas.

A Microsoft oferece o segundo exemplo marcante: em dezembro de 2025, a gigante do software convidou milhares de seus desenvolvedores a usar o Claude Code em seu trabalho diário. A ferramenta rapidamente se tornou popular — popular demais. No final de maio de 2026, foi anunciado internamente que todas as licenças do Claude Code seriam encerradas em 30 de junho de 2026. A Microsoft recomendou que os desenvolvedores afetados que trabalhavam com Windows, Microsoft 365, Outlook, Teams e Surface migrassem seus fluxos de trabalho para o GitHub Copilot CLI. A explicação oficial permaneceu vaga, mas os dados falam por si: a cobrança baseada em tokens esgotou completamente o orçamento do segmento de IA em apenas alguns meses. Ironicamente, a Microsoft continua sendo um cliente da Anthropic: os modelos do Claude (Haiku, Sonnet, Opus) ainda estão disponíveis via GitHub Copilot CLI — o modelo de negócios muda, mas a dependência tecnológica permanece.

A disfunção estrutural: por que os modelos de precificação por token destroem sistematicamente os orçamentos empresariais

Os casos da Uber e da Microsoft não são erros de gestão. São o produto direto de uma incompatibilidade estrutural entre os modelos de faturamento dos fornecedores de IA e os ciclos de planejamento das grandes corporações. O software tradicional é licenciado: por usuário, por ano, com valores previsíveis e orçamentários. As APIs de IA, por outro lado, são faturadas como eletricidade – com base no uso, de forma dinâmica, e o custo real só é conhecido posteriormente.

O problema é agravado por diversas dinâmicas simultâneas. Primeiro, o consumo de tokens por tarefa é praticamente impossível de estimar para não especialistas. Um desenvolvedor que utiliza o Claude Code para analisar um repositório de código de 10.000 linhas irá, sem saber ou intencionalmente, gerar centenas de milhares de tokens em segundo plano. Segundo, a maioria das empresas atualmente não possui a infraestrutura de observabilidade necessária: ferramentas como Langfuse ou Helicone, que registram cada chamada de API com a contagem de tokens e a discriminação de custos, são utilizadas por apenas uma pequena parcela das empresas até o momento. Terceiro, a eliminação de taxas fixas por provedores como a Anthropic cria um vácuo no planejamento: os perfis de uso anteriores não são mais válidos, pois tanto as atualizações do tokenizador quanto a adoção de novos fluxos de trabalho baseados em agentes alteram significativamente o consumo por tarefa.

Essa situação é vantajosa para os provedores no curto prazo – volumes de consumo maiores e mais difíceis de controlar geram maior receita. No médio prazo, porém, as consequências são iminentes: as empresas irão limitar o uso, migrar cargas de trabalho para modelos mais baratos ou avaliar opções de hospedagem própria. O prejuízo para a Anthropic com o término do contrato com a Microsoft e a saída da Uber não é apenas financeiro, mas também estratégico: ambas as empresas eram clientes de referência importantes.

Uma nova dimensão da transformação digital com 'IA Gerenciada' (Inteligência Artificial) - Plataforma e solução B2B | Xpert Consulting

Uma nova dimensão da transformação digital com 'IA Gerenciada' (Inteligência Artificial) – Plataforma e solução B2B | Xpert Consulting - Imagem: Xpert.Digital

Aqui você aprenderá como sua empresa pode implementar soluções de IA personalizadas de forma rápida, segura e sem grandes barreiras de entrada.

Uma plataforma de IA gerenciada é a sua solução completa e descomplicada para inteligência artificial. Em vez de lidar com tecnologia complexa, infraestrutura cara e processos de desenvolvimento demorados, você recebe uma solução pronta, personalizada para suas necessidades, de um parceiro especializado – geralmente em poucos dias.

Principais vantagens em resumo:

⚡ Implementação rápida: Da ideia à aplicação pronta para uso em dias, não em meses. Oferecemos soluções práticas que geram valor agregado imediato.

🔒 Máxima segurança de dados: Seus dados sensíveis permanecem com você. Garantimos o processamento seguro e em conformidade com as normas, sem compartilhar dados com terceiros.

💸 Sem risco financeiro: você só paga pelos resultados. Os altos investimentos iniciais em hardware, software ou pessoal são completamente eliminados.

🎯 Concentre-se no seu negócio principal: Foque no que você faz de melhor. Nós cuidamos de toda a implementação técnica, operação e manutenção da sua solução de IA.

📈 Preparada para o futuro e escalável: Sua IA cresce com você. Garantimos otimização e escalabilidade contínuas, adaptando os modelos de forma flexível a novas necessidades.

Mais informações aqui:

A Solução de IA Gerenciada - Serviços de IA Industrial: A Chave para a Competitividade nos Setores de Serviços, Indústria e Engenharia Mecânica

Da euforia ao controle de custos: como a DeepSeek está transformando o mercado de IA

Geopolítica dos chips: DeepSeek como resposta estratégica aos controles de exportação dos EUA

Para compreender plenamente o sucesso da DeepSeek, é preciso analisá-lo no contexto do conflito tecnológico entre os EUA e a China. Desde 2022, os EUA vêm impondo gradualmente restrições à exportação de chips de alto desempenho para a China, mais recentemente com regras mais rígidas para os chips A100 e H100 da Nvidia, bem como para seus sucessores. A intenção explícita era desacelerar o desenvolvimento de IA na China. O resultado foi o oposto: a DeepSeek desenvolveu modelos que alcançam resultados comparáveis com uma fração da capacidade computacional e os otimizou para os chips Ascend da Huawei – uma tecnologia que dificilmente está disponível fora das cadeias de suprimentos chinesas, mas que também não está sujeita às sanções dos EUA.

A mudança para o Huawei Ascend 950 não é apenas uma necessidade técnica, mas uma emancipação geopolítica. Isso torna o DeepSeek independente das cadeias de fornecimento de chips americanas e do poder de precificação da Nvidia. O anúncio de que os preços devem cair ainda mais quando a produção em massa dos supernós Ascend 950 começar sugere um ataque de preços planejado a longo prazo – não uma oferta promocional pontual, mas um posicionamento estratégico e de longo prazo como a API de IA de alto desempenho mais acessível do mundo.

Para os provedores ocidentais, isso representa um dilema: eles não podem reduzir os preços arbitrariamente porque sua infraestrutura depende de hardware da Nvidia, que está ficando mais caro a cada mês. Ao mesmo tempo, a pressão por investimentos está aumentando: as principais empresas de tecnologia americanas – Amazon, Microsoft, Meta e Google – anunciaram planos para investir um total combinado de cerca de US$ 650 bilhões em infraestrutura de IA até 2026. Esses gastos precisam ser recuperados, o que estruturalmente força preços de API mais altos ou, pelo menos, limita significativamente o escopo para reduções de preços. De acordo com a Gartner, o gasto global total com IA chegará a US$ 2,59 trilhões em 2026, um aumento de 47% em comparação com o ano anterior.

O dilema da privacidade de dados: racionalidade econômica versus realidade regulatória

O token mais barato é inútil se o seu uso resultar em multa. Este é o principal dilema para empresas europeias, especialmente alemãs, que consideram a IA chinesa: a DeepSeek oferece uma relação custo-benefício excepcional, mas um perfil de privacidade de dados altamente problemático. Autoridades de proteção de dados em diversos estados alemães já iniciaram investigações. Dieter Kugelmann, comissário de proteção de dados da Renânia-Palatinado, resumiu a situação de forma sucinta: "Parece que a DeepSeek deixa a desejar em praticamente todos os aspectos da legislação de proteção de dados."

As críticas específicas são sérias. A política de privacidade da DeepSeek inclui o registro explícito de padrões de digitação – um método que, segundo o Escritório Federal Alemão para Segurança da Informação (BSI), pode ser usado indevidamente para identificação de usuários e levou o BSI a classificar a tecnologia como "no mínimo questionável para áreas críticas de segurança". Todos os dados dos usuários são armazenados em servidores na China, um país que não possui um nível de proteção de dados compatível com o GDPR. A legislação chinesa de inteligência obriga as empresas chinesas a cooperarem com as autoridades de segurança – o que, na prática, implica em potencial acesso do Estado aos dados. A autoridade italiana de proteção de dados já bloqueou a DeepSeek.

No entanto, seria uma análise incompleta atribuir esses riscos exclusivamente à IA chinesa sem mencionar a contraparte: a Lei de Computação em Nuvem dos EUA obriga as empresas americanas a concederem às autoridades acesso aos dados armazenados – independentemente de onde esses dados estejam fisicamente localizados. Tanto a OpenAI quanto a Anthropic operam sob essa estrutura legal. A diferença crucial reside na conformidade com o GDPR: os provedores americanos possuem subsidiárias europeias, contratos de processamento de dados e estruturas de proteção de dados reconhecidas. A DeepSeek, por outro lado, até onde sabemos, não possui subsidiária europeia nem representante legal na UE.

A opção de auto-hospedagem: quando o código aberto preenche a lacuna entre preço e privacidade de dados

No entanto, surge aqui uma segunda opção que recebeu pouca atenção no debate público até o momento: o DeepSeek é um software de código aberto sob a licença MIT. Isso significa que as empresas podem executar o modelo em sua própria infraestrutura – sem precisar transferir dados para provedores externos, em total conformidade com o GDPR e com custos operacionais que podem ser significativamente menores do que os preços das APIs, mesmo dos provedores mais baratos.

Consultorias de tecnologia como a Zühlke destacaram explicitamente isso como uma oportunidade estratégica: hospedar o DeepSeek em infraestrutura própria ou em ambientes de nuvem controlados, como Azure ou AWS, permite total soberania dos dados, mantendo um desempenho competitivo. O custo por milhão de tokens cai para € 0,40 ou menos com a hospedagem própria, dependendo da configuração do hardware – em comparação com € 1 a € 3 para APIs em nuvem. A desvantagem reside na complexidade operacional: os modelos de hospedagem própria exigem conhecimento em IA e infraestrutura, atualizações regulares, gerenciamento de segurança e um pipeline de avaliação robusto.

Para grandes empresas com operações de TI próprias e infraestrutura de nuvem existente, essa é uma opção viável. Para PMEs, no entanto, a abordagem via API continua sendo mais pragmática, desde que as questões de privacidade de dados possam ser contornadas utilizando exclusivamente dados públicos e não pessoais. A matriz de decisão é, portanto, complexa: não se trata apenas do menor preço do token, mas do custo total, incluindo custos de API, investimento em infraestrutura, esforço de conformidade e o risco estratégico de dependência de fornecedor.

Consequências estruturais do mercado: da euforia em torno da IA à contabilização de custos realista

O analista da Gartner, John-David Lovelock, descreveu acertadamente a fase atual da indústria como o "ano da integração pragmática" — a euforia inicial em torno da IA generativa deu lugar a uma análise sóbria de custo-benefício. Essa mudança de perspectiva se reflete nos dados: embora a projeção seja de um crescimento de 47% nos gastos globais com IA, atingindo US$ 2,59 trilhões em 2026, um estudo revela simultaneamente que aproximadamente 72% dos investimentos em IA não geram um retorno mensurável sobre o investimento. A era dos projetos-piloto acríticos acabou; as empresas exigem resultados de negócios mensuráveis.

Nesse contexto, a redução de preço da DeepSeek não é apenas uma manobra competitiva, mas um catalisador para uma consolidação de mercado há muito esperada. Ela força uma reavaliação dos fundamentos econômicos de todo o mercado de LLM (Loading Learning Management). Quando um modelo de vanguarda com uma janela de contexto de 1 milhão de tokens está disponível por US$ 0,87 por milhão de tokens de saída, alternativas mais caras só podem ser justificadas por vantagens de qualidade comprovadas — e não apenas por fidelidade à marca ou conveniência.

Os efeitos a médio e longo prazo na estrutura de mercado são abrangentes. Primeiro, a pressão sobre todos os fornecedores para que divulguem de forma transparente suas estruturas de custos e justifiquem seus preços está aumentando. Segundo, a demanda por estratégias com múltiplos fornecedores, que distribuem as cargas de trabalho entre os modelos mais econômicos com base nos requisitos, está crescendo — um desenvolvimento que favorece agregadores de API e soluções de roteamento. Terceiro, a questão da dependência de um único fornecedor está se tornando mais urgente: empresas que construíram toda a sua estratégia de IA em torno de um único fornecedor proprietário agora enfrentam correções dispendiosas.

Recomendações estratégicas: O que os tomadores de decisão precisam fazer agora

O desenvolvimento que levou à redução permanente do preço da DeepSeek não é temporário. Ele marca a transição de uma fase de adoção experimental de IA para uma em que os custos operacionais da IA devem ser gerenciados de forma tão estratégica quanto outros fatores de produção. Empresas que continuam a depender acriticamente das APIs mais caras sem avaliar alternativas estão agindo de forma negligente do ponto de vista comercial.

Especificamente, isso significa que toda estratégia de IA atual deve incluir uma arquitetura de custos que incorpore o escalonamento de modelos (os modelos certos para as tarefas certas), a observabilidade (rastreamento de tokens no nível da tarefa) e a diversificação de fornecedores como componentes integrados. Usar o Claude Opus para todas as tarefas quando o GPT-4.1 Mini poderia resolver o problema por quinze vezes menos não é sinal de qualidade, mas sim um erro de orçamento. As experiências da Uber e da Microsoft devem ser levadas a sério como um alerta: o consumo de tokens não escala linearmente com o número de usuários, mas exponencialmente com a intensidade do uso de IA por eles.

Para as empresas europeias, também é importante lembrar: uma estratégia de IA sem uma arquitetura de proteção de dados é incompleta. O provedor mais barato pode acabar sendo caro a longo prazo se multas do GDPR, danos à reputação ou requisitos regulatórios forem adicionados à equação. A questão não é se a IA chinesa é fundamentalmente utilizável — certamente é em condições de auto-hospedagem — mas sim qual estrutura legal e tecnológica deve ser estabelecida para ela. Usar modelos de código aberto como o DeepSeek em conformidade com as regulamentações de proteção de dados em infraestrutura de nuvem europeia certificada oferece uma maneira de combinar vantagens de custo com conformidade regulatória.

A guerra de preços no mercado de LLM não é um episódio passageiro. Trata-se da redefinição estrutural de um mercado que, até 2025, era dominado pelo poder de precificação dos fornecedores. Com a redução permanente de 75% nos preços da DeepSeek e o apoio estratégico do Estado chinês, surgiu uma nova força gravitacional, que puxa toda a estrutura de preços para baixo. Qualquer pessoa que ignore isso — seja uma empresa que utiliza IA ou um fornecedor que vende IA — coloca em risco sua competitividade no médio prazo.

🎯🎯🎯 Hub de dados para o setor B2B como uma solução quase interna

A solução quase interna: como a Xpert.Digital elimina as lacunas operacionais no marketing e vendas B2B – Negócios inteligentes orientados por conteúdo - Imagem: Xpert.Digital

A Xpert.Digital é um hub industrial B2B orientado por dados, liderado por Konrad Wolfenstein . A empresa atua como uma solução externa, quase interna, para parceiros industriais, preenchendo lacunas operacionais em marketing, conteúdo e vendas – sem exigir recursos adicionais por parte do cliente.

Mais informações aqui:

A solução quase interna: como a Xpert.Digital elimina as lacunas operacionais em marketing e vendas B2B – Negócios Inteligentes Orientados por Conteúdo

Seu parceiro global de marketing e desenvolvimento de negócios

☑️ Nosso idioma comercial é inglês ou alemão

☑️ NOVO: Correspondência em seu idioma nativo!

Konrad Wolfenstein

Eu e minha equipe teremos o prazer de estar à sua disposição como seu consultor pessoal.

Você pode entrar em contato comigo preenchendo o formulário de contato aqui simplesmente ligando para +49 7348 4088 965. Meu endereço de e-mail é [email protected]:ou

Estou ansioso pelo nosso projeto conjunto.