Seleção de voz 📢


Grupo de formigas (Alibaba) alcança a IA Breakthrough: modelos mais baratos por meio de combinação inovadora de chips

Publicado em: 24 de março de 2025 / atualização de: 24 de março de 2025 - Autor: Konrad Wolfenstein

Grupo de formigas (Alibaba) alcança a IA Breakthrough: modelos mais baratos por meio de combinação inovadora de chips

Grupo de formigas (Alibaba) alcança a IA Breakthrough: modelos mais baratos por meio de imagem inovadora de combinação de chips: xpert.digital

Avanço tecnológico da China: os modelos de IA são 20 % mais econômicos

O conflito comercial impulsiona o progresso tecnológico em chips de IA

O grupo Ant, uma subsidiária da gigante da tecnologia chinesa Alibaba, anunciou um avanço significativo no desenvolvimento dos modelos de IA. Com uma combinação inovadora de semicondutores da produção chinesa e dos EUA, a empresa consegue treinar seus modelos de IA em 20 % mais baratos. Esse desenvolvimento pode ter consequências de longo alcance para o mercado global de chips de IA e fortalecer a posição da China na competição de tecnologia. É particularmente digno de nota que o grupo de formigas depende do desempenho mais fraco, mas eficiente, às alternativas de nvidia de alto preço, sem ter que aceitar qualidade significativa de qualidade. No contexto, isso acontece entre os EUA e a China e representa um passo importante para uma maior independência tecnológica.

Adequado para:

A inovadora estratégia de chips do grupo de formigas

A solução desenvolvida pelo grupo ANT é baseada em uma mistura inteligente de diferentes tipos de semicondutores. Em vez de confiar exclusivamente nos chips NVIDIA H800 poderosos, mas caros, a empresa agora usa cada vez mais alternativas econômicas de fabricantes de AMD e chineses como o próprio Alibaba e Huawei. O desenvolvimento dessa estratégia alternativa de chips foi significativamente acelerado pelas restrições de exportação dos EUA para chips de alto desempenho para a China.

Para seus modelos de treinamento de IA, o grupo de formigas usa a abordagem "Mistura de especialistas" (MOE), uma técnica que permite que grandes modelos de linguagem treinem com mais eficiência. Com esse método, as tarefas são divididas em registros de dados menores, a fim de processá -los com mais eficiência - “semelhante ao uso de uma equipe de especialistas, que se concentra em uma certa parte do problema para melhorar a eficiência geral”. Essa abordagem já se provou em outras empresas, como o Google e a startup chinesa Deepseek.

Desempenho técnico e comparação com a NVIDIA

Apesar da mudança para chips supostamente mais fracos, o grupo Ant afirma alcançar resultados comparáveis ​​aos do hardware da NVIDIA. De acordo com suas próprias declarações, a empresa conseguiu reduzir o custo do treinamento de um trilhão de token de 6,35 milhões de yuans (cerca de 810.000 euros) para 5,1 milhões de yuans. Essa notável redução de custos com o mesmo desempenho pode aumentar a pressão sobre a NVIDIA como fornecedor dominante de chips de IA.

O grupo Ant publicou recentemente um trabalho de pesquisa no qual afirma que seus modelos em certos parâmetros de referência podem até exceder o desempenho de modelos de outras grandes empresas de tecnologia, como a Meta. Especialmente na área dos benchmarks chineses, os próprios modelos de idiomas Ling-Lite e Ling-plus pretendem fazer melhor do que os modelos comparáveis ​​da DeepSeek.

Efeitos econômicos e otimização de custos

A otimização de custos por meio de estratégias alternativas de chip está se tornando cada vez mais importante na indústria de IA. Embora os preços dos atendimento final ao cliente, como o ChatGPT, permaneçam relativamente estáveis, os custos na faixa B2B diminuem continuamente. O próprio Alibaba já havia reduzido os preços de vários modelos de IA no ano passado, incluindo uma redução de preços de 85 % para sua duração de visão de Qwen-VL.

Esses custos fazem parte de uma tendência maior na indústria de IA, que é alimentada por vários fatores:

  1. A alta competição entre diferentes fornecedores, ambos na China (Alibaba, Tencent, Baidu, JD, Huawei e Bytedance), bem como globais
  2. O desenvolvimento de modelos menores e mais econômicos que estão se tornando cada vez mais poderosos
  3. Novos métodos como a destilação do modelo, na qual o conhecimento de um grande modelo é transferido para um menor
  4. A pressão de custo por meio de numerosos modelos de código aberto ou disponíveis gratuitamente, como a Família Metas Llama

A crescente importância dos modelos de IA econômicos

O avanço anunciado pelo grupo Ant chega em um momento em que a eficiência dos modelos de IA se concentra cada vez mais. Em janeiro, a start-up chinesa Deepseek causou alvoroço quando apresentou um modelo de IA que foi treinado com recursos significativamente mais baixos do que os modelos anteriores. Esse desenvolvimento levou a um declínio dramático no preço das ações da NVIDIA.

No entanto, o CEO da Nvidia, Jensen Huang, argumenta que a necessidade real de capacidade aritmética não é criada durante o treinamento, mas ao gerar as respostas. No entanto, a abordagem do grupo de formigas mostra que uma economia de custos considerável também é possível na área do treinamento de IA.

Adequado para:

Significado geopolítico e soberania tecnológica

O desenvolvimento do grupo ANT tem uma dimensão geopolítica significativa. As rigorosas restrições de exportação dos EUA em chips de alto desempenho levaram cada vez mais empresas chinesas a procurar alternativas à tecnologia americana. Em dezembro de 2023, a ministra do Comércio dos EUA, Gina Raimondo, deixou claro que os chips de IA não deveriam ser entregues à China no estado atual da arte e que a indústria chinesa não deve ser habilitada para produzi -la.

Nesse contexto, a estratégia de chips do Ant Group é um passo importante para uma maior independência tecnológica. Dominar os controles de exportação sobre os chips da NVIDIA ”.

Efeitos na competição de tecnologia global

A China não apenas faz grandes esforços na área de carros elétricos, mas também na IA para chegar ao líder do mercado mundial. A abordagem inovadora do grupo ANT pode servir como modelo para outras empresas chinesas que precisam operar em um ambiente geopolítico cada vez mais complexo. A capacidade de acessar diferentes tecnologias de maneira flexível pode ser uma vantagem competitiva decisiva.

Os desenvolvimentos recentes mostram que a China fez um progresso significativo na área da IA, apesar das restrições dos EUA. Semelhante ao grupo ANT, a DeepSeek também provou com seu modelo R1 que você pode obter serviços semelhantes, como o OpenAis Chat com hardware mais antigo e apenas uma fração do orçamento.

Implicações mais amplas para o mercado global de IA

O avanço anunciado pelo grupo ANT pode ter efeitos de longo alcance no mercado global de IA. Uma guerra de preços de provedores de IA está assumida na China há meses. O gatilho foi a publicação de "V2", o antecessor da AI atual "V3" da Deepseek. Em resposta a isso, o Alibaba e outros grupos de tecnologia, como Baidu e Tencent, reduziram os preços para o uso de seus respectivos programas de IA em até 97 %.

Pressão de preços e otimização no contexto global

A pressão de preço na área de IA não se limita à China. Empresas ocidentais como o Google também começaram a otimizar seus modelos de IA e reduzir os preços. Por exemplo, o Google reduziu os preços de seu Gemini 1,5 por modelo para tokens de entrada e saída em mais de 50 % em setembro de 2024.

Os desenvolvimentos no grupo ANT e em outras empresas chinesas podem aumentar essa tendência global. É particularmente interessante que os modelos mais baratos não precisem necessariamente ser menos eficientes. O Google relata, por exemplo, de aumentos significativos de desempenho em seus modelos otimizados, especialmente nas áreas de matemática (melhoria de 20 %), contexto e visão longos.

Outro ponto de virada no desenvolvimento da IA ​​da China?

O avanço anunciado pelo grupo Ant poderia marcar um importante ponto de virada no desenvolvimento da IA. A capacidade de treinar modelos eficientes de IA com chips mais econômicos pode desafiar o domínio da Nvidia no mercado de chips de IA e promover a democratização das tecnologias de IA.

Esse desenvolvimento também mostra como as empresas podem fortalecer sua posição em um ambiente de mercado dinâmico e desafiador por meio de abordagens inovadoras e parcerias estratégicas. O uso de uma base de chip diversificada pode ser uma maneira de dominar os desafios das cadeias de suprimentos globais e, ao mesmo tempo, reduzir os custos de desenvolvimento.

Para o futuro, resta saber se outras empresas seguirão o exemplo do grupo ANT e desenvolverão estratégias semelhantes. A capacidade de treinar modelos de IA pode ser uma vantagem competitiva decisiva em um mercado cada vez mais competitivo e, finalmente, permitir o acesso às tecnologias de IA para uma gama mais ampla de organizações e aplicativos.

Adequado para:

 

Seu parceiro global de marketing e desenvolvimento de negócios

☑️ Nosso idioma comercial é inglês ou alemão

☑️ NOVO: Correspondência em seu idioma nacional!

 

Pioneiro Digital - Konrad Wolfenstein

Konrad Wolfenstein

Ficarei feliz em servir você e minha equipe como consultor pessoal.

Você pode entrar em contato comigo preenchendo o formulário de contato ou simplesmente ligando para +49 89 89 674 804 (Munique) . Meu endereço de e-mail é: wolfenstein xpert.digital

Estou ansioso pelo nosso projeto conjunto.

 

 

☑️ Apoio às PME em estratégia, consultoria, planeamento e implementação

☑️ Criação ou realinhamento da estratégia digital e digitalização

☑️ Expansão e otimização dos processos de vendas internacionais

☑️ Plataformas de negociação B2B globais e digitais

☑️ Pioneiro em Desenvolvimento de Negócios / Marketing / RP / Feiras Comerciais


⭐️ Inteligência Artificial (IA) - blog de IA, hotspot e hub de conteúdo ⭐️ Transformação Digital ⭐️ XPaper