Publicado em: 6 de abril de 2025 / atualização de: 6 de abril de 2025 - Autor: Konrad Wolfenstein
LLAMA 4: A nova geração de sistemas de IA abertos da Meta
Llama 4 revelou: metas -chave para a próxima Idade da IA
Meta apresentou a última geração de seus modelos de IA, LLAMA 4, em 5 de abril de 2025. Esses novos modelos representam progresso significativo no desenvolvimento de sistemas de IA abertos e têm várias funções inovadoras que aumentam significativamente seu desempenho e eficiência. A série LLAMA 4 consiste em modelos diferentes, com dois deles já disponíveis ao público, enquanto o modelo mais poderoso ainda está na fase de treinamento.
Adequado para:
A família modelo LLAMA 4
A Meta desenvolveu três modelos diferentes na série LLAMA 4, cada um dos quais é otimizado para diferentes aplicações:
LLAMA 4 Scout
LLAMA 4 Scout é um modelo compacto com especificações técnicas impressionantes:
- 17 bilhões de parâmetros ativos com 16 especialistas (um total de 109 bilhões de parâmetros)
- Pode ser operado em uma única GPU NVIDIA H100 com quantização INT4
- Tem uma janela de contexto notavelmente grande de 10 milhões de tokens, o que o torna um dos primeiros modelos abertos com esta capacidade
De acordo com a Meta, o Scout excede outros modelos em sua classe como Gemini 3, Gemini 2.0 Flash-Lite e Mistral 3.1. É particularmente adequado para tarefas como o resumo de documentos longos, personalização com base em dados do usuário e conclusões complexas sobre grandes quantidades de conhecimento.
Lhama 4 Maverick
Llama 4 Maverick é o mais poderoso dos dois modelos disponíveis:
- 17 bilhões de parâmetros ativos com 128 especialistas (um total de 400 bilhões de parâmetros)
- A versão experimental de bate -papo chegou ao ELO 1417 em Lmarena
- Exceda modelos como GPT-4O e Gemini 2.0 Flash em vários benchmarks
Esse modelo é particularmente adequado para aplicativos de assistência geral e bate -papo, como escrita criativa e mostra resultados comparáveis à DeepSeek V3 nas tarefas de raciocínio e codificação, mas com metade dos parâmetros.
Lhama 4 gigante
LLAMA 4 Behemoth é o modelo mais poderoso da Metas, que ainda não está disponível ao público:
- 288 bilhões de parâmetros ativos com 16 especialistas (um total de quase 2 trilhões de parâmetros)
- De acordo com a Meta, excede o GPT-4.5, Claude Sonnet 3.7 e Gemini 2.0 Pro para vários benchmarks de caule
- Serve como um "modelo de professor" para os modelos menores de llama 4
Atualmente, o Behemoth ainda está na fase de treinamento e será publicado posteriormente.
Inovações técnicas
A série Model Llama 4 apresenta várias inovações técnicas importantes que melhoram seu desempenho e eficiência:
Mistura de arquitetura de especialistas (MOE)
Uma das inovações mais importantes da LLAMA 4 é a mistura de arquitetura de especialistas (MOE), na qual apenas uma parte dos parâmetros do modelo é ativada para todo token:
- Isso reduz significativamente o esforço de cálculo e a latência, enquanto o alto desempenho é preservado
- Na LLAMA 4 Maverick, cada token é processado por um especialista comum e um dos 128 especialistas gerizados
- Essa arquitetura possibilita aumentar o parâmetro total do modelo sem aumentar os custos de inferência
Multimodalidade nativa com fusão precoce
LLAMA 4 é o primeiro modelo aberto com multimodalidade nativa pelo Fusion Early:
- Os tokens de texto e imagem são integrados em uma arquitetura de modelo uniforme
- Isso permite treinamento preliminar conjunto com grandes quantidades de dados de texto, imagem e vídeo
- Em contraste com o LLAMA 3.2, que usou parâmetros separados para texto e imagens, o LLAMA 4 entende ambas as modalidades nativas com os mesmos parâmetros
Janela de contexto extremamente longa
A janela de contexto extremamente longa do Scout 4 Scout é particularmente impressionante:
- Com 10 milhões de tokens, ele excede claramente a maioria dos modelos disponíveis
- Isso permite o processamento de documentos muito longos, bases de código inteiras ou conversas extensas
- A arquitetura do irope (camadas de atenção intercalada) torna isso possível
Novos métodos de treinamento
A Meta usou vários métodos inovadores para o treinamento do LLAMA 4:
- MEtap: uma técnica para a robusta coordenação de hiperâmetro do modelo crítico
- FP8 Precisão: Uso de números de slides de 8 bits para treinamento eficiente
- Co-Distilação: Uso de Llama 4 Behemoth como modelo de professor para modelos menores
- Aprendizagem on-line totalmente assíncrona com reforços: uma nova infraestrutura para aprendizado em larga escala
Disponibilidade e integração
Os modelos LLAMA 4 estão disponíveis por várias plataformas e serviços:
Download e fornecedor de nuvem
- Os modelos Scout e Maverick podem ser baixados diretamente do Meta ou via Hugging Face
- Eles também estão disponíveis através de várias plataformas em nuvem:
- Cloudflare Workers AI
- Azure AI Foundry e Azure Databricks
- VERTEX AI do Google Cloud
- Outros parceiros seguirão nos próximos dias
Integração em meta produtos
A Meta já atualizou seus assistentes de IA em várias plataformas no LLAMA 4:
- Whatsapp, Messenger e Instagram diretamente em 40 países diferentes
- O site da Meta.ai
- No entanto, as funções multimodais estão atualmente disponíveis apenas para usuários de inglês -linguagem nos EUA
Adequado para:
- Meta Ai na Alemanha está aqui! WhatsApp, Instagram e Facebook Obtenha a IA-com diferenças importantes na versão dos EUA
Licença e controvérsia
Embora a meta llama 4 se refere ao "código aberto", existem algumas restrições na licença que desencadearam controvérsia:
Restrições de licença
A licença comunitária LLAMA 4 contém várias restrições:
- Empresas com mais de 700 milhões de usuários ativos mensais precisam de uma licença especial da Meta
- Aparentemente, os modelos não têm permissão para usar ou distribuir usuários e empresas da UE, presumivelmente devido a requisitos regulatórios
- Existem requisitos em relação à nomeação e atribuição para modelos derivados
Debate sobre "código aberto"
Há um debate sobre se o llama 4 deve realmente ser chamado de "código aberto":
- A iniciativa de código aberto descobriu em 2023 que as restrições na licença de llama retiram -a “da categoria 'Open Source'"
- Os críticos argumentam que é mais um modelo de "fonte-aberto" ou "com pesos abertos" do que o software de código aberto real
- As restrições de licença podem ser problemáticas para pequenas empresas sem seus próprios departamentos legais
Planos futuros
Meta já deu algumas idéias sobre seus planos futuros para o LLAMA 4 e além:
Llamacon e outros anúncios
- A Meta organizará a Primeira Conferência de Llamacon em 29 de abril de 2025, na qual mais detalhes sobre seus modelos e planos de produtos de IA devem ser anunciados
- A empresa também planeja publicar um aplicativo dedicado para seu bot de meta-batinha no segundo trimestre
Expansão de habilidades linguísticas
- A Meta está trabalhando para melhorar as habilidades linguísticas do Llama 4 para permitir conversas mais naturais
- O objetivo é permitir diálogos mais fluidos e bilaterais nos quais os usuários podem interromper o modelo de IA
- Chris Cox, diretor de produtos da Meta, descreveu a próxima llama 4 como um "modelo OMNI" que permite a língua nativa, em vez de traduzir a linguagem em texto
IA agêntica e habilidades estendidas
- Mark Zuckerberg anunciou que o LLAMA 4 terá “habilidades de agente” que devem permitir novos aplicativos
- A Meta pretende desenvolver modelos de IA que “realizam ações generalizadas, é claro que se comunicam com as pessoas e resolvam problemas desafiadores”
- A empresa está pensando em oferecer assinaturas premium para seu assistente de IA para fins de agente, como reservas ou produção de vídeo
Por que o lhama 4 é um ponto de virada na paisagem da IA
A publicação do LLAMA 4 representa uma etapa significativa na estratégia de metas para se tornar a área líder da IA generativa na área altamente competitiva. Com a introdução da mistura de arquitetura de especialistas, multimodalidade nativa e uma janela de contexto impressionantemente longa, a meta mostra que os modelos abertos podem acompanhar os modelos proprietários das grandes empresas de tecnologia.
Apesar da controvérsia sobre o licenciamento e a questão de saber se o LLAMA 4 deveria realmente ser chamado de "código aberto", o progresso técnico é um marco importante. A capacidade dos modelos de processar texto e imagens abre novas oportunidades para desenvolvedores e empresas.
Com o excelente gigante Llama 4 e os planos anunciados para habilidades expandidas de idiomas e agentes, fica claro que a Meta intensificará ainda mais seus investimentos na IA. Os próximos meses mostrarão como esses novos modelos mudam o cenário da IA e se, como previsto por Mark Zuckerberg, eles realmente ajudarão a criar modelos abertos de IA no campo da inteligência artificial.
Adequado para:
Seu parceiro global de marketing e desenvolvimento de negócios
☑️ Nosso idioma comercial é inglês ou alemão
☑️ NOVO: Correspondência em seu idioma nacional!
Ficarei feliz em servir você e minha equipe como consultor pessoal.
Você pode entrar em contato comigo preenchendo o formulário de contato ou simplesmente ligando para +49 89 89 674 804 (Munique) . Meu endereço de e-mail é: wolfenstein ∂ xpert.digital
Estou ansioso pelo nosso projeto conjunto.