Publicado em: 6 de abril de 2025 / Atualizado em: 6 de abril de 2025 – Autor: Konrad Wolfenstein
Llama 4: A nova geração de sistemas de IA abertos da Meta
Llama 4 Revelado: A Chave da Meta para a Próxima Era da IA
Em 5 de abril de 2025, a Meta apresentou a mais recente geração de seus modelos de IA, o Llama 4. Esses novos modelos representam um avanço significativo no desenvolvimento de sistemas de IA abertos e apresentam uma série de recursos inovadores que aprimoram substancialmente seu desempenho e eficiência. A série Llama 4 compreende vários modelos, dois dos quais já estão disponíveis publicamente, enquanto o modelo mais poderoso ainda está em fase de treinamento.
Adequado para:
- Modelos de IA explicados de forma simples: Compreenda os fundamentos da IA, modelos de linguagem e raciocínio
A família de modelos Llama 4
A Meta desenvolveu três modelos diferentes na série Llama 4, cada um otimizado para diferentes casos de uso:
Lhama 4 Escoteiro
O Llama 4 Scout é um modelo compacto com especificações técnicas impressionantes:
- 17 bilhões de parâmetros ativos com 16 especialistas (total de 109 bilhões de parâmetros)
- Pode ser executado em uma única GPU NVIDIA H100 com quantização Int4
- Ele apresenta uma janela de contexto notavelmente grande, de 10 milhões de tokens, tornando-o um dos primeiros modelos abertos com essa capacidade
Segundo a Meta, o Scout supera outros modelos da sua classe, como o Gemini 3, o Gemini 2.0 Flash-Lite e o Mistral 3.1. É particularmente adequado para tarefas como resumir documentos longos, personalizar conteúdo com base em dados do usuário e extrair conclusões complexas de grandes quantidades de conhecimento.
Lhama 4 Maverick
O Llama 4 Maverick é o mais potente dos dois modelos disponíveis:
- 17 bilhões de parâmetros ativos com 128 especialistas (400 bilhões de parâmetros no total)
- A versão experimental do chat alcançou o ELO 1417 no LMArena
- Segundo a Meta, ele supera modelos como o GPT-4o e o Gemini 2.0 Flash em diversos testes de desempenho
Este modelo é particularmente adequado para aplicações de assistência geral e bate-papo, como escrita criativa, e apresenta resultados comparáveis ao DeepSeek v3 em tarefas de raciocínio e codificação, mas com metade dos parâmetros.
Lhama 4 Behemoth
Llama 4 Behemoth é o modelo mais poderoso da Meta, mas ainda não está disponível ao público:
- 288 bilhões de parâmetros ativos com 16 especialistas (quase 2 trilhões de parâmetros no total)
- Segundo a Meta, ele supera o GPT-4.5, o Claude Sonnet 3.7 e o Gemini 2.0 Pro em diversos testes de desempenho em STEM (Ciência, Tecnologia, Engenharia e Matemática)
- Serve como um “modelo de referência” para os modelos menores da Llama 4
Behemoth ainda está em fase de treinamento e será lançado posteriormente.
Inovações técnicas
A gama de modelos Llama 4 introduz diversas inovações técnicas significativas que melhoram o seu desempenho e eficiência:
Arquitetura de Mistura de Especialistas (MoE)
Uma das inovações mais importantes do Llama 4 é a arquitetura Mixture of Experts (MoE), na qual apenas um subconjunto dos parâmetros do modelo é ativado para cada token:
- Isso reduz significativamente o esforço computacional e a latência, mantendo o alto desempenho
- No Llama 4 Maverick, cada token é processado por um especialista compartilhado e um dos 128 especialistas roteados
- Essa arquitetura possibilita aumentar os parâmetros gerais do modelo sem aumentar os custos de inferência
Multimodalidade nativa com fusão precoce
Llama 4 é o primeiro modelo aberto com multimodalidade nativa através da Fusão Precoce:
- Os tokens de texto e imagem são integrados em uma arquitetura de modelo unificada
- Isso possibilita o pré-treinamento conjunto com grandes quantidades de dados de texto, imagem e vídeo
- Diferentemente do Llama 3.2, que utilizava parâmetros separados para texto e imagens, o Llama 4 compreende ambas as modalidades nativamente com os mesmos parâmetros
Janela de contexto extremamente longa
A janela de contexto extremamente longa do Llama 4 Scout é particularmente impressionante:
- Com 10 milhões de tokens, supera significativamente a maioria dos modelos disponíveis
- Isso possibilita o processamento de documentos muito longos, bases de código inteiras ou conversas extensas
- A arquitetura iRoPE (camadas de atenção intercaladas) torna isso possível
Novos métodos de treinamento
Meta utilizou diversos métodos inovadores para treinar a Lhama 4:
- MetaP: Uma técnica para ajuste robusto de hiperparâmetros críticos do modelo
- Precisão FP8: Utilizando números de ponto flutuante de 8 bits para treinamento eficiente
- Co-destilação: Utilizando a Lhama 4 Behemoth como modelo didático para modelos menores
- Aprendizagem online totalmente assíncrona com amplificação: uma nova infraestrutura para aprendizagem em larga escala
Disponibilidade e integração
Os modelos Llama 4 estão disponíveis em diversas plataformas e serviços:
Provedores de download e nuvem
- Os modelos Scout e Maverick podem ser baixados diretamente do Meta ou através do Hugging Face
- Eles também estão disponíveis por meio de diversas plataformas em nuvem:
- Cloudflare Workers AI
- Azure AI Foundry e Azure Databricks
- Vertex AI do Google Cloud
- Mais parceiros se juntarão nos próximos dias
Integração em metaprodutos
A Meta já atualizou seus assistentes de IA para o Llama 4 em diversas plataformas:
- WhatsApp, Messenger e Instagram Direct em 40 países diferentes
- O site Meta.AI
- No entanto, os recursos multimodais estão disponíveis atualmente apenas para usuários de língua inglesa nos EUA
Adequado para:
- Meta Ai na Alemanha está aqui! WhatsApp, Instagram e Facebook Obtenha a IA-com diferenças importantes na versão dos EUA
Licenciamento e controvérsias
Embora o Meta Llama 4 seja descrito como "de código aberto", existem algumas restrições na licença que geraram controvérsia:
Restrições de licença
A Licença Comunitária Llama 4 contém diversas restrições:
- Empresas com mais de 700 milhões de usuários ativos mensais precisam de uma licença especial da Meta
- Usuários e empresas da UE aparentemente não estão autorizados a usar ou distribuir os modelos, presumivelmente devido a requisitos regulamentares
- Existem requisitos relativos à nomenclatura e à atribuição de modelos derivados
Debate sobre “Código Aberto”
Existe um debate sobre se o Llama 4 deveria realmente ser chamado de "Código Aberto":
- A Open Source Initiative determinou em 2023 que as restrições da licença Llama a retiram da categoria "Código Aberto"
- Os críticos argumentam que se trata mais de um modelo de "código-fonte aberto" ou "pesos abertos" do que de um verdadeiro software de código aberto
- As restrições de licenciamento podem ser problemáticas para pequenas empresas que não possuem departamentos jurídicos próprios
Planos futuros
Meta já deu algumas pistas sobre seus planos futuros para Llama 4 e além:
LlamaCon e outros anúncios
- A Meta realizará sua primeira conferência LlamaCon em 29 de abril de 2025, onde serão anunciados mais detalhes sobre seus modelos de IA e planos de produtos
- A empresa também planeja lançar um aplicativo dedicado para seu chatbot de metadados no segundo trimestre
Ampliar as habilidades linguísticas
- A Meta está trabalhando para aprimorar as habilidades linguísticas do Llama 4, possibilitando conversas mais naturais
- O objetivo é possibilitar diálogos bidirecionais mais fluidos, nos quais os usuários possam interromper o modelo de IA
- Chris Cox, Diretor de Produtos da Meta, descreveu o próximo Llama 4 como um "modelo omnidirecional" que permite o uso da linguagem nativa em vez da tradução da fala em texto
IA agente e capacidades aprimoradas
- Mark Zuckerberg anunciou que o Llama 4 terá "capacidades de agente" que permitirão novos casos de uso
- A Meta tem como objetivo desenvolver modelos de IA que possam "executar ações generalizadas, comunicar-se naturalmente com humanos e resolver problemas complexos"
- A empresa está considerando oferecer assinaturas premium para seu assistente de IA para fins relacionados a agentes, como reservas ou produção de vídeo
Por que o Llama 4 representa um ponto de virada no cenário da IA
O lançamento do Llama 4 representa um passo significativo na estratégia da Meta para se tornar líder no campo altamente competitivo da IA generativa. Com a introdução da arquitetura Mixture of Experts, multimodalidade nativa e uma janela de contexto impressionantemente longa, a Meta demonstra que modelos abertos podem competir com os modelos proprietários das principais empresas de tecnologia.
Apesar das controvérsias em torno do licenciamento e da questão de se o Llama 4 deve realmente ser chamado de "código aberto", os avanços técnicos representam um marco significativo. A capacidade dos modelos de processar tanto texto quanto imagens abre novas possibilidades para desenvolvedores e empresas.
Com o projeto Llama 4 Behemoth ainda pendente e os planos anunciados para aprimorar a linguagem e os recursos dos agentes, fica claro que a Meta intensificará ainda mais seus investimentos em IA. Os próximos meses mostrarão como esses novos modelos transformarão o cenário da IA e se, de fato, como previsto por Mark Zuckerberg, eles ajudarão os modelos de IA aberta a se tornarem a força motriz da inteligência artificial.
Adequado para:
Seu parceiro global de marketing e desenvolvimento de negócios
☑️ Nosso idioma comercial é inglês ou alemão
☑️ NOVO: Correspondência em seu idioma nacional!
Ficarei feliz em servir você e minha equipe como consultor pessoal.
Você pode entrar em contato comigo preenchendo o formulário de contato ou simplesmente ligando para +49 89 89 674 804 (Munique) . Meu endereço de e-mail é: wolfenstein ∂ xpert.digital
Estou ansioso pelo nosso projeto conjunto.














