A Meta lança a nova série de modelos de IA Llama 4 Scout, Maverick e Behemoth

Konrad Wolfenstein

1 ano atrás

Meta lança nova série de modelos de IA: Llama 4 Scout, Maverick e Behemoth – Imagem: Xpert.Digital

Llama 4: A nova geração de sistemas de IA abertos da Meta

Llama 4 Revelado: A Chave da Meta para a Próxima Era da IA

Em 5 de abril de 2025, a Meta apresentou a mais recente geração de seus modelos de IA, o Llama 4. Esses novos modelos representam um avanço significativo no desenvolvimento de sistemas de IA abertos e apresentam uma série de recursos inovadores que aprimoram substancialmente seu desempenho e eficiência. A série Llama 4 compreende vários modelos, dois dos quais já estão disponíveis publicamente, enquanto o modelo mais poderoso ainda está em fase de treinamento.

Relacionado a isto:

Modelos de IA explicados de forma simples: Compreenda os fundamentos da IA, modelos de linguagem e raciocínio

A família de modelos Llama 4

A Meta desenvolveu três modelos diferentes na série Llama 4, cada um otimizado para diferentes casos de uso:

Lhama 4 Escoteiro

O Llama 4 Scout é um modelo compacto com especificações técnicas impressionantes:

17 bilhões de parâmetros ativos com 16 especialistas (total de 109 bilhões de parâmetros)
Pode ser executado em uma única GPU NVIDIA H100 com quantização Int4
Ele apresenta uma janela de contexto notavelmente grande, de 10 milhões de tokens, tornando-o um dos primeiros modelos abertos com essa capacidade

Segundo a Meta, o Scout supera outros modelos da sua classe, como o Gemini 3, o Gemini 2.0 Flash-Lite e o Mistral 3.1. É particularmente adequado para tarefas como resumir documentos longos, personalizar conteúdo com base em dados do usuário e extrair conclusões complexas de grandes quantidades de conhecimento.

Lhama 4 Maverick

O Llama 4 Maverick é o mais potente dos dois modelos disponíveis:

17 bilhões de parâmetros ativos com 128 especialistas (400 bilhões de parâmetros no total)
A versão experimental do chat alcançou o ELO 1417 no LMArena
Segundo a Meta, ele supera modelos como o GPT-4o e o Gemini 2.0 Flash em diversos testes de desempenho

Este modelo é particularmente adequado para aplicações de assistência geral e bate-papo, como escrita criativa, e apresenta resultados comparáveis ao DeepSeek v3 em tarefas de raciocínio e codificação, mas com metade dos parâmetros.

Lhama 4 Behemoth

Llama 4 Behemoth é o modelo mais poderoso da Meta, mas ainda não está disponível ao público:

288 bilhões de parâmetros ativos com 16 especialistas (quase 2 trilhões de parâmetros no total)
Segundo a Meta, ele supera o GPT-4.5, o Claude Sonnet 3.7 e o Gemini 2.0 Pro em diversos testes de desempenho em STEM (Ciência, Tecnologia, Engenharia e Matemática)
Serve como um "modelo de referência" para os modelos menores da Llama 4

Behemoth ainda está em fase de treinamento e será lançado posteriormente.

Inovações técnicas

A gama de modelos Llama 4 introduz diversas inovações técnicas significativas que melhoram o seu desempenho e eficiência:

Arquitetura de Mistura de Especialistas (MoE)

Uma das inovações mais importantes do Llama 4 é a arquitetura Mixture of Experts (MoE), na qual apenas um subconjunto dos parâmetros do modelo é ativado para cada token:

Isso reduz significativamente o esforço computacional e a latência, mantendo o alto desempenho
No Llama 4 Maverick, cada token é processado por um especialista compartilhado e um dos 128 especialistas roteados
Essa arquitetura possibilita aumentar os parâmetros gerais do modelo sem aumentar os custos de inferência

Multimodalidade nativa com fusão precoce

Llama 4 é o primeiro modelo aberto com multimodalidade nativa através da Fusão Precoce:

Os tokens de texto e imagem são integrados em uma arquitetura de modelo unificada
Isso possibilita o pré-treinamento conjunto com grandes quantidades de dados de texto, imagem e vídeo
Diferentemente do Llama 3.2, que utilizava parâmetros separados para texto e imagens, o Llama 4 compreende ambas as modalidades nativamente com os mesmos parâmetros

Janela de contexto extremamente longa

A janela de contexto extremamente longa do Llama 4 Scout é particularmente impressionante:

Com 10 milhões de tokens, supera significativamente a maioria dos modelos disponíveis
Isso possibilita o processamento de documentos muito longos, bases de código inteiras ou conversas extensas
A arquitetura iRoPE (camadas de atenção intercaladas) torna isso possível

Novos métodos de treinamento

Meta utilizou diversos métodos inovadores para treinar a Lhama 4:

MetaP: Uma técnica para ajuste robusto de hiperparâmetros críticos do modelo
Precisão FP8: Utilizando números de ponto flutuante de 8 bits para treinamento eficiente
Co-destilação: Utilizando a Lhama 4 Behemoth como modelo didático para modelos menores
Aprendizagem online totalmente assíncrona com amplificação: uma nova infraestrutura para aprendizagem em larga escala

Disponibilidade e integração

Os modelos Llama 4 estão disponíveis em diversas plataformas e serviços:

Provedores de download e nuvem

Os modelos Scout e Maverick podem ser baixados diretamente do Meta ou através do Hugging Face
Eles também estão disponíveis por meio de diversas plataformas em nuvem:
- Cloudflare Workers AI
- Azure AI Foundry e Azure Databricks
- Vertex AI do Google Cloud
- Mais parceiros se juntarão nos próximos dias

Integração em metaprodutos

A Meta já atualizou seus assistentes de IA para o Llama 4 em diversas plataformas:

WhatsApp, Messenger e Instagram Direct em 40 países diferentes
O site Meta.AI
No entanto, os recursos multimodais estão disponíveis atualmente apenas para usuários de língua inglesa nos EUA

Relacionado a isto:

A Meta AI chegou à Alemanha! WhatsApp, Instagram e Facebook estão recebendo inteligência artificial – com diferenças importantes em relação à versão americana

Licenciamento e controvérsias

Embora o Meta Llama 4 seja descrito como "de código aberto", existem algumas restrições na licença que geraram controvérsia:

Restrições de licença

A Licença Comunitária Llama 4 contém diversas restrições:

Empresas com mais de 700 milhões de usuários ativos mensais precisam de uma licença especial da Meta
Usuários e empresas da UE aparentemente não estão autorizados a usar ou distribuir os modelos, presumivelmente devido a requisitos regulamentares
Existem requisitos relativos à nomenclatura e à atribuição de modelos derivados

Debate sobre “Código Aberto”

Existe um debate sobre se o Llama 4 deveria realmente ser chamado de "código aberto":

A Open Source Initiative determinou em 2023 que as restrições da licença Llama a retiram da categoria "código aberto"
Os críticos argumentam que se trata mais de um modelo de "código-fonte aberto" ou "pesos abertos" do que de um verdadeiro software de código aberto
As restrições de licenciamento podem ser problemáticas para pequenas empresas que não possuem departamentos jurídicos próprios

Planos futuros

Meta já deu algumas pistas sobre seus planos futuros para Llama 4 e além:

LlamaCon e outros anúncios

A Meta realizará sua primeira conferência LlamaCon em 29 de abril de 2025, onde serão anunciados mais detalhes sobre seus modelos de IA e planos de produtos
A empresa também planeja lançar um aplicativo dedicado para seu chatbot de metadados no segundo trimestre

Ampliar as habilidades linguísticas

A Meta está trabalhando para aprimorar as habilidades linguísticas do Llama 4, possibilitando conversas mais naturais
O objetivo é possibilitar diálogos bidirecionais mais fluidos, nos quais os usuários possam interromper o modelo de IA
Chris Cox, Diretor de Produtos da Meta, descreveu o próximo Llama 4 como um "modelo omnidirecional" que permite o uso da linguagem nativa em vez da tradução da fala em texto

IA agente e capacidades aprimoradas

Mark Zuckerberg anunciou que o Llama 4 terá "capacidades de agente" que permitirão novos casos de uso
A Meta tem como objetivo desenvolver modelos de IA que possam "executar ações generalizadas, comunicar-se naturalmente com humanos e resolver problemas complexos"
A empresa está considerando oferecer assinaturas premium para seu assistente de IA para fins relacionados a agentes, como reservas ou produção de vídeo

Por que o Llama 4 representa um ponto de virada no cenário da IA

O lançamento do Llama 4 representa um passo significativo na estratégia da Meta para se tornar líder no campo altamente competitivo da IA generativa. Com a introdução da arquitetura Mixture of Experts, multimodalidade nativa e uma janela de contexto impressionantemente longa, a Meta demonstra que modelos abertos podem competir com os modelos proprietários das principais empresas de tecnologia.

Apesar das controvérsias em torno do licenciamento e da questão de se o Llama 4 deve realmente ser chamado de "código aberto", os avanços técnicos representam um marco significativo. A capacidade dos modelos de processar tanto texto quanto imagens abre novas possibilidades para desenvolvedores e empresas.

Com o projeto Llama 4 Behemoth ainda pendente e os planos anunciados para aprimorar a linguagem e os recursos dos agentes, fica claro que a Meta intensificará ainda mais seus investimentos em IA. Os próximos meses mostrarão como esses novos modelos transformarão o cenário da IA e se, de fato, como previsto por Mark Zuckerberg, eles ajudarão os modelos de IA aberta a se tornarem a força motriz da inteligência artificial.

Relacionado a isto:

Seu parceiro global de marketing e desenvolvimento de negócios

☑️ Nosso idioma comercial é inglês ou alemão

☑️ NOVO: Correspondência em seu idioma nativo!

Konrad Wolfenstein

Eu e minha equipe teremos o prazer de estar à sua disposição como seu consultor pessoal.

Você pode entrar em contato comigo preenchendo o formulário de contato aqui wolfenstein@xpert.digital:ou simplesmente ligando para +49 7348 4088 965. Meu endereço de e-mail é

Estou ansioso pelo nosso projeto conjunto.

A Meta lança a nova série de modelos de IA Llama 4 Scout, Maverick e Behemoth

Llama 4: A nova geração de sistemas de IA abertos da Meta