Ícone do site Xpert.Digital

A Meta lança a nova série de modelos de IA Llama 4 Scout, Maverick e Behemoth

A Meta lança a nova série de modelos de IA Llama 4 Scout, Maverick e Behemoth

Meta lança nova série de modelos de IA: Llama 4 Scout, Maverick e Behemoth – Imagem: Xpert.Digital

Llama 4: A nova geração de sistemas de IA abertos da Meta

Llama 4 Revelado: A Chave da Meta para a Próxima Era da IA

Em 5 de abril de 2025, a Meta apresentou a mais recente geração de seus modelos de IA, o Llama 4. Esses novos modelos representam um avanço significativo no desenvolvimento de sistemas de IA abertos e apresentam uma série de recursos inovadores que aprimoram substancialmente seu desempenho e eficiência. A série Llama 4 compreende vários modelos, dois dos quais já estão disponíveis publicamente, enquanto o modelo mais poderoso ainda está em fase de treinamento.

Adequado para:

A família de modelos Llama 4

A Meta desenvolveu três modelos diferentes na série Llama 4, cada um otimizado para diferentes casos de uso:

Lhama 4 Escoteiro

O Llama 4 Scout é um modelo compacto com especificações técnicas impressionantes:

  • 17 bilhões de parâmetros ativos com 16 especialistas (total de 109 bilhões de parâmetros)
  • Pode ser executado em uma única GPU NVIDIA H100 com quantização Int4
  • Ele apresenta uma janela de contexto notavelmente grande, de 10 milhões de tokens, tornando-o um dos primeiros modelos abertos com essa capacidade

Segundo a Meta, o Scout supera outros modelos da sua classe, como o Gemini 3, o Gemini 2.0 Flash-Lite e o Mistral 3.1. É particularmente adequado para tarefas como resumir documentos longos, personalizar conteúdo com base em dados do usuário e extrair conclusões complexas de grandes quantidades de conhecimento.

Lhama 4 Maverick

O Llama 4 Maverick é o mais potente dos dois modelos disponíveis:

  • 17 bilhões de parâmetros ativos com 128 especialistas (400 bilhões de parâmetros no total)
  • A versão experimental do chat alcançou o ELO 1417 no LMArena
  • Segundo a Meta, ele supera modelos como o GPT-4o e o Gemini 2.0 Flash em diversos testes de desempenho

Este modelo é particularmente adequado para aplicações de assistência geral e bate-papo, como escrita criativa, e apresenta resultados comparáveis ​​ao DeepSeek v3 em tarefas de raciocínio e codificação, mas com metade dos parâmetros.

Lhama 4 Behemoth

Llama 4 Behemoth é o modelo mais poderoso da Meta, mas ainda não está disponível ao público:

  • 288 bilhões de parâmetros ativos com 16 especialistas (quase 2 trilhões de parâmetros no total)
  • Segundo a Meta, ele supera o GPT-4.5, o Claude Sonnet 3.7 e o Gemini 2.0 Pro em diversos testes de desempenho em STEM (Ciência, Tecnologia, Engenharia e Matemática)
  • Serve como um “modelo de referência” para os modelos menores da Llama 4

Behemoth ainda está em fase de treinamento e será lançado posteriormente.

Inovações técnicas

A gama de modelos Llama 4 introduz diversas inovações técnicas significativas que melhoram o seu desempenho e eficiência:

Arquitetura de Mistura de Especialistas (MoE)

Uma das inovações mais importantes do Llama 4 é a arquitetura Mixture of Experts (MoE), na qual apenas um subconjunto dos parâmetros do modelo é ativado para cada token:

  • Isso reduz significativamente o esforço computacional e a latência, mantendo o alto desempenho
  • No Llama 4 Maverick, cada token é processado por um especialista compartilhado e um dos 128 especialistas roteados
  • Essa arquitetura possibilita aumentar os parâmetros gerais do modelo sem aumentar os custos de inferência

Multimodalidade nativa com fusão precoce

Llama 4 é o primeiro modelo aberto com multimodalidade nativa através da Fusão Precoce:

  • Os tokens de texto e imagem são integrados em uma arquitetura de modelo unificada
  • Isso possibilita o pré-treinamento conjunto com grandes quantidades de dados de texto, imagem e vídeo
  • Diferentemente do Llama 3.2, que utilizava parâmetros separados para texto e imagens, o Llama 4 compreende ambas as modalidades nativamente com os mesmos parâmetros

Janela de contexto extremamente longa

A janela de contexto extremamente longa do Llama 4 Scout é particularmente impressionante:

  • Com 10 milhões de tokens, supera significativamente a maioria dos modelos disponíveis
  • Isso possibilita o processamento de documentos muito longos, bases de código inteiras ou conversas extensas
  • A arquitetura iRoPE (camadas de atenção intercaladas) torna isso possível

Novos métodos de treinamento

Meta utilizou diversos métodos inovadores para treinar a Lhama 4:

  • MetaP: Uma técnica para ajuste robusto de hiperparâmetros críticos do modelo
  • Precisão FP8: Utilizando números de ponto flutuante de 8 bits para treinamento eficiente
  • Co-destilação: Utilizando a Lhama 4 Behemoth como modelo didático para modelos menores
  • Aprendizagem online totalmente assíncrona com amplificação: uma nova infraestrutura para aprendizagem em larga escala

Disponibilidade e integração

Os modelos Llama 4 estão disponíveis em diversas plataformas e serviços:

Provedores de download e nuvem

  • Os modelos Scout e Maverick podem ser baixados diretamente do Meta ou através do Hugging Face
  • Eles também estão disponíveis por meio de diversas plataformas em nuvem:
    • Cloudflare Workers AI
    • Azure AI Foundry e Azure Databricks
    • Vertex AI do Google Cloud
    • Mais parceiros se juntarão nos próximos dias

Integração em metaprodutos

A Meta já atualizou seus assistentes de IA para o Llama 4 em diversas plataformas:

  • WhatsApp, Messenger e Instagram Direct em 40 países diferentes
  • O site Meta.AI
  • No entanto, os recursos multimodais estão disponíveis atualmente apenas para usuários de língua inglesa nos EUA

Adequado para:

Licenciamento e controvérsias

Embora o Meta Llama 4 seja descrito como "de código aberto", existem algumas restrições na licença que geraram controvérsia:

Restrições de licença

A Licença Comunitária Llama 4 contém diversas restrições:

  • Empresas com mais de 700 milhões de usuários ativos mensais precisam de uma licença especial da Meta
  • Usuários e empresas da UE aparentemente não estão autorizados a usar ou distribuir os modelos, presumivelmente devido a requisitos regulamentares
  • Existem requisitos relativos à nomenclatura e à atribuição de modelos derivados

Debate sobre “Código Aberto”

Existe um debate sobre se o Llama 4 deveria realmente ser chamado de "Código Aberto":

  • A Open Source Initiative determinou em 2023 que as restrições da licença Llama a retiram da categoria "Código Aberto"
  • Os críticos argumentam que se trata mais de um modelo de "código-fonte aberto" ou "pesos abertos" do que de um verdadeiro software de código aberto
  • As restrições de licenciamento podem ser problemáticas para pequenas empresas que não possuem departamentos jurídicos próprios

Planos futuros

Meta já deu algumas pistas sobre seus planos futuros para Llama 4 e além:

LlamaCon e outros anúncios

  • A Meta realizará sua primeira conferência LlamaCon em 29 de abril de 2025, onde serão anunciados mais detalhes sobre seus modelos de IA e planos de produtos
  • A empresa também planeja lançar um aplicativo dedicado para seu chatbot de metadados no segundo trimestre

Ampliar as habilidades linguísticas

  • A Meta está trabalhando para aprimorar as habilidades linguísticas do Llama 4, possibilitando conversas mais naturais
  • O objetivo é possibilitar diálogos bidirecionais mais fluidos, nos quais os usuários possam interromper o modelo de IA
  • Chris Cox, Diretor de Produtos da Meta, descreveu o próximo Llama 4 como um "modelo omnidirecional" que permite o uso da linguagem nativa em vez da tradução da fala em texto

IA agente e capacidades aprimoradas

  • Mark Zuckerberg anunciou que o Llama 4 terá "capacidades de agente" que permitirão novos casos de uso
  • A Meta tem como objetivo desenvolver modelos de IA que possam "executar ações generalizadas, comunicar-se naturalmente com humanos e resolver problemas complexos"
  • A empresa está considerando oferecer assinaturas premium para seu assistente de IA para fins relacionados a agentes, como reservas ou produção de vídeo

Por que o Llama 4 representa um ponto de virada no cenário da IA

O lançamento do Llama 4 representa um passo significativo na estratégia da Meta para se tornar líder no campo altamente competitivo da IA ​​generativa. Com a introdução da arquitetura Mixture of Experts, multimodalidade nativa e uma janela de contexto impressionantemente longa, a Meta demonstra que modelos abertos podem competir com os modelos proprietários das principais empresas de tecnologia.

Apesar das controvérsias em torno do licenciamento e da questão de se o Llama 4 deve realmente ser chamado de "código aberto", os avanços técnicos representam um marco significativo. A capacidade dos modelos de processar tanto texto quanto imagens abre novas possibilidades para desenvolvedores e empresas.

Com o projeto Llama 4 Behemoth ainda pendente e os planos anunciados para aprimorar a linguagem e os recursos dos agentes, fica claro que a Meta intensificará ainda mais seus investimentos em IA. Os próximos meses mostrarão como esses novos modelos transformarão o cenário da IA ​​e se, de fato, como previsto por Mark Zuckerberg, eles ajudarão os modelos de IA aberta a se tornarem a força motriz da inteligência artificial.

Adequado para:

 

Seu parceiro global de marketing e desenvolvimento de negócios

☑️ Nosso idioma comercial é inglês ou alemão

☑️ NOVO: Correspondência em seu idioma nacional!

 

Konrad Wolfenstein

Ficarei feliz em servir você e minha equipe como consultor pessoal.

Você pode entrar em contato comigo preenchendo o formulário de contato ou simplesmente ligando para +49 89 89 674 804 (Munique) . Meu endereço de e-mail é: wolfenstein xpert.digital

Estou ansioso pelo nosso projeto conjunto.

 

 

☑️ Apoio às PME em estratégia, consultoria, planeamento e implementação

☑️ Criação ou realinhamento da estratégia digital e digitalização

☑️ Expansão e otimização dos processos de vendas internacionais

☑️ Plataformas de negociação B2B globais e digitais

☑️ Pioneiro em Desenvolvimento de Negócios / Marketing / RP / Feiras Comerciais

Saia da versão móvel