⭐️ Inteligência artificial (AI) -Ai Blog, ponto de acesso e conteúdo ⭐️ Inteligência digital ⭐️ Xpaper

Seleção de voz 📢

Meta publica nova lhama 4 Scout, Maverick e Behemoth

Publicado em: 6 de abril de 2025 / atualização de: 6 de abril de 2025 - Autor: Konrad Wolfenstein

Meta publica nova lhama 4 Scout, Maverick e Behemoth-Image: Xpert.Digital

LLAMA 4: A nova geração de sistemas de IA abertos da Meta

Llama 4 revelou: metas -chave para a próxima Idade da IA

Meta apresentou a última geração de seus modelos de IA, LLAMA 4, em 5 de abril de 2025. Esses novos modelos representam progresso significativo no desenvolvimento de sistemas de IA abertos e têm várias funções inovadoras que aumentam significativamente seu desempenho e eficiência. A série LLAMA 4 consiste em modelos diferentes, com dois deles já disponíveis ao público, enquanto o modelo mais poderoso ainda está na fase de treinamento.

Adequado para:

Simplesmente explicou modelos de IA: entenda o básico da IA, modelos de voz e raciocínio

A família modelo LLAMA 4

A Meta desenvolveu três modelos diferentes na série LLAMA 4, cada um dos quais é otimizado para diferentes aplicações:

LLAMA 4 Scout

LLAMA 4 Scout é um modelo compacto com especificações técnicas impressionantes:

17 bilhões de parâmetros ativos com 16 especialistas (um total de 109 bilhões de parâmetros)
Pode ser operado em uma única GPU NVIDIA H100 com quantização INT4
Tem uma janela de contexto notavelmente grande de 10 milhões de tokens, o que o torna um dos primeiros modelos abertos com esta capacidade

De acordo com a Meta, o Scout excede outros modelos em sua classe como Gemini 3, Gemini 2.0 Flash-Lite e Mistral 3.1. É particularmente adequado para tarefas como o resumo de documentos longos, personalização com base em dados do usuário e conclusões complexas sobre grandes quantidades de conhecimento.

Lhama 4 Maverick

Llama 4 Maverick é o mais poderoso dos dois modelos disponíveis:

17 bilhões de parâmetros ativos com 128 especialistas (um total de 400 bilhões de parâmetros)
A versão experimental de bate -papo chegou ao ELO 1417 em Lmarena
Exceda modelos como GPT-4O e Gemini 2.0 Flash em vários benchmarks

Esse modelo é particularmente adequado para aplicativos de assistência geral e bate -papo, como escrita criativa e mostra resultados comparáveis à DeepSeek V3 nas tarefas de raciocínio e codificação, mas com metade dos parâmetros.

Lhama 4 gigante

LLAMA 4 Behemoth é o modelo mais poderoso da Metas, que ainda não está disponível ao público:

288 bilhões de parâmetros ativos com 16 especialistas (um total de quase 2 trilhões de parâmetros)
De acordo com a Meta, excede o GPT-4.5, Claude Sonnet 3.7 e Gemini 2.0 Pro para vários benchmarks de caule
Serve como um "modelo de professor" para os modelos menores de llama 4

Atualmente, o Behemoth ainda está na fase de treinamento e será publicado posteriormente.

Inovações técnicas

A série Model Llama 4 apresenta várias inovações técnicas importantes que melhoram seu desempenho e eficiência:

Mistura de arquitetura de especialistas (MOE)

Uma das inovações mais importantes da LLAMA 4 é a mistura de arquitetura de especialistas (MOE), na qual apenas uma parte dos parâmetros do modelo é ativada para todo token:

Isso reduz significativamente o esforço de cálculo e a latência, enquanto o alto desempenho é preservado
Na LLAMA 4 Maverick, cada token é processado por um especialista comum e um dos 128 especialistas gerizados
Essa arquitetura possibilita aumentar o parâmetro total do modelo sem aumentar os custos de inferência

Multimodalidade nativa com fusão precoce

LLAMA 4 é o primeiro modelo aberto com multimodalidade nativa pelo Fusion Early:

Os tokens de texto e imagem são integrados em uma arquitetura de modelo uniforme
Isso permite treinamento preliminar conjunto com grandes quantidades de dados de texto, imagem e vídeo
Em contraste com o LLAMA 3.2, que usou parâmetros separados para texto e imagens, o LLAMA 4 entende ambas as modalidades nativas com os mesmos parâmetros

Janela de contexto extremamente longa

A janela de contexto extremamente longa do Scout 4 Scout é particularmente impressionante:

Com 10 milhões de tokens, ele excede claramente a maioria dos modelos disponíveis
Isso permite o processamento de documentos muito longos, bases de código inteiras ou conversas extensas
A arquitetura do irope (camadas de atenção intercalada) torna isso possível

Novos métodos de treinamento

A Meta usou vários métodos inovadores para o treinamento do LLAMA 4:

MEtap: uma técnica para a robusta coordenação de hiperâmetro do modelo crítico
FP8 Precisão: Uso de números de slides de 8 bits para treinamento eficiente
Co-Distilação: Uso de Llama 4 Behemoth como modelo de professor para modelos menores
Aprendizagem on-line totalmente assíncrona com reforços: uma nova infraestrutura para aprendizado em larga escala

Disponibilidade e integração

Os modelos LLAMA 4 estão disponíveis por várias plataformas e serviços:

Download e fornecedor de nuvem

Os modelos Scout e Maverick podem ser baixados diretamente do Meta ou via Hugging Face
Eles também estão disponíveis através de várias plataformas em nuvem:
- Cloudflare Workers AI
- Azure AI Foundry e Azure Databricks
- VERTEX AI do Google Cloud
- Outros parceiros seguirão nos próximos dias

Integração em meta produtos

A Meta já atualizou seus assistentes de IA em várias plataformas no LLAMA 4:

Whatsapp, Messenger e Instagram diretamente em 40 países diferentes
O site da Meta.ai
No entanto, as funções multimodais estão atualmente disponíveis apenas para usuários de inglês -linguagem nos EUA

Adequado para:

Meta Ai na Alemanha está aqui! WhatsApp, Instagram e Facebook Obtenha a IA-com diferenças importantes na versão dos EUA

Licença e controvérsia

Embora a meta llama 4 se refere ao "código aberto", existem algumas restrições na licença que desencadearam controvérsia:

Restrições de licença

A licença comunitária LLAMA 4 contém várias restrições:

Empresas com mais de 700 milhões de usuários ativos mensais precisam de uma licença especial da Meta
Aparentemente, os modelos não têm permissão para usar ou distribuir usuários e empresas da UE, presumivelmente devido a requisitos regulatórios
Existem requisitos em relação à nomeação e atribuição para modelos derivados

Debate sobre "código aberto"

Há um debate sobre se o llama 4 deve realmente ser chamado de "código aberto":

A iniciativa de código aberto descobriu em 2023 que as restrições na licença de llama retiram -a “da categoria 'Open Source'"
Os críticos argumentam que é mais um modelo de "fonte-aberto" ou "com pesos abertos" do que o software de código aberto real
As restrições de licença podem ser problemáticas para pequenas empresas sem seus próprios departamentos legais

Planos futuros

Meta já deu algumas idéias sobre seus planos futuros para o LLAMA 4 e além:

Llamacon e outros anúncios

A Meta organizará a Primeira Conferência de Llamacon em 29 de abril de 2025, na qual mais detalhes sobre seus modelos e planos de produtos de IA devem ser anunciados
A empresa também planeja publicar um aplicativo dedicado para seu bot de meta-batinha no segundo trimestre

Expansão de habilidades linguísticas

A Meta está trabalhando para melhorar as habilidades linguísticas do Llama 4 para permitir conversas mais naturais
O objetivo é permitir diálogos mais fluidos e bilaterais nos quais os usuários podem interromper o modelo de IA
Chris Cox, diretor de produtos da Meta, descreveu a próxima llama 4 como um "modelo OMNI" que permite a língua nativa, em vez de traduzir a linguagem em texto

IA agêntica e habilidades estendidas

Mark Zuckerberg anunciou que o LLAMA 4 terá “habilidades de agente” que devem permitir novos aplicativos
A Meta pretende desenvolver modelos de IA que “realizam ações generalizadas, é claro que se comunicam com as pessoas e resolvam problemas desafiadores”
A empresa está pensando em oferecer assinaturas premium para seu assistente de IA para fins de agente, como reservas ou produção de vídeo

Por que o lhama 4 é um ponto de virada na paisagem da IA

A publicação do LLAMA 4 representa uma etapa significativa na estratégia de metas para se tornar a área líder da IA generativa na área altamente competitiva. Com a introdução da mistura de arquitetura de especialistas, multimodalidade nativa e uma janela de contexto impressionantemente longa, a meta mostra que os modelos abertos podem acompanhar os modelos proprietários das grandes empresas de tecnologia.

Apesar da controvérsia sobre o licenciamento e a questão de saber se o LLAMA 4 deveria realmente ser chamado de "código aberto", o progresso técnico é um marco importante. A capacidade dos modelos de processar texto e imagens abre novas oportunidades para desenvolvedores e empresas.

Com o excelente gigante Llama 4 e os planos anunciados para habilidades expandidas de idiomas e agentes, fica claro que a Meta intensificará ainda mais seus investimentos na IA. Os próximos meses mostrarão como esses novos modelos mudam o cenário da IA e se, como previsto por Mark Zuckerberg, eles realmente ajudarão a criar modelos abertos de IA no campo da inteligência artificial.

Adequado para: