Seleção de voz 📢


Meta publica nova lhama 4 Scout, Maverick e Behemoth

Publicado em: 6 de abril de 2025 / atualização de: 6 de abril de 2025 - Autor: Konrad Wolfenstein

Meta publica nova lhama 4 Scout, Maverick e Behemoth

Meta publica nova lhama 4 Scout, Maverick e Behemoth-Image: Xpert.Digital

LLAMA 4: A nova geração de sistemas de IA abertos da Meta

Llama 4 revelou: metas -chave para a próxima Idade da IA

Meta apresentou a última geração de seus modelos de IA, LLAMA 4, em 5 de abril de 2025. Esses novos modelos representam progresso significativo no desenvolvimento de sistemas de IA abertos e têm várias funções inovadoras que aumentam significativamente seu desempenho e eficiência. A série LLAMA 4 consiste em modelos diferentes, com dois deles já disponíveis ao público, enquanto o modelo mais poderoso ainda está na fase de treinamento.

Adequado para:

A família modelo LLAMA 4

A Meta desenvolveu três modelos diferentes na série LLAMA 4, cada um dos quais é otimizado para diferentes aplicações:

LLAMA 4 Scout

LLAMA 4 Scout é um modelo compacto com especificações técnicas impressionantes:

  • 17 bilhões de parâmetros ativos com 16 especialistas (um total de 109 bilhões de parâmetros)
  • Pode ser operado em uma única GPU NVIDIA H100 com quantização INT4
  • Tem uma janela de contexto notavelmente grande de 10 milhões de tokens, o que o torna um dos primeiros modelos abertos com esta capacidade

De acordo com a Meta, o Scout excede outros modelos em sua classe como Gemini 3, Gemini 2.0 Flash-Lite e Mistral 3.1. É particularmente adequado para tarefas como o resumo de documentos longos, personalização com base em dados do usuário e conclusões complexas sobre grandes quantidades de conhecimento.

Lhama 4 Maverick

Llama 4 Maverick é o mais poderoso dos dois modelos disponíveis:

  • 17 bilhões de parâmetros ativos com 128 especialistas (um total de 400 bilhões de parâmetros)
  • A versão experimental de bate -papo chegou ao ELO 1417 em Lmarena
  • Exceda modelos como GPT-4O e Gemini 2.0 Flash em vários benchmarks

Esse modelo é particularmente adequado para aplicativos de assistência geral e bate -papo, como escrita criativa e mostra resultados comparáveis ​​à DeepSeek V3 nas tarefas de raciocínio e codificação, mas com metade dos parâmetros.

Lhama 4 gigante

LLAMA 4 Behemoth é o modelo mais poderoso da Metas, que ainda não está disponível ao público:

  • 288 bilhões de parâmetros ativos com 16 especialistas (um total de quase 2 trilhões de parâmetros)
  • De acordo com a Meta, excede o GPT-4.5, Claude Sonnet 3.7 e Gemini 2.0 Pro para vários benchmarks de caule
  • Serve como um "modelo de professor" para os modelos menores de llama 4

Atualmente, o Behemoth ainda está na fase de treinamento e será publicado posteriormente.

Inovações técnicas

A série Model Llama 4 apresenta várias inovações técnicas importantes que melhoram seu desempenho e eficiência:

Mistura de arquitetura de especialistas (MOE)

Uma das inovações mais importantes da LLAMA 4 é a mistura de arquitetura de especialistas (MOE), na qual apenas uma parte dos parâmetros do modelo é ativada para todo token:

  • Isso reduz significativamente o esforço de cálculo e a latência, enquanto o alto desempenho é preservado
  • Na LLAMA 4 Maverick, cada token é processado por um especialista comum e um dos 128 especialistas gerizados
  • Essa arquitetura possibilita aumentar o parâmetro total do modelo sem aumentar os custos de inferência

Multimodalidade nativa com fusão precoce

LLAMA 4 é o primeiro modelo aberto com multimodalidade nativa pelo Fusion Early:

  • Os tokens de texto e imagem são integrados em uma arquitetura de modelo uniforme
  • Isso permite treinamento preliminar conjunto com grandes quantidades de dados de texto, imagem e vídeo
  • Em contraste com o LLAMA 3.2, que usou parâmetros separados para texto e imagens, o LLAMA 4 entende ambas as modalidades nativas com os mesmos parâmetros

Janela de contexto extremamente longa

A janela de contexto extremamente longa do Scout 4 Scout é particularmente impressionante:

  • Com 10 milhões de tokens, ele excede claramente a maioria dos modelos disponíveis
  • Isso permite o processamento de documentos muito longos, bases de código inteiras ou conversas extensas
  • A arquitetura do irope (camadas de atenção intercalada) torna isso possível

Novos métodos de treinamento

A Meta usou vários métodos inovadores para o treinamento do LLAMA 4:

  • MEtap: uma técnica para a robusta coordenação de hiperâmetro do modelo crítico
  • FP8 Precisão: Uso de números de slides de 8 bits para treinamento eficiente
  • Co-Distilação: Uso de Llama 4 Behemoth como modelo de professor para modelos menores
  • Aprendizagem on-line totalmente assíncrona com reforços: uma nova infraestrutura para aprendizado em larga escala

Disponibilidade e integração

Os modelos LLAMA 4 estão disponíveis por várias plataformas e serviços:

Download e fornecedor de nuvem

  • Os modelos Scout e Maverick podem ser baixados diretamente do Meta ou via Hugging Face
  • Eles também estão disponíveis através de várias plataformas em nuvem:
    • Cloudflare Workers AI
    • Azure AI Foundry e Azure Databricks
    • VERTEX AI do Google Cloud
    • Outros parceiros seguirão nos próximos dias

Integração em meta produtos

A Meta já atualizou seus assistentes de IA em várias plataformas no LLAMA 4:

  • Whatsapp, Messenger e Instagram diretamente em 40 países diferentes
  • O site da Meta.ai
  • No entanto, as funções multimodais estão atualmente disponíveis apenas para usuários de inglês -linguagem nos EUA

Adequado para:

Licença e controvérsia

Embora a meta llama 4 se refere ao "código aberto", existem algumas restrições na licença que desencadearam controvérsia:

Restrições de licença

A licença comunitária LLAMA 4 contém várias restrições:

  • Empresas com mais de 700 milhões de usuários ativos mensais precisam de uma licença especial da Meta
  • Aparentemente, os modelos não têm permissão para usar ou distribuir usuários e empresas da UE, presumivelmente devido a requisitos regulatórios
  • Existem requisitos em relação à nomeação e atribuição para modelos derivados

Debate sobre "código aberto"

Há um debate sobre se o llama 4 deve realmente ser chamado de "código aberto":

  • A iniciativa de código aberto descobriu em 2023 que as restrições na licença de llama retiram -a “da categoria 'Open Source'"
  • Os críticos argumentam que é mais um modelo de "fonte-aberto" ou "com pesos abertos" do que o software de código aberto real
  • As restrições de licença podem ser problemáticas para pequenas empresas sem seus próprios departamentos legais

Planos futuros

Meta já deu algumas idéias sobre seus planos futuros para o LLAMA 4 e além:

Llamacon e outros anúncios

  • A Meta organizará a Primeira Conferência de Llamacon em 29 de abril de 2025, na qual mais detalhes sobre seus modelos e planos de produtos de IA devem ser anunciados
  • A empresa também planeja publicar um aplicativo dedicado para seu bot de meta-batinha no segundo trimestre

Expansão de habilidades linguísticas

  • A Meta está trabalhando para melhorar as habilidades linguísticas do Llama 4 para permitir conversas mais naturais
  • O objetivo é permitir diálogos mais fluidos e bilaterais nos quais os usuários podem interromper o modelo de IA
  • Chris Cox, diretor de produtos da Meta, descreveu a próxima llama 4 como um "modelo OMNI" que permite a língua nativa, em vez de traduzir a linguagem em texto

IA agêntica e habilidades estendidas

  • Mark Zuckerberg anunciou que o LLAMA 4 terá “habilidades de agente” que devem permitir novos aplicativos
  • A Meta pretende desenvolver modelos de IA que “realizam ações generalizadas, é claro que se comunicam com as pessoas e resolvam problemas desafiadores”
  • A empresa está pensando em oferecer assinaturas premium para seu assistente de IA para fins de agente, como reservas ou produção de vídeo

Por que o lhama 4 é um ponto de virada na paisagem da IA

A publicação do LLAMA 4 representa uma etapa significativa na estratégia de metas para se tornar a área líder da IA ​​generativa na área altamente competitiva. Com a introdução da mistura de arquitetura de especialistas, multimodalidade nativa e uma janela de contexto impressionantemente longa, a meta mostra que os modelos abertos podem acompanhar os modelos proprietários das grandes empresas de tecnologia.

Apesar da controvérsia sobre o licenciamento e a questão de saber se o LLAMA 4 deveria realmente ser chamado de "código aberto", o progresso técnico é um marco importante. A capacidade dos modelos de processar texto e imagens abre novas oportunidades para desenvolvedores e empresas.

Com o excelente gigante Llama 4 e os planos anunciados para habilidades expandidas de idiomas e agentes, fica claro que a Meta intensificará ainda mais seus investimentos na IA. Os próximos meses mostrarão como esses novos modelos mudam o cenário da IA ​​e se, como previsto por Mark Zuckerberg, eles realmente ajudarão a criar modelos abertos de IA no campo da inteligência artificial.

Adequado para:

 

Seu parceiro global de marketing e desenvolvimento de negócios

☑️ Nosso idioma comercial é inglês ou alemão

☑️ NOVO: Correspondência em seu idioma nacional!

 

Pioneiro Digital - Konrad Wolfenstein

Konrad Wolfenstein

Ficarei feliz em servir você e minha equipe como consultor pessoal.

Você pode entrar em contato comigo preenchendo o formulário de contato ou simplesmente ligando para +49 89 89 674 804 (Munique) . Meu endereço de e-mail é: wolfenstein xpert.digital

Estou ansioso pelo nosso projeto conjunto.

 

 

☑️ Apoio às PME em estratégia, consultoria, planeamento e implementação

☑️ Criação ou realinhamento da estratégia digital e digitalização

☑️ Expansão e otimização dos processos de vendas internacionais

☑️ Plataformas de negociação B2B globais e digitais

☑️ Pioneiro em Desenvolvimento de Negócios / Marketing / RP / Feiras Comerciais


⭐️ Inteligência artificial (AI) -Ai Blog, ponto de acesso e conteúdo ⭐️ Inteligência digital ⭐️ Xpaper