Selección de voz 📢


Meta publica New Llama 4 Scout, Maverick y Behemoth

Publicado el: 6 de abril de 2025 / Actualización del: 6 de abril de 2025 - Autor: Konrad Wolfenstein

Meta publica New Llama 4 Scout, Maverick y Behemoth

Meta Publishes New Llama 4 Scout, Maverick y Behemoth-Image: Xpert.digital

Llama 4: La nueva generación de sistemas de IA abiertos de Meta

Llama 4 Revelado: Meta Clave para la próxima AI Age

Meta presentó la última generación de sus modelos AI, LLAMA 4, el 5 de abril de 2025. Estos nuevos modelos representan un progreso significativo en el desarrollo de sistemas de IA abiertos y tienen una serie de funciones innovadoras que aumentan significativamente su rendimiento y eficiencia. La serie Llama 4 consta de diferentes modelos, con dos de ellos ya disponibles públicamente, mientras que el modelo más poderoso todavía está en la fase de entrenamiento.

Adecuado para:

La familia Model de Llama 4

Meta ha desarrollado tres modelos diferentes en la serie Llama 4, cada uno de los cuales está optimizado para diferentes aplicaciones:

Llama 4 Scout

Llama 4 Scout es un modelo compacto con impresionantes especificaciones técnicas:

  • 17 mil millones de parámetros activos con 16 expertos (un total de 109 mil millones de parámetros)
  • Se puede operar en una sola GPU NVIDIA H100 con cuantización INT4
  • Tiene una ventana de contexto notablemente grande de 10 millones de tokens, lo que lo convierte en uno de los primeros modelos abiertos con esta capacidad

Según Meta, Scout excede otros modelos en su clase como Gemini 3, Gemini 2.0 Flash-Lite y Mistral 3.1. Es particularmente adecuado para tareas como el resumen de documentos largos, personalización basada en datos del usuario y conclusiones complejas sobre grandes cantidades de conocimiento.

Llama 4 Maverick

Llama 4 Maverick es el más poderoso de los dos modelos disponibles:

  • 17 mil millones de parámetros activos con 128 expertos (un total de 400 mil millones de parámetros)
  • La versión de chat experimental llegó a Elo 1417 en Lmarena
  • Excede modelos como GPT-4O y Gemini 2.0 Flash en numerosos puntos de referencia

Este modelo es particularmente adecuado para aplicaciones generales de asistencia y chat, como escritura creativa y muestra resultados comparables a Deepseek V3 en tareas de razonamiento y codificación, pero con la mitad de los parámetros.

LLAMA 4 Behemoth

Llama 4 Behemoth es el modelo más poderoso de Metas, que aún no está disponible públicamente:

  • 288 mil millones de parámetros activos con 16 expertos (un total de casi 2 billones de parámetros)
  • Según Meta, excede GPT-4.5, Claude Sonnet 3.7 y Gemini 2.0 Pro para varios puntos de referencia STEM
  • Sirve como un "modelo de maestro" para los modelos Llama 4 más pequeños

Behemoth todavía está en la fase de capacitación y se publicará en una fecha posterior.

Innovaciones técnicas

La serie de modelos LLAMA 4 presenta varias innovaciones técnicas importantes que mejoran su rendimiento y eficiencia:

Mezcla de arquitectura de expertos (MOE)

Una de las innovaciones más importantes en LLAMA 4 es la mezcla de la arquitectura de expertos (MOE), en la que solo se activan una parte de los parámetros del modelo para cada token:

  • Esto reduce significativamente el esfuerzo y la latencia de cálculo, mientras que el alto rendimiento se conserva
  • En Llama 4 Maverick, cada token es procesado por un experto común y uno de los 128 expertos gerizados
  • Esta arquitectura permite aumentar el parámetro total del modelo sin aumentar los costos de inferencia

Multimodalidad nativa con fusión temprana

Llama 4 es el primer modelo abierto con multimodalidad nativa por la fusión temprana:

  • Los tokens de texto y imagen están integrados en una arquitectura de modelo uniforme
  • Esto permite una capacitación preliminar conjunta con grandes cantidades de datos de texto, imagen y video
  • A diferencia de Llama 3.2, que utilizó parámetros separados para texto e imágenes, Llama 4 comprende ambas modalidades nativas con los mismos parámetros

Ventana de contexto extremadamente larga

La ventana de contexto extremadamente larga de Llama 4 Scout es particularmente impresionante:

  • Con 10 millones de tokens, supera claramente la mayoría de los modelos disponibles
  • Esto permite el procesamiento de documentos muy largos, bases de código enteras o conversaciones extensas
  • La arquitectura de Iroope (capas de atención entrelazadas) hace que esto sea posible

Nuevos métodos de entrenamiento

Meta ha utilizado varios métodos innovadores para la capacitación de Llama 4:

  • Metap: una técnica para la coordinación robusta del hiperámetro de modelo crítico
  • Precisión FP8: uso de números de 8 bits hechos en diapositivas para capacitación eficiente
  • CO-DISTACLACIÓN: Uso de Llama 4 Behemoth como modelo de maestro para modelos más pequeños
  • Aprendizaje en línea totalmente asincrónico con refuerzos: una nueva infraestructura para el aprendizaje a gran escala

Disponibilidad e integración

Los modelos LLAMA 4 están disponibles a través de varias plataformas y servicios:

Descargar y proveedor de nubes

  • Los modelos Scout y Maverick se pueden descargar directamente de Meta o a través de Hugging Face
  • También están disponibles a través de varias plataformas en la nube:
    • Trabajadores de Cloudflare AI
    • Azure Ai Foundry y Azure Databricks
    • Vertex AI de Google Cloud
    • Otros socios seguirán en los próximos días

Integración en meta productos

Meta ya ha actualizado a sus asistentes de IA en varias plataformas en Llama 4:

  • WhatsApp, Messenger e Instagram directamente en 40 países diferentes
  • El sitio web de Meta.ai
  • Sin embargo, las funciones multimodales actualmente solo están disponibles para usuarios de lenguaje inglés en los EE. UU.

Adecuado para:

Licencia y controversia

Aunque Meta Llama 4 se refiere al "código abierto", hay algunas restricciones en la licencia que provocaron controversia:

Restricciones de licencia

La licencia comunitaria de Llama 4 contiene varias restricciones:

  • Las empresas con más de 700 millones de usuarios activos mensuales necesitan una licencia especial de Meta
  • Aparentemente, los modelos no pueden usar o distribuir usuarios y empresas de la UE, presumiblemente debido a los requisitos reglamentarios
  • Existen requisitos con respecto a los nombres y la atribución para modelos derivados.

Debate sobre "código abierto"

Hay un debate sobre si Llama 4 debería llamarse "código abierto":

  • La iniciativa de código abierto encontró en 2023 que las restricciones en la licencia de LLAMA lo sacan "de la categoría de" código abierto ""
  • Los críticos argumentan que es más un modelo de "fuente abierta" o "con pesas abiertas" que el software de código abierto real
  • Las restricciones de la licencia podrían ser problemáticas para las pequeñas empresas sin sus propios departamentos legales

Planes futuros

Meta ya ha dado algunas ideas sobre sus planes futuros para la Llama 4 y más allá:

Llamacon y otros anuncios

  • Meta organizará la primera conferencia de Llamacon el 29 de abril de 2025, en la que se anunciarán más detalles sobre sus modelos de IA y planes de productos
  • La compañía también planea publicar una solicitud dedicada para su bot de meta-chat en el segundo trimestre

Expansión de habilidades lingüísticas

  • Meta está trabajando en mejorar las habilidades lingüísticas de Llama 4 para permitir conversaciones más naturales
  • El objetivo es habilitar más diálogos fluidos de dos lados en los que los usuarios puedan interrumpir el modelo AI
  • Chris Cox, director de productos de Meta, describió el próximo Llama 4 como un "modelo Omni" que permite el idioma nativo en lugar de traducir el lenguaje en texto

AI agente y habilidades extendidas

  • Mark Zuckerberg ha anunciado que Llama 4 tendrá "habilidades de agente" que deberían habilitar nuevas aplicaciones
  • Meta tiene como objetivo desarrollar modelos de IA que "llevaran a cabo acciones generalizadas, por supuesto, comunicarse con las personas y resolver problemas desafiantes"
  • La compañía está considerando ofrecer suscripciones premium para su asistente de IA para fines de agentes, como reservas o producción de video.

Por qué Llama 4 es un punto de inflexión en el paisaje de IA

La publicación de Llama 4 representa un paso significativo en la estrategia de Meta para convertirse en el área líder de la IA generativa en el área altamente competitiva. Con la introducción de la mezcla de arquitectura de expertos, multimodalidad nativa y una ventana de contexto impresionantemente larga, Meta muestra que los modelos abiertos pueden mantenerse al día con los modelos patentados de las grandes empresas de tecnología.

A pesar de la controversia sobre la licencia y la cuestión de si Llama 4 realmente debería referirse como un "código abierto", el progreso técnico es un hito importante. La capacidad de los modelos para procesar texto e imágenes abre nuevas oportunidades para desarrolladores y empresas.

Con el Behemoth de la Llama 4 sobresaliente y los planes anunciados para las habilidades de lenguaje y agente ampliado, está claro que Meta intensificará aún más sus inversiones en IA. Los próximos meses mostrarán cómo estos nuevos modelos cambian el panorama de IA y si, como lo predijo Mark Zuckerberg, en realidad ayudarán a hacer modelos de IA abiertos en el campo de la inteligencia artificial.

Adecuado para:

 

Su socio global de marketing y desarrollo empresarial

☑️ Nuestro idioma comercial es inglés o alemán.

☑️ NUEVO: ¡Correspondencia en tu idioma nacional!

 

Pionero digital - Konrad Wolfenstein

Konrad Wolfenstein

Estaré encantado de servirle a usted y a mi equipo como asesor personal.

Puedes ponerte en contacto conmigo rellenando el formulario de contacto o simplemente llámame al +49 89 89 674 804 (Múnich) . Mi dirección de correo electrónico es: wolfenstein xpert.digital

Estoy deseando que llegue nuestro proyecto conjunto.

 

 

☑️ Apoyo a las PYMES en estrategia, consultoría, planificación e implementación.

☑️ Creación o realineamiento de la estrategia digital y digitalización

☑️ Ampliación y optimización de procesos de ventas internacionales

☑️ Plataformas comerciales B2B globales y digitales

☑️ Pionero en desarrollo empresarial / marketing / relaciones públicas / ferias comerciales


⭐️ Blog de inteligencia artificial (AI) -ai, punto de acceso y centro de contenido ⭐️ Inteligencia digital ⭐️ xpaper