
Meta lanza nuevas series de modelos de IA: Llama 4 Scout, Maverick y Behemoth – Imagen: Xpert.Digital
Llama 4: La nueva generación de sistemas de IA abiertos de Meta
Llama 4: La clave de Meta para la próxima era de la IA
El 5 de abril de 2025, Meta presentó la última generación de sus modelos de IA, Llama 4. Estos nuevos modelos representan un avance significativo en el desarrollo de sistemas de IA abiertos y cuentan con capacidades innovadoras que mejoran sustancialmente su rendimiento y eficiencia. La serie Llama 4 comprende varios modelos, dos de los cuales ya están disponibles públicamente, mientras que el modelo más potente aún se encuentra en fase de entrenamiento.
Adecuado para:
- Simplemente explicó modelos de IA: Comprenda los conceptos básicos de la IA, los modelos de voz y el razonamiento
La familia de modelos Llama 4
Meta ha desarrollado tres modelos diferentes de la serie Llama 4, cada uno optimizado para diferentes casos de uso:
Llama 4 Scout
Llama 4 Scout es un modelo compacto con especificaciones técnicas impresionantes:
- 17 mil millones de parámetros activos con 16 expertos (un total de 109 mil millones de parámetros)
- Se puede operar en una sola GPU NVIDIA H100 con cuantificación Int4
- Cuenta con una ventana de contexto notablemente grande de 10 millones de tokens, lo que lo convierte en uno de los primeros modelos abiertos con esta capacidad.
Según Meta, Scout supera a otros modelos de su clase, como Gemini 3, Gemini 2.0 Flash-Lite y Mistral 3.1. Es especialmente adecuado para tareas como resumir documentos extensos, personalizar contenido según los datos del usuario y extraer conclusiones complejas a partir de grandes cantidades de información.
Llama 4 Maverick
El Llama 4 Maverick es el más potente de los dos modelos disponibles:
- 17 mil millones de parámetros activos con 128 expertos (400 mil millones de parámetros en total)
- La versión experimental del chat alcanzó ELO 1417 en LMArena
- Según Meta, supera a modelos como GPT-4o y Gemini 2.0 Flash en numerosos puntos de referencia.
Este modelo es especialmente adecuado para aplicaciones de asistencia general y chat, como la escritura creativa, y muestra resultados comparables a DeepSeek v3 en tareas de razonamiento y codificación, pero con la mitad de los parámetros.
Llama 4 Behemot
Llama 4 Behemoth es el modelo más poderoso de Meta, pero aún no está disponible públicamente:
- 288 mil millones de parámetros activos con 16 expertos (casi 2 billones de parámetros en total)
- Según Meta, supera a GPT-4.5, Claude Sonnet 3.7 y Gemini 2.0 Pro en varios puntos de referencia STEM.
- Sirve como “modelo de profesor” para los modelos Llama 4 más pequeños.
Behemoth todavía se encuentra en la fase de entrenamiento y se lanzará en una fecha posterior.
Innovaciones técnicas
La gama de modelos Llama 4 introduce varias innovaciones técnicas importantes que mejoran su rendimiento y eficiencia:
Arquitectura de mezcla de expertos (MoE)
Una de las innovaciones más importantes de Llama 4 es la arquitectura Mixture of Experts (MoE), en la que solo se activa un subconjunto de los parámetros del modelo para cada token:
- Esto reduce significativamente el esfuerzo computacional y la latencia, al tiempo que mantiene un alto rendimiento.
- En Llama 4 Maverick, cada token es procesado por un experto compartido y uno de los 128 expertos enrutados.
- Esta arquitectura permite aumentar los parámetros generales del modelo sin aumentar los costos de inferencia.
Multimodalidad nativa con fusión temprana
Llama 4 es el primer modelo abierto con multimodalidad nativa a través de Early Fusion:
- Los tokens de texto e imagen están integrados en una arquitectura de modelo unificada.
- Esto permite un entrenamiento previo conjunto con grandes cantidades de datos de texto, imágenes y vídeo.
- A diferencia de Llama 3.2, que utilizaba parámetros separados para texto e imágenes, Llama 4 entiende ambas modalidades de forma nativa con los mismos parámetros.
Ventana de contexto extremadamente larga
La ventana de contexto extremadamente larga de Llama 4 Scout es particularmente impresionante:
- Con 10 millones de tokens, supera significativamente la mayoría de los modelos disponibles.
- Esto permite el procesamiento de documentos muy largos, bases de código completas o conversaciones extensas.
- La arquitectura iRoPE (capas de atención intercaladas) lo hace posible.
Nuevos métodos de entrenamiento
Meta ha utilizado varios métodos innovadores para entrenar a Llama 4:
- MetaP: una técnica para ajustar de forma robusta los hiperparámetros críticos del modelo
- Precisión FP8: uso de números de punto flotante de 8 bits para un entrenamiento eficiente
- Co-destilación: uso de Llama 4 Behemoth como modelo docente para modelos más pequeños
- Aprendizaje en línea totalmente asincrónico con amplificación: una nueva infraestructura para el aprendizaje a gran escala
Disponibilidad e integración
Los modelos Llama 4 están disponibles a través de varias plataformas y servicios:
Proveedores de descargas y nube
- Los modelos Scout y Maverick se pueden descargar directamente desde Meta o mediante Hugging Face.
- También están disponibles a través de varias plataformas en la nube:
- Trabajadores de Cloudflare con IA
- Azure AI Foundry y Azure Databricks
- Vertex AI de Google Cloud
- En los próximos días se sumarán más socios.
Integración en metaproductos
Meta ya ha actualizado sus asistentes de IA a Llama 4 en varias plataformas:
- WhatsApp, Messenger e Instagram Direct en 40 países diferentes
- El sitio web de Meta.AI
- Sin embargo, las funciones multimodales actualmente sólo están disponibles para usuarios de habla inglesa en EE. UU.
Adecuado para:
- ¡Meta AI ya está aquí en Alemania! WhatsApp, Instagram y Facebook incorporan IA, con importantes diferencias con respecto a la versión estadounidense.
Licencias y controversias
Aunque Meta Llama 4 se describe como “de código abierto”, existen algunas restricciones en la licencia que han generado controversia:
Restricciones de licencia
La licencia comunitaria de Llama 4 contiene varias restricciones:
- Las empresas con más de 700 millones de usuarios activos mensuales requieren una licencia especial de Meta.
- Al parecer, a los usuarios y empresas de la UE no se les permite utilizar ni distribuir los modelos, presumiblemente debido a requisitos reglamentarios.
- Existen requisitos respecto a la denominación y atribución de los modelos derivados.
Debate sobre el “código abierto”
Existe un debate sobre si Llama 4 debería realmente llamarse “Open Source”:
- La Iniciativa de Código Abierto determinó en 2023 que las restricciones en la licencia de Llama la sacan “de la categoría de 'Código Abierto'”.
- Los críticos sostienen que se trata más de un modelo de “código abierto” o de “pesos abiertos” que de un auténtico software de código abierto.
- Las restricciones de licencias podrían ser problemáticas para las pequeñas empresas que no cuentan con sus propios departamentos legales.
Planes futuros
Meta ya ha dado algunas pistas sobre sus planes futuros para Llama 4 y más allá:
LlamaCon y otros anuncios
- Meta organizará su primera conferencia LlamaCon el 29 de abril de 2025, donde se anunciarán más detalles sobre sus modelos de IA y planes de productos.
- La compañía también planea lanzar una aplicación dedicada para su meta chatbot en el segundo trimestre.
Ampliar las habilidades lingüísticas
- Meta está trabajando para mejorar las habilidades lingüísticas de Llama 4 para permitir conversaciones más naturales.
- El objetivo es permitir diálogos bidireccionales más fluidos en los que los usuarios puedan interrumpir el modelo de IA.
- Chris Cox, director de productos de Meta, describió el próximo Llama 4 como un “omnimodelo” que permite el uso del idioma nativo en lugar de traducir el habla a texto.
IA agente y capacidades mejoradas
- Mark Zuckerberg ha anunciado que Llama 4 tendrá “capacidades de agente” que permitirán nuevos casos de uso.
- Meta tiene como objetivo desarrollar modelos de IA que puedan “realizar acciones generalizadas, comunicarse naturalmente con los humanos y resolver problemas desafiantes”.
- La compañía está considerando ofrecer suscripciones premium para su asistente de inteligencia artificial para fines relacionados con el agente, como reservas o producción de videos.
Por qué Llama 4 es un punto de inflexión en el panorama de la IA
El lanzamiento de Llama 4 representa un paso significativo en la estrategia de Meta para convertirse en líder en el competitivo campo de la IA generativa. Con la introducción de la arquitectura Mixture of Experts, la multimodalidad nativa y una ventana de contexto impresionantemente amplia, Meta demuestra que los modelos abiertos pueden competir con los modelos propietarios de las principales empresas tecnológicas.
A pesar de las controversias en torno a las licencias y la duda de si Llama 4 debería realmente considerarse "de código abierto", los avances técnicos representan un hito significativo. La capacidad de los modelos para procesar texto e imágenes abre nuevas posibilidades para desarrolladores y empresas.
Con el lanzamiento de Llama 4 Behemoth aún pendiente y los planes anunciados para mejorar las capacidades de lenguaje y agentes, es evidente que Meta intensificará aún más sus inversiones en IA. Los próximos meses mostrarán cómo estos nuevos modelos transformarán el panorama de la IA y si, como predijo Mark Zuckerberg, contribuirán a que los modelos abiertos de IA se conviertan en la fuerza líder de la inteligencia artificial.
Adecuado para:
Su socio global de marketing y desarrollo empresarial
☑️ Nuestro idioma comercial es inglés o alemán.
☑️ NUEVO: ¡Correspondencia en tu idioma nacional!
Estaré encantado de servirle a usted y a mi equipo como asesor personal.
Puedes ponerte en contacto conmigo rellenando el formulario de contacto o simplemente llámame al +49 89 89 674 804 (Múnich) . Mi dirección de correo electrónico es: wolfenstein ∂ xpert.digital
Estoy deseando que llegue nuestro proyecto conjunto.

