Meta lanza nuevas series de modelos de IA: Llama 4 Scout, Maverick y Behemoth

Konrad Wolfenstein

hace 1 año

Meta lanza nuevas series de modelos de IA: Llama 4 Scout, Maverick y Behemoth – Imagen: Xpert.Digital

Llama 4: La nueva generación de sistemas de IA abiertos de Meta

Llama 4: La clave de Meta para la próxima era de la IA

El 5 de abril de 2025, Meta presentó la última generación de sus modelos de IA, Llama 4. Estos nuevos modelos representan un avance significativo en el desarrollo de sistemas de IA abiertos y cuentan con capacidades innovadoras que mejoran sustancialmente su rendimiento y eficiencia. La serie Llama 4 comprende varios modelos, dos de los cuales ya están disponibles públicamente, mientras que el modelo más potente aún se encuentra en fase de entrenamiento.

Relacionado con esto:

Modelos de IA explicados de forma sencilla: comprenda los conceptos básicos de la IA, los modelos de lenguaje y el razonamiento

La familia de modelos Llama 4

Meta ha desarrollado tres modelos diferentes de la serie Llama 4, cada uno optimizado para diferentes casos de uso:

Llama 4 Scout

Llama 4 Scout es un modelo compacto con especificaciones técnicas impresionantes:

17 mil millones de parámetros activos con 16 expertos (un total de 109 mil millones de parámetros)
Se puede operar en una sola GPU NVIDIA H100 con cuantificación Int4
Cuenta con una ventana de contexto notablemente grande de 10 millones de tokens, lo que lo convierte en uno de los primeros modelos abiertos con esta capacidad

Según Meta, Scout supera a otros modelos de su clase, como Gemini 3, Gemini 2.0 Flash-Lite y Mistral 3.1. Es especialmente adecuado para tareas como resumir documentos extensos, personalizar contenido según los datos del usuario y extraer conclusiones complejas a partir de grandes cantidades de información.

Llama 4 Maverick

El Llama 4 Maverick es el más potente de los dos modelos disponibles:

17 mil millones de parámetros activos con 128 expertos (400 mil millones de parámetros en total)
La versión experimental del chat alcanzó ELO 1417 en LMArena
Según Meta, supera a modelos como GPT-4o y Gemini 2.0 Flash en numerosos puntos de referencia

Este modelo es especialmente adecuado para aplicaciones de asistencia general y chat, como la escritura creativa, y muestra resultados comparables a DeepSeek v3 en tareas de razonamiento y codificación, pero con la mitad de los parámetros.

Llama 4 Behemot

Llama 4 Behemoth es el modelo más poderoso de Meta, pero aún no está disponible públicamente:

288 mil millones de parámetros activos con 16 expertos (casi 2 billones de parámetros en total)
Según Meta, supera a GPT-4.5, Claude Sonnet 3.7 y Gemini 2.0 Pro en varios puntos de referencia STEM
Sirve como "modelo de enseñanza" para los modelos Llama 4 más pequeños

Behemoth todavía se encuentra en la fase de entrenamiento y se lanzará en una fecha posterior.

Innovaciones técnicas

La gama de modelos Llama 4 introduce varias innovaciones técnicas importantes que mejoran su rendimiento y eficiencia:

Arquitectura de mezcla de expertos (MoE)

Una de las innovaciones más importantes de Llama 4 es la arquitectura Mixture of Experts (MoE), en la que solo se activa un subconjunto de los parámetros del modelo para cada token:

Esto reduce significativamente el esfuerzo computacional y la latencia, al tiempo que mantiene un alto rendimiento
En Llama 4 Maverick, cada token es procesado por un experto compartido y uno de los 128 expertos enrutados
Esta arquitectura permite aumentar los parámetros generales del modelo sin aumentar los costos de inferencia

Multimodalidad nativa con fusión temprana

Llama 4 es el primer modelo abierto con multimodalidad nativa a través de Early Fusion:

Los tokens de texto e imagen están integrados en una arquitectura de modelo unificada
Esto permite un entrenamiento previo conjunto con grandes cantidades de datos de texto, imágenes y vídeo
A diferencia de Llama 3.2, que utilizaba parámetros separados para texto e imágenes, Llama 4 entiende ambas modalidades de forma nativa con los mismos parámetros

Ventana de contexto extremadamente larga

La ventana de contexto extremadamente larga de Llama 4 Scout es particularmente impresionante:

Con 10 millones de tokens, supera significativamente la mayoría de los modelos disponibles
Esto permite el procesamiento de documentos muy largos, bases de código completas o conversaciones extensas
La arquitectura iRoPE (capas de atención intercaladas) lo hace posible

Nuevos métodos de entrenamiento

Meta ha utilizado varios métodos innovadores para entrenar a Llama 4:

MetaP: una técnica para ajustar de forma robusta los hiperparámetros críticos del modelo
Precisión FP8: uso de números de punto flotante de 8 bits para un entrenamiento eficiente
Co-destilación: uso de Llama 4 Behemoth como modelo docente para modelos más pequeños
Aprendizaje en línea totalmente asincrónico con amplificación: una nueva infraestructura para el aprendizaje a gran escala

Disponibilidad e integración

Los modelos Llama 4 están disponibles a través de varias plataformas y servicios:

Proveedores de descargas y nube

Los modelos Scout y Maverick se pueden descargar directamente desde Meta o mediante Hugging Face
También están disponibles a través de varias plataformas en la nube:
- Trabajadores de Cloudflare con IA
- Azure AI Foundry y Azure Databricks
- Vertex AI de Google Cloud
- En los próximos días se sumarán más socios

Integración en metaproductos

Meta ya ha actualizado sus asistentes de IA a Llama 4 en varias plataformas:

WhatsApp, Messenger e Instagram Direct en 40 países diferentes
El sitio web de Meta.AI
Sin embargo, las funciones multimodales actualmente sólo están disponibles para usuarios de habla inglesa en EE. UU

Relacionado con esto:

¡Meta AI ya está aquí en Alemania! WhatsApp, Instagram y Facebook incorporan IA, con importantes diferencias con respecto a la versión estadounidense.

Licencias y controversias

Aunque Meta Llama 4 se describe como de "código abierto", existen algunas restricciones en la licencia que han generado controversia:

Restricciones de licencia

La licencia comunitaria de Llama 4 contiene varias restricciones:

Las empresas con más de 700 millones de usuarios activos mensuales requieren una licencia especial de Meta
Al parecer, a los usuarios y empresas de la UE no se les permite utilizar ni distribuir los modelos, presumiblemente debido a requisitos reglamentarios
Existen requisitos respecto a la denominación y atribución de los modelos derivados

Debate sobre el “código abierto”

Existe un debate sobre si Llama 4 debería considerarse realmente de "código abierto":

En 2023, la Iniciativa de Código Abierto determinó que las restricciones de la licencia Llama la excluyen de la categoría de "código abierto"
Los críticos argumentan que se trata más de un modelo de "código abierto" o de "pesos abiertos" que de un verdadero software de código abierto
Las restricciones de licencias podrían ser problemáticas para las pequeñas empresas que no cuentan con sus propios departamentos legales

Planes futuros

Meta ya ha dado algunas pistas sobre sus planes futuros para Llama 4 y más allá:

LlamaCon y otros anuncios

Meta organizará su primera conferencia LlamaCon el 29 de abril de 2025, donde se anunciarán más detalles sobre sus modelos de IA y planes de productos
La compañía también planea lanzar una aplicación dedicada para su meta chatbot en el segundo trimestre

Ampliar las habilidades lingüísticas

Meta está trabajando para mejorar las habilidades lingüísticas de Llama 4 para permitir conversaciones más naturales
El objetivo es permitir diálogos bidireccionales más fluidos en los que los usuarios puedan interrumpir el modelo de IA
Chris Cox, director de producto de Meta, describió el próximo Llama 4 como un "modelo omnidireccional" que permite el uso del lenguaje nativo en lugar de traducir la voz a texto

IA agente y capacidades mejoradas

Mark Zuckerberg ha anunciado que Llama 4 tendrá "capacidades de agente" que permitirán nuevos casos de uso
Meta tiene como objetivo desarrollar modelos de IA que puedan "realizar acciones generalizadas, comunicarse de forma natural con los humanos y resolver problemas complejos"
La compañía está considerando ofrecer suscripciones premium para su asistente de inteligencia artificial para fines relacionados con el agente, como reservas o producción de videos

Por qué Llama 4 es un punto de inflexión en el panorama de la IA

El lanzamiento de Llama 4 representa un paso significativo en la estrategia de Meta para convertirse en líder en el competitivo campo de la IA generativa. Con la introducción de la arquitectura Mixture of Experts, la multimodalidad nativa y una ventana de contexto impresionantemente amplia, Meta demuestra que los modelos abiertos pueden competir con los modelos propietarios de las principales empresas tecnológicas.

A pesar de las controversias en torno a las licencias y la cuestión de si Llama 4 debería considerarse realmente de código abierto, los avances técnicos representan un hito importante. La capacidad de los modelos para procesar tanto texto como imágenes abre nuevas posibilidades para desarrolladores y empresas.

Con el lanzamiento de Llama 4 Behemoth aún pendiente y los planes anunciados para mejorar las capacidades de lenguaje y agentes, es evidente que Meta intensificará aún más sus inversiones en IA. Los próximos meses mostrarán cómo estos nuevos modelos transformarán el panorama de la IA y si, como predijo Mark Zuckerberg, contribuirán a que los modelos abiertos de IA se conviertan en la fuerza líder de la inteligencia artificial.

Relacionado con esto:

Su socio global de marketing y desarrollo empresarial

☑️ Nuestro idioma comercial es el inglés o el alemán

☑️ NUEVO: ¡Correspondencia en tu idioma nativo!

Konrad Wolfenstein

Mi equipo y yo estaremos encantados de estar disponibles para usted como su asesor personal.

Puedes contactarme rellenando el formulario de contacto aquí wolfenstein@xpert.digital:o simplemente llamándome al +49 7348 4088 965. Mi dirección de correo electrónico es

Espero con ilusión nuestro proyecto conjunto.

Meta lanza nuevas series de modelos de IA: Llama 4 Scout, Maverick y Behemoth

Llama 4: La nueva generación de sistemas de IA abiertos de Meta