Esta semana, Meta presentó Llama 4, su nueva familia de modelos de inteligencia artificial (IA), la cual promete capacidades equiparables a las de GPT-4o, de OpenAI; Gemini 2.0 Flash, de Google; y V3, de DeepSeek.
En un extenso artículo para su sitio web, el conglomerado tecnológico explicó que estos algoritmos destacan por ser multinodales y contar con ventanas de contexto de gran escala, que van desde 1 millón hasta 2 billones de tokens.
Llama 4 Scout encabeza la familia al catalogarse como “el mejor modelo multimodal del mundo en su categoría” y superar a todas las generaciones anteriores de Llama. Su arquitectura se compone de 17 mil millones de parámetros activos, una ventana de contexto de 10 millones de tokens y un sistema basado en “mezcla de expertos”, que integra 16 submodelos especializados en diversas tareas, temáticas y formatos multimedia que se activan según las solicitudes del usuario.
El segundo en la lista es Llama 4 Maverick, el primer modelo de la serie que incorpora capacidades multimodales de manera nativa, es decir, fue entrenado simultáneamente con texto, imágenes y video sin la necesidad de etiquetado previo.
En tercer y último lugar, Meta reveló Llama 4 Behemoth, el cual es descrito como “el modelo más avanzado de la compañía y uno de los grandes modelos de lenguaje más inteligentes del mundo”. La mala noticia es que todavía se encuentra en desarrollo y no está disponible públicamente; sin emabrgo, se pudo saber que cuenta con 288 mil millones de parámetros activos y cerca de 2 billones en total.
Llama 4 Maverick y Scout ya pueden descargarse a través de la página oficial de la compañía y la plataforma Hugging Face.