Ahmad Al-Dahle, vice-président et responsable de l’IA générative chez Meta, a récemment annoncé le lancement des premiers modèles de la série Llama 4. Cette nouvelle génération de modèles d’intelligence artificielle introduit une architecture avancée et des capacités multimodales natives.
Principaux modèles dévoilés :
- Llama 4 Scout : Ce modèle compact, doté de 17 milliards de paramètres activés et de 16 experts, se distingue par sa rapidité et ses capacités multimodales natives. Il offre une fenêtre de contexte de plus de 10 millions de tokens et peut fonctionner sur un seul GPU.
- Llama 4 Maverick : Positionné comme le meilleur modèle multimodal de sa catégorie, il surpasse GPT-4o et Gemini 2.0 Flash sur divers benchmarks. Avec moins de la moitié des paramètres actifs, il atteint des performances comparables à DeepSeek v3 en matière de raisonnement et de codage. De plus, il peut être hébergé sur une seule machine.
- Llama 4 Behemoth : Encore en phase d’entraînement, ce modèle est présenté comme le plus puissant de la série, surpassant GPT-4.5, Claude Sonnet 3.7 et Gemini 2.0 Pro sur plusieurs benchmarks STEM.
Meta collabore avec des partenaires tels que Hugging Face, Databricks, Together AI, Ollama et Snowflake pour faciliter l’accès aux modèles Llama 4. Cette initiative souligne l’engagement de Meta en faveur de l’open source et de l’innovation collaborative dans le domaine de l’IA.



