🦙 Meta revela família Llama 4 com modelos abertos e capacidades impressionantes

A Meta acaba de apresentar sua nova linha de modelos LLM da família Llama 4, trazendo avanços significativos em contexto, multimodalidade e eficiência de inferência. Entre as novidades estão os modelos Scout e Maverick, já disponíveis, além de um teaser do gigante Behemoth, ainda em fase de treinamento.
📌 Destaques rápidos:
- Llama 4 Scout: Com 109 bilhões de parâmetros e uma impressionante janela de contexto de 10 milhões de tokens, esse modelo roda em uma única GPU H100 e supera concorrentes como Gemma 3 e Mistral 3 em benchmarks. Seu foco é oferecer desempenho de ponta com alta eficiência.
- Llama 4 Maverick: Projetado com 400 bilhões de parâmetros totais e uma janela de 1 milhão de tokens, esse modelo se destaca em tarefas de raciocínio, multimodalidade e codificação. Ele supera o GPT-4o e o Gemini 2.0 Flash em vários testes — e faz isso com um custo operacional menor.
- Llama 4 Behemoth: Ainda em fase de treinamento, o modelo mais ambicioso da série chega com cerca de 2 trilhões de parâmetros. Ele foi pensado como modelo “professor” para treinar os demais, e já demonstra resultados superiores ao GPT-4.5, Claude 3.7 e Gemini 2.0 Pro em benchmarks técnicos e científicos.
🧠 Tecnologia por trás:
Todos os modelos utilizam uma arquitetura Mixture-of-Experts (MoE), que ativa apenas um subconjunto de parâmetros por token — reduzindo o custo de computação e tornando as inferências mais leves. Além disso, eles foram desenhados nativamente para lidar com texto, imagens e vídeo, graças a uma técnica chamada “early fusion”.
📥 Disponibilidade:
Os modelos Scout e Maverick já estão disponíveis para download no llama.com e no Hugging Face. Eles também podem ser testados via Meta AI no WhatsApp, Messenger e Instagram Direct.
📣 Por que importa?
Após a chegada do DeepSeek R1 e outros concorrentes de código aberto que sacudiram o mercado, a Meta precisava dar uma resposta forte. A família Llama 4 chega com melhorias substanciais em contexto, desempenho multimodal e escalabilidade, mantendo o compromisso com a abertura e acessibilidade para desenvolvedores.