Google, Apache 2.0 lisansı altında quatro conjuntos de modelos de peso aberto chamados Gemma 4. A atualização da licença das versões anteriores do Gemma expande as opções disponíveis para modificações, reutilização e uso comercial.

Esses modelos foram projetados para suportar uma variedade de hardware, desde dispositivos móveis até extração em escala de servidor. O lançamento foi anunciado pelo Google DeepMind e foca em raciocínio, fluxos de trabalho baseados em agentes e suporte a entradas multimodais.

Tamanhos de Modelo Gemma 4 e Alvos de Hardware

Google anunciou que o Gemma 4 foi lançado em várias configurações. Entre elas, está o E2B, otimizado para dispositivos de borda e visando hardware móvel e estados de baixo consumo; e o E4B, otimizado para dispositivos semelhantes, mas com maior capacidade.

  • 26 bilhões de parâmetros de um modelo misto de especialistas, projetado para uso em escala de servidor e atualmente ocupa a sexta posição na tabela de liderança de texto da Arena AI entre os modelos abertos.
  • 31 bilhões de parâmetros de um modelo denso, que ocupa a terceira posição na mesma tabela de liderança.

Google afirma que os modelos de 31B e 26B apresentaram desempenho 20 vezes melhor do que outros modelos com menos parâmetros no benchmark da Arena AI. Essas alegações de desempenho são baseadas nas próprias avaliações do Google no momento do lançamento dos modelos.

Capacidades da Família de Modelos Gemma 4

Todos os quatro modelos Gemma 4 vêm com suporte multimodal nativo para vídeo e imagens em várias resoluções; OCR e compreensão gráfica estão entre os principais cenários de uso. Os modelos E2B e E4B também incluem entrada de voz nativa para reconhecimento de fala.

Os comprimentos das janelas de contexto vão até 128K tokens para os modelos de borda e 256K tokens para os modelos de 26B e 31B. Todos os modelos suportam chamadas de função, saída JSON estruturada e instruções de sistema nativas para criar fluxos de trabalho de agentes. O Google afirma que os modelos foram treinados nativamente em mais de 140 idiomas.

Transição da Licença Gemma Proprietária para Apache 2.0

As versões anteriores do modelo Gemma utilizavam uma licença proprietária que restringia modificações e redistribuição. O Gemma 4 agora utiliza a licença Apache 2.0 e oferece termos padronizados para uso comercial, modificações e distribuição; isso não requer um acordo separado com o Google. O Google afirma que essa mudança torna o Gemma 4 mais adequado para aplicações empresariais e de desenvolvedores.

Todos os quatro modelos Gemma 4 estão agora disponíveis. No entanto, o Google não forneceu um cronograma sobre quando os modelos de borda serão integrados a produtos de hardware Android ou de consumo.