Google presentó Gemma 4, un conjunto de cuatro modelos de pesos abiertos bajo la licencia Apache 2.0. La actualización de licencia de las versiones anteriores de Gemma amplía las opciones disponibles para modificaciones, reutilización y uso comercial.

Estos modelos están diseñados para soportar una variedad de hardware, desde dispositivos móviles hasta inferencias a escala de servidor. El anuncio fue realizado por Google DeepMind y se centra en el razonamiento, flujos de trabajo basados en agentes y soporte de entrada multimodal.

Tamaños de Modelo y Objetivos de Hardware de Gemma 4

Google anunció que Gemma 4 se lanzará en varias configuraciones. Estas incluyen E2B, optimizado para dispositivos de borde y dirigido a hardware móvil y estados de bajo consumo; y E4B, optimizado para dispositivos similares pero con mayor capacidad.

  • 26 mil millones de parámetros del modelo de mezcla de expertos, diseñado para uso a escala de servidor y actualmente ocupa el sexto lugar en la tabla de clasificación de texto de Arena AI entre los modelos abiertos.
  • 31 mil millones de parámetros del modelo denso, ocupa el tercer lugar en la misma tabla de clasificación.

Google señala que los modelos de 31B y 26B mostraron un rendimiento 20 veces mejor que otros modelos con menos parámetros en el benchmark de Arena AI. Estas afirmaciones de rendimiento se basan en las propias evaluaciones de Google en el momento del lanzamiento de los modelos.

Capacidades de la Familia de Modelos Gemma 4

Los cuatro modelos de Gemma 4 vienen con soporte multimodal nativo para video e imágenes en varias resoluciones; OCR y comprensión gráfica son algunos de los principales escenarios de uso. Los modelos E2B y E4B también incluyen entrada de voz nativa para reconocimiento de habla.

Las longitudes de las ventanas de contexto llegan hasta 128K tokens para los modelos de borde y hasta 256K tokens para los modelos de 26B y 31B. Todos los modelos admiten llamadas a funciones, salida JSON estructurada y instrucciones del sistema nativas para crear flujos de trabajo de agentes. Google indica que los modelos están entrenados de forma nativa en más de 140 idiomas.

Transición de la Licencia Gemma Privada a Apache 2.0

Las versiones anteriores de los modelos Gemma utilizaban una licencia privada que restringía modificaciones y redistribución. Gemma 4 ahora utiliza la licencia Apache 2.0 y ofrece condiciones estandarizadas para uso comercial, modificaciones y distribución; lo que no requiere un acuerdo separado con Google. Google señala que este cambio hace que Gemma 4 sea más adecuado para aplicaciones comerciales y de desarrollo.

Todos los cuatro modelos de Gemma 4 ya están disponibles. Sin embargo, Google no proporcionó un cronograma sobre cuándo se integrarán los modelos de borde en productos de hardware Android o de consumo.