Google ha presentato Gemma 4, un insieme di quattro modelli di peso aperti sotto licenza Apache 2.0. L'aggiornamento della licenza rispetto alle versioni precedenti di Gemma amplia le opzioni disponibili per modifiche, riutilizzo e utilizzo commerciale.

Questi modelli sono progettati per supportare una varietà di hardware, dall'estrazione su dispositivi mobili a scala server. L'annuncio è stato fatto da Google DeepMind e si concentra sul ragionamento, flussi di lavoro basati su agenti e supporto per input multimodali.

Dimensioni del modello Gemma 4 e obiettivi hardware

Google ha annunciato che Gemma 4 è stato lanciato in diverse configurazioni. Queste includono E2B, ottimizzato per dispositivi edge e mirato a hardware mobile e stati a bassa potenza; E4B, ottimizzato per dispositivi simili ma con capacità superiori.

  • 26 miliardi di parametri per un modello misto di esperti, progettato per l'uso a scala server e attualmente al sesto posto nella classifica di testo di Arena AI tra i modelli aperti.
  • 31 miliardi di parametri per un modello denso, attualmente al terzo posto nella stessa classifica.

Google afferma che i modelli 31B e 26B hanno mostrato prestazioni 20 volte migliori rispetto ad altri modelli con meno parametri nel benchmark di Arena AI. Queste affermazioni sulle prestazioni si basano sulle valutazioni interne di Google al momento del lancio dei modelli.

Capacità della famiglia di modelli Gemma 4

Tutti e quattro i modelli Gemma 4 vengono forniti con supporto multimodale locale per video e immagini a diverse risoluzioni; OCR e comprensione grafica sono tra i principali scenari d'uso. I modelli E2B ed E4B includono anche input vocale locale per il riconoscimento vocale.

Le lunghezze delle finestre di contesto arrivano fino a 128K token per i modelli edge e 256K token per i modelli 26B e 31B. Tutti i modelli supportano le chiamate di funzione, l'output JSON strutturato e le istruzioni di sistema locali per creare flussi di lavoro basati su agenti. Google afferma che i modelli sono stati addestrati localmente in oltre 140 lingue.

Transizione dalla licenza Gemma proprietaria ad Apache 2.0

Le versioni precedenti dei modelli Gemma utilizzavano una licenza proprietaria che limitava le modifiche e la ridistribuzione. Gemma 4 ora utilizza la licenza Apache 2.0 e offre condizioni standardizzate per l'uso commerciale, le modifiche e la distribuzione; ciò non richiede un accordo separato con Google. Google afferma che questo cambiamento rende Gemma 4 più adatto per applicazioni aziendali e di sviluppo.

Tutti e quattro i modelli Gemma 4 sono ora disponibili. Tuttavia, Google non ha fornito una tempistica su quando i modelli edge saranno integrati in prodotti hardware Android o consumer.