Google a présenté Gemma 4, un ensemble de quatre modèles de poids ouverts sous la licence Apache 2.0. La mise à jour de la licence des versions précédentes de Gemma élargit les options disponibles pour les modifications, la réutilisation et l'utilisation commerciale.
Ces modèles sont conçus pour prendre en charge divers matériels, allant de l'extraction sur des appareils mobiles à l'échelle des serveurs. L'annonce a été faite par Google DeepMind et se concentre sur le raisonnement, les flux de travail basés sur des agents et le support d'entrées multimodales.
Tailles de modèle et objectifs matériels de Gemma 4
Google a annoncé que Gemma 4 est lancé dans plusieurs configurations. Celles-ci incluent E2B, optimisé pour les appareils en périphérie et ciblant le matériel mobile et les états de faible puissance ; et E4B, optimisé pour des appareils similaires mais avec une capacité plus élevée.
- Modèle de mélange d'experts avec 26 milliards de paramètres, conçu pour une utilisation à l'échelle des serveurs et actuellement classé sixième dans le tableau de classement Arena AI des modèles ouverts.
- Modèle dense avec 31 milliards de paramètres, classé troisième dans le même tableau de classement.
Google indique que les modèles 31B et 26B ont montré des performances 20 fois meilleures que d'autres modèles avec moins de paramètres dans le benchmark Arena AI. Ces affirmations de performance reposent sur les propres évaluations de Google au moment du lancement des modèles.
Capacités de la famille de modèles Gemma 4
Tous les quatre modèles Gemma 4 sont livrés avec un support multimodal natif pour des vidéos et des images à diverses résolutions ; la reconnaissance de caractères (OCR) et la compréhension graphique figurent parmi les principaux scénarios d'utilisation. Les modèles E2B et E4B incluent également une entrée vocale native pour la reconnaissance vocale.
Les longueurs de fenêtres contextuelles atteignent 128K tokens pour les modèles en périphérie et jusqu'à 256K tokens pour les modèles 26B et 31B. Tous les modèles prennent en charge l'appel de fonction, la sortie JSON structurée et les instructions système natives pour créer des flux de travail d'agents. Google indique que les modèles ont été formés nativement dans plus de 140 langues.
Transition de la licence Gemma propriétaire à Apache 2.0
Les versions précédentes des modèles Gemma utilisaient une licence propriétaire qui limitait les modifications et la redistribution. Gemma 4 utilise désormais la licence Apache 2.0, offrant des conditions standardisées pour l'utilisation commerciale, les modifications et la distribution, ce qui ne nécessite pas d'accord séparé avec Google. Google déclare que ce changement a rendu Gemma 4 plus adapté aux applications commerciales et de développement.
Tous les quatre modèles Gemma 4 sont désormais disponibles. Cependant, Google n'a pas fourni de calendrier sur le moment où les modèles en périphérie seront intégrés dans des produits matériels Android ou grand public.
Commentaires
(4 Commentaires)