Quatre modèles, zéro abonnement, zéro connexion requise. Google vient de publier Gemma 4, une famille d’intelligences artificielles conçue pour tourner localement, du smartphone Android au Raspberry Pi. Le changement le plus radical ne concerne pas la puissance de calcul : pour la première fois, Google abandonne sa licence propriétaire et distribue ses modèles sous Apache 2.0, la même licence que des projets comme Android ou WordPress. N’importe qui peut les télécharger, les modifier, les revendre. Gratuitement.
Un ChatGPT dans la poche, sans envoyer vos données
Jusqu’ici, utiliser une IA performante impliquait de passer par les serveurs d’OpenAI, de Google ou d’Anthropic. Chaque question, chaque document, chaque conversation transite par leurs infrastructures. Avec Gemma 4, le traitement se fait entièrement sur l’appareil. Aucune donnée ne quitte votre téléphone ou votre ordinateur.
Les deux modèles compacts, baptisés E2B (2 milliards de paramètres effectifs) et E4B (4 milliards), ont été optimisés avec les équipes Pixel de Google, Qualcomm et MediaTek pour fonctionner sur des appareils mobiles. Selon Google, la latence est « quasi nulle ». Les deux modèles gèrent le texte, la vision (reconnaissance d’images, lecture de documents) et la reconnaissance vocale dans plus de 140 langues, le tout hors ligne.
Pour les machines plus puissantes, deux modèles plus gros complètent la gamme. Le 26B Mixture of Experts (MoE) n’active que 3,8 milliards de paramètres à la fois sur ses 26 milliards, ce qui le rend rapide malgré sa taille. Le 31B Dense, lui, mise sur la qualité brute. Les deux tiennent sur une carte graphique de joueur après quantification et traitent des fenêtres de contexte de 256 000 tokens, soit l’équivalent d’un roman de 500 pages en une seule requête.
N°3 mondial, et 20 fois plus petit que ses rivaux
Sur le classement Arena AI, référence du secteur pour comparer les modèles d’IA, Gemma 4 31B se classe troisième parmi les modèles ouverts, derrière GLM-5 et Kimi 2.5. La différence : ces deux rivaux sont 20 fois plus volumineux. Ars Technica souligne que Gemma 4 offre un rapport performance/taille inédit, ce qui le rend infiniment moins coûteux à faire tourner.
Côté fonctionnalités, la version 4 marque un bond par rapport à Gemma 3, sortie il y a un an. Les modèles gèrent nativement l’appel de fonctions, les sorties structurées en JSON et les instructions système, trois briques essentielles pour construire des agents autonomes capables d’interagir avec des outils et des API. La génération de code s’améliore aussi : Google promet un assistant de programmation « local-first » capable de rivaliser avec Claude Code ou Gemini Pro, mais sans payer d’abonnement.
Pourquoi le passage à Apache 2.0 change tout
Les versions précédentes de Gemma étaient distribuées sous une licence maison que beaucoup de développeurs jugeaient trop restrictive. Google se réservait le droit de modifier les conditions d’utilisation unilatéralement, imposait une liste d’usages interdits, et obligeait quiconque créait un produit dérivé à appliquer les mêmes restrictions. ZDNet rapporte que cette licence pouvait même s’étendre aux modèles entraînés sur des données synthétiques générées par Gemma, un point qui avait refroidi une partie de la communauté.
Avec Apache 2.0, ces contraintes disparaissent. La licence autorise tout usage, commercial ou personnel, sans redevance. Elle permet la modification, la redistribution et la création de produits dérivés sans restriction. Elle inclut aussi une protection contre les brevets : quiconque utilise le logiciel reçoit automatiquement une licence sur les brevets associés. En contrepartie, si vous poursuivez un utilisateur en invoquant un brevet couvert par la licence, vous perdez votre droit d’utilisation.
Ce virage aligne Google sur Meta (dont Llama est sous licence communautaire permissive) et Mistral (Apache 2.0 également). Pour les entreprises soumises à des contraintes de souveraineté des données, comme les hôpitaux ou les administrations, c’est une étape décisive : elles peuvent déployer un modèle puissant en interne sans qu’aucune information ne transite par les serveurs de Google.
La course à l’IA privée et souveraine
Le calendrier n’est pas anodin. L’IA Act européen, en application depuis février 2026, impose des obligations de transparence et de traçabilité pour les systèmes d’IA à haut risque. Faire tourner un modèle localement simplifie drastiquement la conformité : les données restent sur site, l’infrastructure est maîtrisée, les flux sont traçables de bout en bout.
C’est aussi une réponse aux inquiétudes croissantes des utilisateurs. Un sondage Fox News publié le 1er avril indique que 62 % des Américains expriment de l’anxiété face à l’IA, la question de la vie privée arrivant en tête des préoccupations. Offrir une IA capable de fonctionner sans connexion et sans envoyer de données à un tiers répond frontalement à cette angoisse.
Google n’est pas le seul à parier sur l’IA locale. Apple Intelligence, intégrée aux iPhone et Mac depuis 2024, traite certaines tâches directement sur l’appareil. Mais les modèles d’Apple ne sont ni téléchargeables, ni modifiables, ni utilisables en dehors de l’écosystème Apple. Gemma 4 vise précisément ce vide : un modèle de pointe, gratuit, ouvert et utilisable partout.
Comment l’essayer dès maintenant
Les modèles 31B et 26B MoE sont accessibles via Google AI Studio en ligne. Les versions compactes E4B et E2B se téléchargent dans l’application Google AI Edge Gallery sur Android. Pour une installation locale sur PC, les poids sont disponibles sur Hugging Face, Kaggle et Ollama. Aucun compte Google requis pour les poids, un simple téléchargement suffit.
Reste une question de taille : si Google offre gratuitement un modèle de ce niveau, c’est aussi parce que l’IA embarquée nourrit son écosystème matériel et logiciel. Gemma 4 tourne de manière optimale sur les puces des partenaires de Google (Qualcomm, MediaTek) et sur ses propres TPU dans le cloud. L’IA gratuite n’est jamais tout à fait désintéressée. Mais pour l’utilisateur, le résultat est là : une IA performante, privée et locale, sans sortir la carte bleue.