Google Gemma 2 2B Instruct
Gemma 2 2B est le plus petit modèle de la famille Gemma 2 de Google, conçu pour fonctionner directement sur les appareils mobiles et les machines à faible puissance. Il surpasse la plupart des modèles de sa catégorie grâce à l'architecture Gemma 2 et ses mécanismes d'attention améliorés.
Caractéristiques principales
Variantes disponibles
| Quantization | Taille | RAM requise | VRAM requise | Vitesse | HuggingFace |
|---|---|---|---|---|---|
| Q4_K_M | 1.6 Go | 3 Go | 2 Go | ~120 tok/s | HuggingFace → |
| Q8_0 | 2.7 Go | 5 Go | 3 Go | ~90 tok/s | HuggingFace → |
Installation
Ollama
La méthode la plus simple pour lancer Google Gemma 2 2B Instruct en local.
ollama run gemma2:2b Pas encore installé ? Voir le guide Ollama
LM Studio
Interface graphique pour exécuter Google Gemma 2 2B Instruct sans ligne de commande.
- Télécharger et ouvrir LM Studio
- Aller dans l'onglet Discover
- Rechercher Google Gemma 2 2B Instruct
- Sélectionner la variante souhaitée (Q4_K_M recommandé) et télécharger
- Charger le modèle et démarrer un chat
llama.cpp
Pour les utilisateurs avancés souhaitant un contrôle total sur l'inférence.
# Télécharger le modèle GGUF (exemple Q4_K_M)
huggingface-cli download \
google/Google-Gemma-2-2B-Instruct \
--include "*.Q4_K_M.gguf" \
--local-dir ./models/gemma-2-2b Fichiers GGUF disponibles sur HuggingFace
Compatible avec votre machine ?
Scannez votre configuration matérielle pour savoir si Google Gemma 2 2B Instruct peut tourner sur votre ordinateur - RAM, VRAM, et vitesse estimée.