Google Gemma 2 9B Instruct
Gemma 2 9B est le modèle de taille moyenne de la famille Gemma 2 de Google, offrant des performances remarquables pour un modèle sous 10 milliards de paramètres. Il rivalise avec des modèles bien plus grands sur les benchmarks de raisonnement et de compréhension du langage.
Caractéristiques principales
Variantes disponibles
| Quantization | Taille | RAM requise | VRAM requise | Vitesse | HuggingFace |
|---|---|---|---|---|---|
| Q4_K_M | 5.8 Go | 8 Go | 6 Go | ~38 tok/s | HuggingFace → |
| Q8_0 | 9.8 Go | 13 Go | 10 Go | ~24 tok/s | HuggingFace → |
Installation
Ollama
La méthode la plus simple pour lancer Google Gemma 2 9B Instruct en local.
ollama run gemma2:9b Pas encore installé ? Voir le guide Ollama
LM Studio
Interface graphique pour exécuter Google Gemma 2 9B Instruct sans ligne de commande.
- Télécharger et ouvrir LM Studio
- Aller dans l'onglet Discover
- Rechercher Google Gemma 2 9B Instruct
- Sélectionner la variante souhaitée (Q4_K_M recommandé) et télécharger
- Charger le modèle et démarrer un chat
llama.cpp
Pour les utilisateurs avancés souhaitant un contrôle total sur l'inférence.
# Télécharger le modèle GGUF (exemple Q4_K_M)
huggingface-cli download \
google/Google-Gemma-2-9B-Instruct \
--include "*.Q4_K_M.gguf" \
--local-dir ./models/gemma-2-9b Fichiers GGUF disponibles sur HuggingFace
Compatible avec votre machine ?
Scannez votre configuration matérielle pour savoir si Google Gemma 2 9B Instruct peut tourner sur votre ordinateur - RAM, VRAM, et vitesse estimée.