Gemma 2 9B est le modèle de taille moyenne de la famille Gemma 2 de Google, offrant des performances remarquables pour un modèle sous 10 milliards de paramètres. Il rivalise avec des modèles bien plus grands sur les benchmarks de raisonnement et de compréhension du langage.

Caractéristiques principales

Paramètres 9B params

RAM min (Q4) 8 Go

Contexte 8K tokens

Famille gemma

Année 2024

Use cases Chat, Code, Multilingue

Variantes disponibles

Quantization	Taille	RAM requise	VRAM requise	Vitesse	HuggingFace
Q4_K_M	5.8 Go	8 Go	6 Go	~38 tok/s	HuggingFace →
Q8_0	9.8 Go	13 Go	10 Go	~24 tok/s	HuggingFace →

Installation

Ollama

La méthode la plus simple pour lancer Google Gemma 2 9B Instruct en local.

ollama run gemma2:9b

Pas encore installé ? Voir le guide Ollama

LM Studio

Interface graphique pour exécuter Google Gemma 2 9B Instruct sans ligne de commande.

Télécharger et ouvrir LM Studio
Aller dans l'onglet Discover
Rechercher Google Gemma 2 9B Instruct
Sélectionner la variante souhaitée (Q4_K_M recommandé) et télécharger
Charger le modèle et démarrer un chat

Voir le guide LM Studio

llama.cpp

Pour les utilisateurs avancés souhaitant un contrôle total sur l'inférence.

 # Télécharger le modèle GGUF (exemple Q4_K_M)
huggingface-cli download \
  google/Google-Gemma-2-9B-Instruct \
  --include "*.Q4_K_M.gguf" \
  --local-dir ./models/gemma-2-9b 

Fichiers GGUF disponibles sur HuggingFace

Compatible avec votre machine ?

Scannez votre configuration matérielle pour savoir si Google Gemma 2 9B Instruct peut tourner sur votre ordinateur - RAM, VRAM, et vitesse estimée.

Scanner ma machine →

Caractéristiques principales

Variantes disponibles

Installation

Ollama

LM Studio

llama.cpp

Compatible avec votre machine ?

Modèles similaires

Meta Llama 3.1 8B Instruct

Meta Llama 3.3 70B Instruct

Meta Llama 3.2 3B Instruct

Meta Llama 3.2 1B Instruct