Gemma 2 2B est le plus petit modèle de la famille Gemma 2 de Google, conçu pour fonctionner directement sur les appareils mobiles et les machines à faible puissance. Il surpasse la plupart des modèles de sa catégorie grâce à l'architecture Gemma 2 et ses mécanismes d'attention améliorés.

Caractéristiques principales

Paramètres 2B params

RAM min (Q4) 3 Go

Contexte 8K tokens

Famille gemma

Année 2024

Use cases Chat, Multilingue

Variantes disponibles

Quantization	Taille	RAM requise	VRAM requise	Vitesse	HuggingFace
Q4_K_M	1.6 Go	3 Go	2 Go	~120 tok/s	HuggingFace →
Q8_0	2.7 Go	5 Go	3 Go	~90 tok/s	HuggingFace →

Installation

Ollama

La méthode la plus simple pour lancer Google Gemma 2 2B Instruct en local.

ollama run gemma2:2b

Pas encore installé ? Voir le guide Ollama

LM Studio

Interface graphique pour exécuter Google Gemma 2 2B Instruct sans ligne de commande.

Télécharger et ouvrir LM Studio
Aller dans l'onglet Discover
Rechercher Google Gemma 2 2B Instruct
Sélectionner la variante souhaitée (Q4_K_M recommandé) et télécharger
Charger le modèle et démarrer un chat

Voir le guide LM Studio

llama.cpp

Pour les utilisateurs avancés souhaitant un contrôle total sur l'inférence.

 # Télécharger le modèle GGUF (exemple Q4_K_M)
huggingface-cli download \
  google/Google-Gemma-2-2B-Instruct \
  --include "*.Q4_K_M.gguf" \
  --local-dir ./models/gemma-2-2b 

Fichiers GGUF disponibles sur HuggingFace

Compatible avec votre machine ?

Scannez votre configuration matérielle pour savoir si Google Gemma 2 2B Instruct peut tourner sur votre ordinateur - RAM, VRAM, et vitesse estimée.

Scanner ma machine →

Caractéristiques principales

Variantes disponibles

Installation

Ollama

LM Studio

llama.cpp

Compatible avec votre machine ?

Modèles similaires

Meta Llama 3.1 8B Instruct

Meta Llama 3.3 70B Instruct

Meta Llama 3.2 3B Instruct

Meta Llama 3.2 1B Instruct