gemma 2B params Open Source

Google Gemma 2 2B Instruct

Chat Multilingue

Gemma 2 2B est le plus petit modèle de la famille Gemma 2 de Google, conçu pour fonctionner directement sur les appareils mobiles et les machines à faible puissance. Il surpasse la plupart des modèles de sa catégorie grâce à l'architecture Gemma 2 et ses mécanismes d'attention améliorés.

Caractéristiques principales

Paramètres 2B params
RAM min (Q4) 3 Go
Contexte 8K tokens
Famille gemma
Année 2024
Use cases Chat, Multilingue

Variantes disponibles

Quantization Taille RAM requise VRAM requise Vitesse HuggingFace
Q4_K_M 1.6 Go 3 Go 2 Go ~120 tok/s HuggingFace →
Q8_0 2.7 Go 5 Go 3 Go ~90 tok/s HuggingFace →

Installation

Ollama

La méthode la plus simple pour lancer Google Gemma 2 2B Instruct en local.

ollama run gemma2:2b

Pas encore installé ? Voir le guide Ollama

LM Studio

Interface graphique pour exécuter Google Gemma 2 2B Instruct sans ligne de commande.

  1. Télécharger et ouvrir LM Studio
  2. Aller dans l'onglet Discover
  3. Rechercher Google Gemma 2 2B Instruct
  4. Sélectionner la variante souhaitée (Q4_K_M recommandé) et télécharger
  5. Charger le modèle et démarrer un chat

Voir le guide LM Studio

llama.cpp

Pour les utilisateurs avancés souhaitant un contrôle total sur l'inférence.

# Télécharger le modèle GGUF (exemple Q4_K_M) huggingface-cli download \ google/Google-Gemma-2-2B-Instruct \ --include "*.Q4_K_M.gguf" \ --local-dir ./models/gemma-2-2b

Fichiers GGUF disponibles sur HuggingFace

Compatible avec votre machine ?

Scannez votre configuration matérielle pour savoir si Google Gemma 2 2B Instruct peut tourner sur votre ordinateur - RAM, VRAM, et vitesse estimée.

Scanner ma machine →

Modèles similaires