Google Gemma 2 27B Instruct
Gemma 2 27B est le grand modèle de la famille Gemma 2 de Google, atteignant des performances de niveau GPT-4 sur plusieurs benchmarks tout en restant disponible en open weights. Il représente l'état de l'art pour les modèles locaux en termes de compréhension et de génération de texte de haute qualité.
Caractéristiques principales
Variantes disponibles
| Quantization | Taille | RAM requise | VRAM requise | Vitesse | HuggingFace |
|---|---|---|---|---|---|
| Q4_K_M | 16.5 Go | 22 Go | 18 Go | ~12 tok/s | HuggingFace → |
| Q8_0 | 29 Go | 36 Go | 30 Go | ~7 tok/s | HuggingFace → |
Installation
Ollama
La méthode la plus simple pour lancer Google Gemma 2 27B Instruct en local.
ollama run gemma2:27b Pas encore installé ? Voir le guide Ollama
LM Studio
Interface graphique pour exécuter Google Gemma 2 27B Instruct sans ligne de commande.
- Télécharger et ouvrir LM Studio
- Aller dans l'onglet Discover
- Rechercher Google Gemma 2 27B Instruct
- Sélectionner la variante souhaitée (Q4_K_M recommandé) et télécharger
- Charger le modèle et démarrer un chat
llama.cpp
Pour les utilisateurs avancés souhaitant un contrôle total sur l'inférence.
# Télécharger le modèle GGUF (exemple Q4_K_M)
huggingface-cli download \
google/Google-Gemma-2-27B-Instruct \
--include "*.Q4_K_M.gguf" \
--local-dir ./models/gemma-2-27b Fichiers GGUF disponibles sur HuggingFace
Compatible avec votre machine ?
Scannez votre configuration matérielle pour savoir si Google Gemma 2 27B Instruct peut tourner sur votre ordinateur - RAM, VRAM, et vitesse estimée.