Alibaba Qwen 2.5 72B Instruct
Qwen 2.5 72B est le grand modèle phare d'Alibaba, avec 72 milliards de paramètres et des performances comparables aux meilleurs modèles propriétaires sur les benchmarks de code, mathématiques et raisonnement. Il supporte jusqu'à 128K tokens de contexte et est particulièrement fort sur les langues asiatiques.
Caractéristiques principales
Variantes disponibles
| Quantization | Taille | RAM requise | VRAM requise | Vitesse | HuggingFace |
|---|---|---|---|---|---|
| Q4_K_M | 44 Go | 50 Go | 45 Go | ~5 tok/s | HuggingFace → |
| Q8_0 | 77 Go | 84 Go | 78 Go | ~3 tok/s | HuggingFace → |
Installation
Ollama
La méthode la plus simple pour lancer Alibaba Qwen 2.5 72B Instruct en local.
ollama run qwen2.5:72b Pas encore installé ? Voir le guide Ollama
LM Studio
Interface graphique pour exécuter Alibaba Qwen 2.5 72B Instruct sans ligne de commande.
- Télécharger et ouvrir LM Studio
- Aller dans l'onglet Discover
- Rechercher Alibaba Qwen 2.5 72B Instruct
- Sélectionner la variante souhaitée (Q4_K_M recommandé) et télécharger
- Charger le modèle et démarrer un chat
llama.cpp
Pour les utilisateurs avancés souhaitant un contrôle total sur l'inférence.
# Télécharger le modèle GGUF (exemple Q4_K_M)
huggingface-cli download \
Qwen/Alibaba-Qwen-2.5-72B-Instruct \
--include "*.Q4_K_M.gguf" \
--local-dir ./models/qwen-2.5-72b Fichiers GGUF disponibles sur HuggingFace
Compatible avec votre machine ?
Scannez votre configuration matérielle pour savoir si Alibaba Qwen 2.5 72B Instruct peut tourner sur votre ordinateur - RAM, VRAM, et vitesse estimée.