qwen 72B params Open Source

Alibaba Qwen 2.5 72B Instruct

Chat Code Raisonnement Multilingue

Qwen 2.5 72B est le grand modèle phare d'Alibaba, avec 72 milliards de paramètres et des performances comparables aux meilleurs modèles propriétaires sur les benchmarks de code, mathématiques et raisonnement. Il supporte jusqu'à 128K tokens de contexte et est particulièrement fort sur les langues asiatiques.

Caractéristiques principales

Paramètres 72B params

RAM min (Q4) 50 Go

Contexte 128K tokens

Famille qwen

Année 2024

Use cases Chat, Code, Raisonnement, Multilingue

Variantes disponibles

Quantization	Taille	RAM requise	VRAM requise	Vitesse	HuggingFace
Q4_K_M	44 Go	50 Go	45 Go	~5 tok/s	HuggingFace →
Q8_0	77 Go	84 Go	78 Go	~3 tok/s	HuggingFace →

Installation

Ollama

La méthode la plus simple pour lancer Alibaba Qwen 2.5 72B Instruct en local.

ollama run qwen2.5:72b

Pas encore installé ? Voir le guide Ollama

LM Studio

Interface graphique pour exécuter Alibaba Qwen 2.5 72B Instruct sans ligne de commande.

Télécharger et ouvrir LM Studio
Aller dans l'onglet Discover
Rechercher Alibaba Qwen 2.5 72B Instruct
Sélectionner la variante souhaitée (Q4_K_M recommandé) et télécharger
Charger le modèle et démarrer un chat

Voir le guide LM Studio

llama.cpp

Pour les utilisateurs avancés souhaitant un contrôle total sur l'inférence.

 # Télécharger le modèle GGUF (exemple Q4_K_M)
huggingface-cli download \
  Qwen/Alibaba-Qwen-2.5-72B-Instruct \
  --include "*.Q4_K_M.gguf" \
  --local-dir ./models/qwen-2.5-72b 

Fichiers GGUF disponibles sur HuggingFace

Compatible avec votre machine ?

Scannez votre configuration matérielle pour savoir si Alibaba Qwen 2.5 72B Instruct peut tourner sur votre ordinateur - RAM, VRAM, et vitesse estimée.

Scanner ma machine →

Caractéristiques principales

Variantes disponibles

Installation

Ollama

LM Studio

llama.cpp

Compatible avec votre machine ?

Modèles similaires

Meta Llama 3.1 8B Instruct

Meta Llama 3.3 70B Instruct

Meta Llama 3.2 3B Instruct

Meta Llama 3.2 1B Instruct