qwen 14B params Open Source

Alibaba Qwen 2.5 14B Instruct

Chat Code Raisonnement Multilingue

Qwen 2.5 14B est le modèle intermédiaire de la famille Qwen 2.5 d'Alibaba, avec 14 milliards de paramètres et un support de 128K tokens de contexte. Il offre des performances de très haut niveau en code, mathématiques et tâches multilingues, rivalisant avec des modèles deux fois plus grands.

Caractéristiques principales

Paramètres 14B params
RAM min (Q4) 13 Go
Contexte 128K tokens
Famille qwen
Année 2024
Use cases Chat, Code, Raisonnement, Multilingue

Variantes disponibles

Quantization Taille RAM requise VRAM requise Vitesse HuggingFace
Q4_K_M 9 Go 13 Go 10 Go ~22 tok/s HuggingFace →
Q8_0 15.7 Go 20 Go 17 Go ~13 tok/s HuggingFace →

Installation

Ollama

La méthode la plus simple pour lancer Alibaba Qwen 2.5 14B Instruct en local.

ollama run qwen2.5:14b

Pas encore installé ? Voir le guide Ollama

LM Studio

Interface graphique pour exécuter Alibaba Qwen 2.5 14B Instruct sans ligne de commande.

  1. Télécharger et ouvrir LM Studio
  2. Aller dans l'onglet Discover
  3. Rechercher Alibaba Qwen 2.5 14B Instruct
  4. Sélectionner la variante souhaitée (Q4_K_M recommandé) et télécharger
  5. Charger le modèle et démarrer un chat

Voir le guide LM Studio

llama.cpp

Pour les utilisateurs avancés souhaitant un contrôle total sur l'inférence.

# Télécharger le modèle GGUF (exemple Q4_K_M) huggingface-cli download \ Qwen/Alibaba-Qwen-2.5-14B-Instruct \ --include "*.Q4_K_M.gguf" \ --local-dir ./models/qwen-2.5-14b

Fichiers GGUF disponibles sur HuggingFace

Compatible avec votre machine ?

Scannez votre configuration matérielle pour savoir si Alibaba Qwen 2.5 14B Instruct peut tourner sur votre ordinateur - RAM, VRAM, et vitesse estimée.

Scanner ma machine →

Modèles similaires