deepseek-coder 16B params Open Source

DeepSeek Coder V2 16B Instruct

Code Chat

DeepSeek Coder V2 16B est un modèle spécialisé en programmation de DeepSeek, basé sur une architecture MoE avec 16 milliards de paramètres actifs et supportant 338 langages de programmation. Il surpasse GPT-4 Turbo sur plusieurs benchmarks de code et offre une fenêtre de contexte de 128K tokens.

Caractéristiques principales

Paramètres 16B params
RAM min (Q4) 14 Go
Contexte 128K tokens
Famille deepseek-coder
Année 2024
Use cases Code, Chat

Variantes disponibles

Quantization Taille RAM requise VRAM requise Vitesse HuggingFace
Q4_K_M 10.5 Go 14 Go 11 Go ~19 tok/s HuggingFace →
Q8_0 18 Go 23 Go 19 Go ~11 tok/s HuggingFace →

Installation

Ollama

La méthode la plus simple pour lancer DeepSeek Coder V2 16B Instruct en local.

ollama run deepseek-coder-v2:16b

Pas encore installé ? Voir le guide Ollama

LM Studio

Interface graphique pour exécuter DeepSeek Coder V2 16B Instruct sans ligne de commande.

  1. Télécharger et ouvrir LM Studio
  2. Aller dans l'onglet Discover
  3. Rechercher DeepSeek Coder V2 16B Instruct
  4. Sélectionner la variante souhaitée (Q4_K_M recommandé) et télécharger
  5. Charger le modèle et démarrer un chat

Voir le guide LM Studio

llama.cpp

Pour les utilisateurs avancés souhaitant un contrôle total sur l'inférence.

# Télécharger le modèle GGUF (exemple Q4_K_M) huggingface-cli download \ deepseek-ai/DeepSeek-Coder-V2-16B-Instruct \ --include "*.Q4_K_M.gguf" \ --local-dir ./models/deepseek-coder-v2-16b

Fichiers GGUF disponibles sur HuggingFace

Compatible avec votre machine ?

Scannez votre configuration matérielle pour savoir si DeepSeek Coder V2 16B Instruct peut tourner sur votre ordinateur - RAM, VRAM, et vitesse estimée.

Scanner ma machine →

Modèles similaires