codellama 13B params Open Source

Meta CodeLlama 13B Instruct

Code

CodeLlama 13B est le modèle de génération de code de Meta basé sur Llama 2, spécialisé dans la complétion, la génération et le débogage de code dans de nombreux langages de programmation. Il intègre un mode fill-in-the-middle (FIM) et supporte une fenêtre de contexte étendue de 100K tokens pour l'analyse de fichiers entiers.

Caractéristiques principales

Paramètres 13B params
RAM min (Q4) 11 Go
Contexte 100K tokens
Famille codellama
Année 2023
Use cases Code

Variantes disponibles

Quantization Taille RAM requise VRAM requise Vitesse HuggingFace
Q4_K_M 7.9 Go 11 Go 9 Go ~25 tok/s HuggingFace →
Q8_0 13.8 Go 18 Go 15 Go ~15 tok/s HuggingFace →

Installation

Ollama

La méthode la plus simple pour lancer Meta CodeLlama 13B Instruct en local.

ollama run codellama:13b

Pas encore installé ? Voir le guide Ollama

LM Studio

Interface graphique pour exécuter Meta CodeLlama 13B Instruct sans ligne de commande.

  1. Télécharger et ouvrir LM Studio
  2. Aller dans l'onglet Discover
  3. Rechercher Meta CodeLlama 13B Instruct
  4. Sélectionner la variante souhaitée (Q4_K_M recommandé) et télécharger
  5. Charger le modèle et démarrer un chat

Voir le guide LM Studio

llama.cpp

Pour les utilisateurs avancés souhaitant un contrôle total sur l'inférence.

# Télécharger le modèle GGUF (exemple Q4_K_M) huggingface-cli download \ meta-llama/Meta-CodeLlama-13B-Instruct \ --include "*.Q4_K_M.gguf" \ --local-dir ./models/codellama-13b

Fichiers GGUF disponibles sur HuggingFace

Compatible avec votre machine ?

Scannez votre configuration matérielle pour savoir si Meta CodeLlama 13B Instruct peut tourner sur votre ordinateur - RAM, VRAM, et vitesse estimée.

Scanner ma machine →

Modèles similaires