Meta Llama 3.3 70B Instruct
Llama 3.3 70B est la version 70 milliards de paramètres de la famille Llama 3.3, atteignant des performances proches des meilleurs modèles propriétaires sur les benchmarks de raisonnement et de code. Il nécessite un GPU puissant ou une machine avec beaucoup de RAM pour tourner localement.
Caractéristiques principales
Variantes disponibles
| Quantization | Taille | RAM requise | VRAM requise | Vitesse | HuggingFace |
|---|---|---|---|---|---|
| Q4_K_M | 43 Go | 48 Go | 44 Go | ~6 tok/s | HuggingFace → |
| Q8_0 | 74 Go | 80 Go | 75 Go | ~3 tok/s | HuggingFace → |
Installation
Ollama
La méthode la plus simple pour lancer Meta Llama 3.3 70B Instruct en local.
ollama run llama3.3:70b Pas encore installé ? Voir le guide Ollama
LM Studio
Interface graphique pour exécuter Meta Llama 3.3 70B Instruct sans ligne de commande.
- Télécharger et ouvrir LM Studio
- Aller dans l'onglet Discover
- Rechercher Meta Llama 3.3 70B Instruct
- Sélectionner la variante souhaitée (Q4_K_M recommandé) et télécharger
- Charger le modèle et démarrer un chat
llama.cpp
Pour les utilisateurs avancés souhaitant un contrôle total sur l'inférence.
# Télécharger le modèle GGUF (exemple Q4_K_M)
huggingface-cli download \
meta-llama/Meta-Llama-3.3-70B-Instruct \
--include "*.Q4_K_M.gguf" \
--local-dir ./models/llama-3.3-70b Fichiers GGUF disponibles sur HuggingFace
Compatible avec votre machine ?
Scannez votre configuration matérielle pour savoir si Meta Llama 3.3 70B Instruct peut tourner sur votre ordinateur - RAM, VRAM, et vitesse estimée.