llama 1B params Open Source

Meta Llama 3.2 1B Instruct

Chat

Llama 3.2 1B est le plus petit modèle de la famille Llama 3.2, optimisé pour les appareils embarqués, les mobiles et les environnements à très faibles ressources. Malgré sa taille réduite, il reste capable d'effectuer des tâches simples de chat et de complétion.

Caractéristiques principales

Paramètres 1B params
RAM min (Q4) 2 Go
Contexte 128K tokens
Famille llama
Année 2024
Use cases Chat

Variantes disponibles

Quantization Taille RAM requise VRAM requise Vitesse HuggingFace
Q4_K_M 0.7 Go 2 Go 1 Go ~180 tok/s HuggingFace →
Q8_0 1.3 Go 3 Go 2 Go ~145 tok/s HuggingFace →

Installation

Ollama

La méthode la plus simple pour lancer Meta Llama 3.2 1B Instruct en local.

ollama run llama3.2:1b

Pas encore installé ? Voir le guide Ollama

LM Studio

Interface graphique pour exécuter Meta Llama 3.2 1B Instruct sans ligne de commande.

  1. Télécharger et ouvrir LM Studio
  2. Aller dans l'onglet Discover
  3. Rechercher Meta Llama 3.2 1B Instruct
  4. Sélectionner la variante souhaitée (Q4_K_M recommandé) et télécharger
  5. Charger le modèle et démarrer un chat

Voir le guide LM Studio

llama.cpp

Pour les utilisateurs avancés souhaitant un contrôle total sur l'inférence.

# Télécharger le modèle GGUF (exemple Q4_K_M) huggingface-cli download \ meta-llama/Meta-Llama-3.2-1B-Instruct \ --include "*.Q4_K_M.gguf" \ --local-dir ./models/llama-3.2-1b

Fichiers GGUF disponibles sur HuggingFace

Compatible avec votre machine ?

Scannez votre configuration matérielle pour savoir si Meta Llama 3.2 1B Instruct peut tourner sur votre ordinateur - RAM, VRAM, et vitesse estimée.

Scanner ma machine →

Modèles similaires