Moondream 2 est un modèle vision-langage ultra-compact de 1.8 milliards de paramètres, conçu pour tourner localement même sur des appareils à faibles ressources comme les Raspberry Pi. Malgré sa taille minimale, il parvient à décrire des images, répondre à des questions visuelles et lire du texte dans les images.

Caractéristiques principales

Paramètres 1.8B params

RAM min (Q4) 3 Go

Contexte 2K tokens

Famille moondream

Année 2024

Use cases Vision, Chat

Variantes disponibles

Quantization	Taille	RAM requise	VRAM requise	Vitesse	HuggingFace
Q4_K_M	1.2 Go	3 Go	2 Go	~55 tok/s	HuggingFace →

Installation

Ollama

La méthode la plus simple pour lancer Moondream 2 en local.

ollama run moondream:1.8b

Pas encore installé ? Voir le guide Ollama

LM Studio

Interface graphique pour exécuter Moondream 2 sans ligne de commande.

Télécharger et ouvrir LM Studio
Aller dans l'onglet Discover
Rechercher Moondream 2
Sélectionner la variante souhaitée (Q4_K_M recommandé) et télécharger
Charger le modèle et démarrer un chat

Voir le guide LM Studio

llama.cpp

Pour les utilisateurs avancés souhaitant un contrôle total sur l'inférence.

 # Télécharger le modèle GGUF (exemple Q4_K_M)
huggingface-cli download \
  vikhyatk/Moondream-2 \
  --include "*.Q4_K_M.gguf" \
  --local-dir ./models/moondream2 

Fichiers GGUF disponibles sur HuggingFace

Compatible avec votre machine ?

Scannez votre configuration matérielle pour savoir si Moondream 2 peut tourner sur votre ordinateur - RAM, VRAM, et vitesse estimée.

Scanner ma machine →

Caractéristiques principales

Variantes disponibles

Installation

Ollama

LM Studio

llama.cpp

Compatible avec votre machine ?

Modèles similaires

Meta Llama 3.1 8B Instruct

Meta Llama 3.3 70B Instruct

Meta Llama 3.2 3B Instruct

Meta Llama 3.2 1B Instruct