moondream 1.8B params Open Source

Moondream 2

Vision Chat

Moondream 2 est un modèle vision-langage ultra-compact de 1.8 milliards de paramètres, conçu pour tourner localement même sur des appareils à faibles ressources comme les Raspberry Pi. Malgré sa taille minimale, il parvient à décrire des images, répondre à des questions visuelles et lire du texte dans les images.

Caractéristiques principales

Paramètres 1.8B params
RAM min (Q4) 3 Go
Contexte 2K tokens
Famille moondream
Année 2024
Use cases Vision, Chat

Variantes disponibles

Quantization Taille RAM requise VRAM requise Vitesse HuggingFace
Q4_K_M 1.2 Go 3 Go 2 Go ~55 tok/s HuggingFace →

Installation

Ollama

La méthode la plus simple pour lancer Moondream 2 en local.

ollama run moondream:1.8b

Pas encore installé ? Voir le guide Ollama

LM Studio

Interface graphique pour exécuter Moondream 2 sans ligne de commande.

  1. Télécharger et ouvrir LM Studio
  2. Aller dans l'onglet Discover
  3. Rechercher Moondream 2
  4. Sélectionner la variante souhaitée (Q4_K_M recommandé) et télécharger
  5. Charger le modèle et démarrer un chat

Voir le guide LM Studio

llama.cpp

Pour les utilisateurs avancés souhaitant un contrôle total sur l'inférence.

# Télécharger le modèle GGUF (exemple Q4_K_M) huggingface-cli download \ vikhyatk/Moondream-2 \ --include "*.Q4_K_M.gguf" \ --local-dir ./models/moondream2

Fichiers GGUF disponibles sur HuggingFace

Compatible avec votre machine ?

Scannez votre configuration matérielle pour savoir si Moondream 2 peut tourner sur votre ordinateur - RAM, VRAM, et vitesse estimée.

Scanner ma machine →

Modèles similaires