Débutant Inférence O

Ollama

Outil en ligne de commande permettant de télécharger et d'exécuter des LLM localement en une seule commande.

Définition complète

Ollama est un outil open-source qui simplifie radicalement l'utilisation de LLM en local : une seule commande (`ollama run llama3`) suffit pour télécharger et lancer un modèle. Il gère automatiquement les téléchargements, la sélection du format optimal, l'accélération GPU (CUDA, Metal) et expose un serveur REST compatible API OpenAI sur le port 11434. Ollama supporte des dizaines de modèles : Llama 3, Mistral, Gemma, Phi, DeepSeek, Qwen et bien d'autres. Son modèle de distribution utilise un format propriétaire basé sur GGUF. Des interfaces comme Open WebUI ou Msty se greffent sur Ollama pour offrir une interface chat. Ollama est disponible pour macOS, Linux et Windows, avec une installation en quelques minutes.

Définition complète

Termes associés