Setup débutant
Apprenez à installer Ollama sur macOS et Windows pour faire tourner des LLMs en local, sans cloud et sans API payante. Guide complet avec captures d'écran et résolution des problèmes courants.
Setup débutant
LM Studio est l'application la plus facile pour faire tourner des LLMs en local. Ce guide vous explique comment l'installer, télécharger des modèles depuis HuggingFace et utiliser le serveur local compatible OpenAI.
Modèles intermédiaire
Le format GGUF propose de nombreuses variantes de quantisation qui impactent la taille, la vitesse et la qualité des LLMs. Ce guide explique les différences entre Q4_K_M, Q5_K_S, Q8_0 et les autres pour vous aider à choisir la meilleure option selon votre matériel.
Matériel intermédiaire
Guide complet pour configurer votre GPU NVIDIA avec CUDA afin d'accélérer l'inférence de LLMs en local. Installation des drivers, CUDA toolkit, et optimisation pour Ollama, llama.cpp et autres outils.
Setup intermédiaire
llama.cpp est le moteur d'inférence de référence pour les LLMs locaux. Ce guide couvre la compilation depuis les sources avec support GPU, l'utilisation en ligne de commande et le démarrage d'un serveur HTTP compatible OpenAI.
Développement avancé
Apprenez à construire un système RAG (Retrieval-Augmented Generation) entièrement local avec Ollama pour l'inférence, ChromaDB pour le stockage vectoriel et LangChain pour l'orchestration. Aucune API externe requise.
Modèles débutant
Comparatif complet des meilleurs LLMs open source disponibles en local en 2025 : Llama 3.2, Mistral 7B, Gemma 2, Qwen 2.5 et Phi-3. Quel modèle choisir selon votre usage, votre matériel et vos exigences ?
Modèles intermédiaire
DeepSeek R1 est un modèle de raisonnement qui rivalise avec o1 d'OpenAI. Apprenez à faire tourner ses versions distillées en local avec Ollama ou llama.cpp, et à exploiter ses capacités de chain-of-thought.
Matériel débutant
Quel GPU choisir pour faire tourner des LLMs en local en 2025 ? Comparatif complet des cartes NVIDIA RTX et AMD Radeon, recommandations selon votre budget et guide pour maximiser la VRAM disponible.
Matériel débutant
Les Mac avec puce Apple Silicon (M1 à M4) sont d'excellentes machines pour les LLMs locaux grâce à leur mémoire unifiée. Ce guide vous aide à choisir les meilleurs modèles et paramètres pour chaque configuration.
Setup intermédiaire
Open WebUI est la meilleure interface graphique open source pour Ollama. Ce guide vous montre comment l'installer avec Docker, le connecter à vos modèles locaux et profiter de fonctionnalités avancées comme le RAG, les outils et le multi-modèle.
Prompting débutant
Le prompt engineering est la clé pour tirer le meilleur de vos LLMs locaux. Ce guide présente 10 techniques concrètes avec exemples pour améliorer immédiatement la qualité des réponses.
Développement avancé
Le fine-tuning LoRA permet d'adapter un LLM open source à votre domaine ou style spécifique avec une seule GPU grand public. Ce guide couvre la préparation des données, l'entraînement avec Unsloth, et la fusion du LoRA adapter.
Matériel avancé
Montez votre propre serveur LLM maison avec Ubuntu Server, Ollama et un reverse proxy sécurisé. Guide complet du choix du matériel à l'exposition sécurisée sur internet avec authentification.
Développement intermédiaire
Les embeddings sont la brique fondamentale des applications RAG et de recherche sémantique. Ce guide explique comment générer des embeddings locaux avec Ollama et les modèles nomic-embed-text et mxbai-embed-large, et comment les utiliser avec Python.