Tutoriels LLM - Guides pratiques en français

Apprenez LLM pas à pas avec nos guides pratiques en français : installation, choix des modèles, configuration matérielle, prompt engineering et développement d'applications. Du débutant à l'avancé.

15 tutoriels

100% en français

Mis à jour Juin 2025

15 tutoriels affichés

Tutoriels à la une

Setup débutant

Comment installer Ollama sur Mac et Windows

Le guide pas-à-pas pour démarrer avec les LLMs en local

Apprenez à installer Ollama sur macOS et Windows pour faire tourner des LLMs en local, sans cloud et sans API payante. Guide complet avec captures d'écran et résolution des problèmes courants.

8 min Lire le guide →

Setup débutant

LM Studio : guide complet pour débutants

Télécharger, installer et utiliser LM Studio pour faire tourner des LLMs en local avec une interface graphique

LM Studio est l'application la plus facile pour faire tourner des LLMs en local. Ce guide vous explique comment l'installer, télécharger des modèles depuis HuggingFace et utiliser le serveur local compatible OpenAI.

10 min Lire le guide →

Modèles intermédiaire

Quelle quantisation GGUF choisir ? Guide complet

Comprendre Q4_K_M, Q8_0, Q5_K_S et toutes les variantes pour choisir le bon compromis

Le format GGUF propose de nombreuses variantes de quantisation qui impactent la taille, la vitesse et la qualité des LLMs. Ce guide explique les différences entre Q4_K_M, Q5_K_S, Q8_0 et les autres pour vous aider à choisir la meilleure option selon votre matériel.

12 min Lire le guide →

Modèles débutant

Comparer les LLMs locaux : lequel choisir en 2025 ?

Analyse comparative de Llama 3, Mistral, Gemma, Qwen et Phi pour différents usages

Comparatif complet des meilleurs LLMs open source disponibles en local en 2025 : Llama 3.2, Mistral 7B, Gemma 2, Qwen 2.5 et Phi-3. Quel modèle choisir selon votre usage, votre matériel et vos exigences ?

11 min Lire le guide →

Modèles intermédiaire

Faire tourner DeepSeek R1 en local

Installation et utilisation de DeepSeek R1 et ses distillations locales pour le raisonnement avancé

DeepSeek R1 est un modèle de raisonnement qui rivalise avec o1 d'OpenAI. Apprenez à faire tourner ses versions distillées en local avec Ollama ou llama.cpp, et à exploiter ses capacités de chain-of-thought.

13 min Lire le guide →

Matériel débutant

Quel GPU acheter pour faire tourner des LLMs en local ?

Guide d'achat 2025 : RTX 4060 vs 4070 vs 4090, AMD RX 7900 XTX, comparatif et recommandations

Quel GPU choisir pour faire tourner des LLMs en local en 2025 ? Comparatif complet des cartes NVIDIA RTX et AMD Radeon, recommandations selon votre budget et guide pour maximiser la VRAM disponible.

12 min Lire le guide →

Tous les tutoriels

Setup débutant

Comment installer Ollama sur Mac et Windows

Apprenez à installer Ollama sur macOS et Windows pour faire tourner des LLMs en local, sans cloud et sans API payante. Guide complet avec captures d'écran et résolution des problèmes courants.

Setup débutant

LM Studio : guide complet pour débutants

Modèles intermédiaire

Quelle quantisation GGUF choisir ? Guide complet

Matériel intermédiaire

Configurer son GPU NVIDIA pour les LLMs (CUDA)

Guide complet pour configurer votre GPU NVIDIA avec CUDA afin d'accélérer l'inférence de LLMs en local. Installation des drivers, CUDA toolkit, et optimisation pour Ollama, llama.cpp et autres outils.

Setup intermédiaire

llama.cpp : installation et utilisation

llama.cpp est le moteur d'inférence de référence pour les LLMs locaux. Ce guide couvre la compilation depuis les sources avec support GPU, l'utilisation en ligne de commande et le démarrage d'un serveur HTTP compatible OpenAI.

Développement avancé

Créer un RAG local avec Ollama et Python

Apprenez à construire un système RAG (Retrieval-Augmented Generation) entièrement local avec Ollama pour l'inférence, ChromaDB pour le stockage vectoriel et LangChain pour l'orchestration. Aucune API externe requise.

Modèles débutant

Comparer les LLMs locaux : lequel choisir en 2025 ?

Modèles intermédiaire

Faire tourner DeepSeek R1 en local

Matériel débutant

Quel GPU acheter pour faire tourner des LLMs en local ?

Quel GPU choisir pour faire tourner des LLMs en local en 2025 ? Comparatif complet des cartes NVIDIA RTX et AMD Radeon, recommandations selon votre budget et guide pour maximiser la VRAM disponible.

Matériel débutant

M1/M2/M3/M4 : les meilleurs LLMs pour Apple Silicon

Les Mac avec puce Apple Silicon (M1 à M4) sont d'excellentes machines pour les LLMs locaux grâce à leur mémoire unifiée. Ce guide vous aide à choisir les meilleurs modèles et paramètres pour chaque configuration.

Setup intermédiaire

Open WebUI : créer une interface ChatGPT en local

Open WebUI est la meilleure interface graphique open source pour Ollama. Ce guide vous montre comment l'installer avec Docker, le connecter à vos modèles locaux et profiter de fonctionnalités avancées comme le RAG, les outils et le multi-modèle.

Prompting débutant

Prompt engineering : 10 techniques pour de meilleurs résultats

Le prompt engineering est la clé pour tirer le meilleur de vos LLMs locaux. Ce guide présente 10 techniques concrètes avec exemples pour améliorer immédiatement la qualité des réponses.

Développement avancé

LoRA fine-tuning : personnaliser un LLM sur vos données

Le fine-tuning LoRA permet d'adapter un LLM open source à votre domaine ou style spécifique avec une seule GPU grand public. Ce guide couvre la préparation des données, l'entraînement avec Unsloth, et la fusion du LoRA adapter.

Matériel avancé

Monter un serveur LLM maison : guide complet

Montez votre propre serveur LLM maison avec Ubuntu Server, Ollama et un reverse proxy sécurisé. Guide complet du choix du matériel à l'exposition sécurisée sur internet avec authentification.

Développement intermédiaire

Embeddings locaux avec Ollama : guide pratique

Les embeddings sont la brique fondamentale des applications RAG et de recherche sémantique. Ce guide explique comment générer des embeddings locaux avec Ollama et les modèles nomic-embed-text et mxbai-embed-large, et comment les utiliser avec Python.

Proposer un tutoriel

Vous avez rédigé un guide sur les LLMs, l'IA locale ou le prompt engineering ? Partagez-le avec la communauté francophone. Nous sélectionnons les contributions de qualité pour les publier sur LLMs.fr.

Envoyer ma proposition →