Accueil / Tutoriels

Tutoriels LLM - Guides pratiques en français

Apprenez LLM pas à pas avec nos guides pratiques en français : installation, choix des modèles, configuration matérielle, prompt engineering et développement d'applications. Du débutant à l'avancé.

15 tutoriels
100% en français
Mis à jour Juin 2025

15 tutoriels affichés

Tous les tutoriels

Setup débutant

Comment installer Ollama sur Mac et Windows

Apprenez à installer Ollama sur macOS et Windows pour faire tourner des LLMs en local, sans cloud et sans API payante. Guide complet avec captures d'écran et résolution des problèmes courants.

Setup débutant

LM Studio : guide complet pour débutants

LM Studio est l'application la plus facile pour faire tourner des LLMs en local. Ce guide vous explique comment l'installer, télécharger des modèles depuis HuggingFace et utiliser le serveur local compatible OpenAI.

Modèles intermédiaire

Quelle quantisation GGUF choisir ? Guide complet

Le format GGUF propose de nombreuses variantes de quantisation qui impactent la taille, la vitesse et la qualité des LLMs. Ce guide explique les différences entre Q4_K_M, Q5_K_S, Q8_0 et les autres pour vous aider à choisir la meilleure option selon votre matériel.

Matériel intermédiaire

Configurer son GPU NVIDIA pour les LLMs (CUDA)

Guide complet pour configurer votre GPU NVIDIA avec CUDA afin d'accélérer l'inférence de LLMs en local. Installation des drivers, CUDA toolkit, et optimisation pour Ollama, llama.cpp et autres outils.

Setup intermédiaire

llama.cpp : installation et utilisation

llama.cpp est le moteur d'inférence de référence pour les LLMs locaux. Ce guide couvre la compilation depuis les sources avec support GPU, l'utilisation en ligne de commande et le démarrage d'un serveur HTTP compatible OpenAI.

Développement avancé

Créer un RAG local avec Ollama et Python

Apprenez à construire un système RAG (Retrieval-Augmented Generation) entièrement local avec Ollama pour l'inférence, ChromaDB pour le stockage vectoriel et LangChain pour l'orchestration. Aucune API externe requise.

Modèles débutant

Comparer les LLMs locaux : lequel choisir en 2025 ?

Comparatif complet des meilleurs LLMs open source disponibles en local en 2025 : Llama 3.2, Mistral 7B, Gemma 2, Qwen 2.5 et Phi-3. Quel modèle choisir selon votre usage, votre matériel et vos exigences ?

Modèles intermédiaire

Faire tourner DeepSeek R1 en local

DeepSeek R1 est un modèle de raisonnement qui rivalise avec o1 d'OpenAI. Apprenez à faire tourner ses versions distillées en local avec Ollama ou llama.cpp, et à exploiter ses capacités de chain-of-thought.

Matériel débutant

M1/M2/M3/M4 : les meilleurs LLMs pour Apple Silicon

Les Mac avec puce Apple Silicon (M1 à M4) sont d'excellentes machines pour les LLMs locaux grâce à leur mémoire unifiée. Ce guide vous aide à choisir les meilleurs modèles et paramètres pour chaque configuration.

Setup intermédiaire

Open WebUI : créer une interface ChatGPT en local

Open WebUI est la meilleure interface graphique open source pour Ollama. Ce guide vous montre comment l'installer avec Docker, le connecter à vos modèles locaux et profiter de fonctionnalités avancées comme le RAG, les outils et le multi-modèle.

Développement avancé

LoRA fine-tuning : personnaliser un LLM sur vos données

Le fine-tuning LoRA permet d'adapter un LLM open source à votre domaine ou style spécifique avec une seule GPU grand public. Ce guide couvre la préparation des données, l'entraînement avec Unsloth, et la fusion du LoRA adapter.

Matériel avancé

Monter un serveur LLM maison : guide complet

Montez votre propre serveur LLM maison avec Ubuntu Server, Ollama et un reverse proxy sécurisé. Guide complet du choix du matériel à l'exposition sécurisée sur internet avec authentification.

Développement intermédiaire

Embeddings locaux avec Ollama : guide pratique

Les embeddings sont la brique fondamentale des applications RAG et de recherche sémantique. Ce guide explique comment générer des embeddings locaux avec Ollama et les modèles nomic-embed-text et mxbai-embed-large, et comment les utiliser avec Python.

Proposer un tutoriel

Vous avez rédigé un guide sur les LLMs, l'IA locale ou le prompt engineering ? Partagez-le avec la communauté francophone. Nous sélectionnons les contributions de qualité pour les publier sur LLMs.fr.

Envoyer ma proposition →