Pourquoi le prompt engineering est crucial
Un modèle identique peut donner des résultats radicalement différents selon la façon dont il est interrogé. Les LLMs sont des modèles de complétion de texte qui continuent le texte fourni : la formulation de votre demande influence directement la structure et la qualité de la réponse. Sur les LLMs locaux moins puissants que GPT-4, le prompt engineering devient encore plus important pour compenser les limitations du modèle. Maîtriser ces techniques vous permettra d'obtenir des résultats exploitables avec des modèles 7B qui semblaient initialement insuffisants.
Les fondamentaux : clarté et contexte
La règle d'or est d'être spécifique : remplacez 'Écris un article' par 'Écris un article de blog de 800 mots, en français, destiné à des développeurs débutants, expliquant les avantages des LLMs locaux'. Fournissez toujours le contexte nécessaire : qui vous êtes, pour quel usage la réponse sera utilisée, le niveau de détail attendu. Définissez le format de sortie explicitement : 'Réponds en JSON avec les champs name et description', 'Liste 5 points en markdown', 'Rédige en 3 paragraphes'. Plus votre prompt est précis, moins le modèle doit inférer vos intentions.
Techniques avancées : few-shot et chain-of-thought
Le few-shot prompting consiste à fournir des exemples entrée/sortie avant votre vraie demande : le modèle comprend le pattern et l'applique. Le chain-of-thought (CoT) demande au modèle de raisonner étape par étape avant de conclure, améliorant fortement les résultats sur les tâches logiques : ajoutez simplement 'Raisonne étape par étape' ou 'Pense à voix haute'. L'auto-critique consiste à demander au modèle de critiquer sa propre réponse puis de l'améliorer dans une même interaction. Ces techniques sont particulièrement efficaces sur les modèles de raisonnement comme DeepSeek R1.
Le système prompt : votre assistant personnalisé
Le système prompt (message avec le rôle 'system') définit le comportement global du modèle pour toute la conversation. Un bon système prompt spécifie le rôle joué ('Tu es un expert en Python de 15 ans d'expérience'), le style de réponse ('Réponses concises, exemples de code systématiques'), les limites ('Ne specula pas, dis clairement si tu ne sais pas'), et la langue ('Réponds toujours en français'). Le système prompt est votre outil le plus puissant pour personnaliser le comportement du modèle sur le long terme. Avec Ollama, configurez-le dans un Modelfile.
Étapes pratiques
-
Technique 1-3 : Spécificité, rôle et format
Commencez par ces trois fondamentaux : soyez spécifique sur la tâche, assignez un rôle expert au modèle, et demandez un format de sortie précis.
{step.code} -
Technique 4 : Few-shot prompting
Fournissez des exemples entrée/sortie pour guider le modèle vers le format attendu.
{step.code} -
Technique 5-6 : Chain-of-thought et décomposition
Demandez au modèle de raisonner étape par étape, ou décomposez un problème complexe en sous-tâches.
{step.code} -
Technique 7-8 : Contraintes négatives et auto-critique
Spécifiez ce que le modèle ne doit PAS faire, puis demandez-lui de critiquer et améliorer sa propre réponse.
{step.code} -
Technique 9-10 : Température et répétition
Ajustez la température selon la tâche (basse pour le code/factuel, haute pour la créativité), et relancez le même prompt si la première réponse est décevante.