Intermédiaire Entraînement S

SFT (Supervised Fine-Tuning)

Première étape d'alignement d'un LLM, entraîné sur des exemples curatés de paires instruction/réponse de qualité.

Définition complète

Le Supervised Fine-Tuning est la méthode d'alignement la plus fondamentale : on entraîne un LLM de base sur un dataset de démonstrations de haute qualité - des paires (instruction, réponse idéale) rédigées ou validées par des humains. Le SFT enseigne au modèle le format conversationnel, comment interpréter les instructions et les valeurs de base (honnêteté, utilité). C'est la première étape du pipeline RLHF : SFT → Reward Model → PPO. Des datasets SFT publics comme Alpaca, OpenHermes, ShareGPT et UltraChat ont permis à la communauté open-source de créer des modèles instruct performants. La qualité des données SFT est primordiale : « less is more » - 1 000 exemples parfaits surpassent souvent 100 000 exemples médiocres.