Sampling
Méthode de décodage introduisant de la variabilité dans la génération en tirant aléatoirement parmi les tokens probables.
Définition complète
Le sampling est une famille de stratégies de décodage qui introduisent de la stochasticité dans la génération de texte, s'opposant au greedy decoding et au beam search déterministes. Au lieu de toujours choisir le token le plus probable, le sampling tire aléatoirement selon une distribution modifiée. La température contrôle l'entropie de cette distribution. Le top-k sampling restreint le tirage aux k tokens les plus probables ; le top-p (nucleus sampling) restreint aux tokens couvrant un pourcentage cumulé de probabilité. Ces méthodes produisent des textes plus variés et créatifs, essentiels pour les chatbots et la génération créative. La combinaison temperature + top-p est le standard industriel : température 0.7, top-p 0.9 est une valeur de départ commune pour les chatbots.