Débutant Inférence T

Température

Paramètre contrôlant le degré de créativité/randomisation du LLM : 0 = déterministe, 1 = créatif, >1 = chaotique.

Définition complète

La température est un scalaire divisant les logits avant l'application du softmax, contrôlant la « sharpness » de la distribution de probabilité des tokens. Une température de 0 (ou très proche de 0) rend la génération déterministe : toujours le token le plus probable (greedy). Une température de 1 utilise les probabilités du modèle telles quelles. Des valeurs supérieures à 1 « aplatissent » la distribution, augmentant la variabilité et parfois l'incohérence. En pratique, 0.1-0.3 pour des tâches factuelles et analytiques, 0.7-0.9 pour la rédaction créative, et 0 pour le code où la reproductibilité est importante. La température n'a de sens que combinée avec du sampling : avec un top-p de 1.0, une température élevée peut générer n'importe quel token du vocabulaire.