Débutant Hardware G

GPU (Graphics Processing Unit)

Processeur graphique massivement parallèle devenu indispensable pour l'entraînement et l'inférence des LLM.

Définition complète

Un GPU est un processeur conçu à l'origine pour le rendu graphique 3D, composé de milliers de petits cœurs spécialisés dans les calculs parallèles. Cette architecture est idéale pour les opérations matricielles qui constituent l'essentiel du calcul dans les LLM. Les GPU NVIDIA (A100, H100, H200, RTX 4090) dominent le marché de l'IA grâce à leur écosystème CUDA mature. Pour l'inférence locale, un GPU grand public avec 16-24 Go de VRAM (RTX 3090, 4090) suffit pour faire tourner des modèles jusqu'à 34B en quantisation 4-bit. L'entraînement de grands modèles nécessite des clusters de centaines ou milliers de GPU H100 interconnectés. Les alternatives incluent les TPU de Google, les GPU AMD avec ROCm et les Apple Silicon avec leur mémoire unifiée.