Avancé Format G

GGML

Bibliothèque C de tenseurs et format précédant GGUF, à l'origine du mouvement LLM local sur CPU.

Définition complète

GGML est une bibliothèque de machine learning en C/C++ développée par Georgi Gerganov, initialement conçue pour rendre l'inférence de LLM possible sur CPU sans GPU dédié. Elle implémente des opérations sur les tenseurs optimisées pour différentes architectures (AVX2, ARM NEON) et supporte la quantisation entière (4-bit, 5-bit, 8-bit). Le format de fichier GGML a été remplacé par GGUF en août 2023 pour corriger ses limitations (non-extensible, pas auto-descriptif). Cependant, la bibliothèque GGML continue d'alimenter llama.cpp et whisper.cpp. Son impact a été immense : elle a démocratisé l'inférence locale de LLM sur des machines grand public, ouvrant la voie aux outils comme Ollama et LM Studio.

Définition complète

Termes associés