🔍 Scanner hardware · 25 modèles · 12 fournisseurs

Tout comprendre sur les LLMs -
modèles, outils, matériel

LLMs.fr vous aide à explorer, comparer et déployer les modèles d'IA en local ou dans le cloud. Scannez votre machine, trouvez le bon modèle, choisissez le bon GPU - tout est ici, gratuitement, en français.

50+ modèles
12 fournisseurs
100% gratuit
🇫🇷 en français

Les modèles les plus populaires

Les LLMs open source les plus téléchargés et testés par la communauté francophone, tous compatibles Ollama.

DeepSeek R1 7B

DeepSeek
Raisonnement
7B Min. 7 Go RAM
RaisonnementMathsCode
ollama run deepseek-r1:7b
Voir les détails →

Qwen 2.5 14B

Alibaba
Puissant
14B Min. 13 Go RAM
ChatCodeMultilingue
ollama run qwen2.5:14b
Voir les détails →
🔍

Découvrez quels LLMs tournent sur votre machine

Notre scanner analyse votre RAM, VRAM, processeur et stockage pour vous recommander les modèles compatibles avec votre configuration - sans installation, directement dans le navigateur.

Scanner ma machine →

100% gratuit · Aucune donnée envoyée

Le bon matériel pour vos LLMs

GPU, mini-PCs et configurations sélectionnées pour faire tourner des LLMs en local avec les meilleures performances.

🎮

NVIDIA RTX 4090

Le roi du LLM local sur PC

VRAM 24 Go GDDR6X
Perf. ~80-100 tokens/s (7B)
Modèles Jusqu'à 30B Q4 en full GPU

24 Go de VRAM pour faire tourner les modèles 30B sans compromis. La carte de référence pour quiconque veut le meilleur setup LLM local sur PC en 2025.

Voir sur Amazon →

NVIDIA RTX 4070

Meilleur rapport qualité/prix

VRAM 12 Go GDDR6X
Perf. ~55-70 tokens/s (7B)
Modèles 7B full GPU, 13B split

12 Go de VRAM pour les modèles 7B en pleine qualité et les modèles 13B en split. Le sweet spot pour la plupart des utilisateurs qui veulent de bonnes performances sans se ruiner.

Voir sur Amazon →

Local ou Cloud ?

Choisir entre un LLM local et une API cloud dépend de vos priorités. Voici une comparaison honnête.

Critère 💻 LLM Local ☁️ LLM Cloud
Coût à long terme
Très faible Électricité uniquement après achat matériel
Variable Facturation à l'usage, peut être élevée
Confidentialité
Totale Aucune donnée ne quitte votre machine
Limitée Données envoyées aux serveurs du fournisseur
Performance / qualité
Bonne Dépend du modèle et du matériel disponible
Excellente Accès aux meilleurs modèles (GPT-4o, Claude)
Vitesse (latence)
Très faible Pas de réseau, première réponse immédiate
Variable Dépend du réseau et de la charge serveur
Investissement initial
Élevé GPU 300-1800€, ou Mac M-series
Zéro Démarrage immédiat avec carte bancaire
Disponibilité
24/7 Pas de dépendance externe, hors-ligne possible
Généralement bonne Dépend du SLA du fournisseur
Mise à jour des modèles
Manuelle Vous choisissez quand mettre à jour
Automatique Toujours accès aux dernières versions
Personnalisation
Totale Fine-tuning, Modelfiles, paramètres illimités
Partielle System prompt, fine-tuning selon le fournisseur

Choisissez le local si...

  • La confidentialité est une priorité (médical, juridique, RH)
  • Vous avez un usage intensif et souhaitez maîtriser les coûts
  • Vous développez des applications IA sans frais d'API
  • Vous avez ou envisagez d'acquérir un GPU ou un Mac M-series
Guide LLM local →

Choisissez le cloud si...

  • Vous avez besoin des meilleurs modèles sans contrainte matérielle
  • Votre usage est occasionnel ou en phase d'exploration
  • Vous avez besoin de multimodalité avancée (audio, vidéo)
  • Le temps de mise en place est une contrainte
Comparer les fournisseurs →

Questions fréquentes

Les réponses aux questions les plus posées sur les LLMs, l'IA en local et le matériel nécessaire.

Commencer maintenant

Découvrez quels LLMs sont compatibles avec votre machine, explorez le catalogue de modèles ou plongez dans nos guides - tout est gratuit, en français.

Aucune inscription requise · 100% gratuit · Open source friendly