MixedBread mxbai-embed-large-v1
mxbai-embed-large-v1 est le modèle d'embedding phare de MixedBread AI, générant des embeddings de 1024 dimensions avec d'excellentes performances sur les benchmarks MTEB. Il est conçu pour la recherche sémantique, le RAG et la classification de documents, et rivalise avec des modèles propriétaires comme text-embedding-3-large.
Caractéristiques principales
Variantes disponibles
| Quantization | Taille | RAM requise | VRAM requise | Vitesse | HuggingFace |
|---|---|---|---|---|---|
| F16 | 0.67 Go | 1.5 Go | 1 Go | ~500 tok/s | HuggingFace → |
Installation
Ollama
La méthode la plus simple pour lancer MixedBread mxbai-embed-large-v1 en local.
ollama run mxbai-embed-large:latest Pas encore installé ? Voir le guide Ollama
LM Studio
Interface graphique pour exécuter MixedBread mxbai-embed-large-v1 sans ligne de commande.
- Télécharger et ouvrir LM Studio
- Aller dans l'onglet Discover
- Rechercher MixedBread mxbai-embed-large-v1
- Sélectionner la variante souhaitée (Q4_K_M recommandé) et télécharger
- Charger le modèle et démarrer un chat
llama.cpp
Pour les utilisateurs avancés souhaitant un contrôle total sur l'inférence.
# Télécharger le modèle GGUF (exemple Q4_K_M)
huggingface-cli download \
mixedbread-ai/MixedBread-mxbai-embed-large-v1 \
--include "*.Q4_K_M.gguf" \
--local-dir ./models/mxbai-embed-large Fichiers GGUF disponibles sur HuggingFace
Compatible avec votre machine ?
Scannez votre configuration matérielle pour savoir si MixedBread mxbai-embed-large-v1 peut tourner sur votre ordinateur - RAM, VRAM, et vitesse estimée.