mxbai-embed-large-v1 est le modèle d'embedding phare de MixedBread AI, générant des embeddings de 1024 dimensions avec d'excellentes performances sur les benchmarks MTEB. Il est conçu pour la recherche sémantique, le RAG et la classification de documents, et rivalise avec des modèles propriétaires comme text-embedding-3-large.

Caractéristiques principales

Paramètres 0.335B params

RAM min (Q4) 1.5 Go

Contexte 512K tokens

Famille mxbai-embed

Année 2024

Use cases Embedding

Variantes disponibles

Quantization	Taille	RAM requise	VRAM requise	Vitesse	HuggingFace
F16	0.67 Go	1.5 Go	1 Go	~500 tok/s	HuggingFace →

Installation

Ollama

La méthode la plus simple pour lancer MixedBread mxbai-embed-large-v1 en local.

ollama run mxbai-embed-large:latest

Pas encore installé ? Voir le guide Ollama

LM Studio

Interface graphique pour exécuter MixedBread mxbai-embed-large-v1 sans ligne de commande.

Télécharger et ouvrir LM Studio
Aller dans l'onglet Discover
Rechercher MixedBread mxbai-embed-large-v1
Sélectionner la variante souhaitée (Q4_K_M recommandé) et télécharger
Charger le modèle et démarrer un chat

Voir le guide LM Studio

llama.cpp

Pour les utilisateurs avancés souhaitant un contrôle total sur l'inférence.

 # Télécharger le modèle GGUF (exemple Q4_K_M)
huggingface-cli download \
  mixedbread-ai/MixedBread-mxbai-embed-large-v1 \
  --include "*.Q4_K_M.gguf" \
  --local-dir ./models/mxbai-embed-large 

Fichiers GGUF disponibles sur HuggingFace

Compatible avec votre machine ?

Scannez votre configuration matérielle pour savoir si MixedBread mxbai-embed-large-v1 peut tourner sur votre ordinateur - RAM, VRAM, et vitesse estimée.

Scanner ma machine →