Qdrant

Qdrant

Qdrant est un moteur de recherche vectorielle open-source conçu pour les charges de travail d'IA en production. Il stocke des embeddings et exécute rapidement des recherches de similarité avec un filtrage par métadonnées, permettant aux équipes d'alimenter des chatbots RAG, la recherche sémantique, les recommandations et la mémoire des agents sans avoir à construire une infrastructure de récupération depuis zéro. Vous pouvez commencer avec le niveau gratuit sur le cloud, héberger la base de données en interne ou évoluer sur des clusters gérés sur AWS, GCP et Azure.

Le moteur est écrit en Rust et utilise un algorithme HNSW personnalisé pour la recherche de voisins les plus proches approximative. Qdrant se distingue par sa recherche hybride native qui combine vecteurs denses et clairsemés en une seule requête, un filtrage en une étape lors de la traversal du graphe, et la prise en charge de plusieurs vecteurs lorsqu'un seul objet nécessite plusieurs embeddings. Des options de compression telles que la quantification scalaire, produit et binaire aident à réduire la consommation de mémoire sur de grandes collections.

Les développeurs se connectent via REST, gRPC ou via les bibliothèques clientes officielles, avec une spécification OpenAPI pour générer des liaisons dans d'autres langages. Une interface Web intégrée permet d'inspecter les collections, d'exécuter des requêtes de test et d'ajuster les filtres sans écrire de scripts. Qdrant Cloud offre des sauvegardes gérées, une scalabilité sans interruption et une inférence cloud en option, vous permettant d'intégrer du texte ou des images dans le même pipeline.

Le projet a débuté sur GitHub en 2021, lorsque les bibliothèques existantes ne répondaient pas aux besoins en production en termes de fonctionnalités et d'échelle. Il soutient désormais des déploiements d'entreprise et a attiré une grande communauté open-source, avec des études de cas de sociétés telles que Tripadvisor, HubSpot et Deutsche Telekom.

Fonctionnalités principales:
  1. Recherche hybride dense et sparse en une seule requête, avec prise en charge de BM25, SPLADE++ et miniCOIL

  2. Les filtres de métadonnées s'exécutent lors du parcours HNSW, pas en tant qu'étape lente de préfiltrage ou postfiltrage

  3. Écrit en Rust et testé jusqu'à 4 fois plus rapide en RPS par rapport aux alternatives

  4. REST, gRPC, et clients officiels pour Python, JavaScript, Go, et plus

  5. Interface Web intégrée pour parcourir les collections, tester les requêtes et inspecter les résultats visuellement

  6. Collections multivecteurs lorsque un objet a besoin de plusieurs embeddings simultanément

  7. Exécution gérée sur Qdrant Cloud, auto-hébergement OSS, ou déploiement des options Hybrid et Private Cloud

Pros:
  1. Noyau open-source avec un niveau cloud gratuit permanent pour les prototypes et les premiers tests.

  2. Recherche hybride native et filtrage de métadonnées en une étape réduisent le besoin de piles de récupération séparées.

  3. Déploiement flexible allant de l'OSS auto-hébergé aux options cloud entièrement gérées, hybrides et privées.

  4. Forte traction open-source avec plus de 30 000 étoiles GitHub mentionnées sur la page d'accueil.

  5. Badges de conformité SOC2 et HIPAA listés pour les déploiements cloud d'entreprise.

Cons:
  1. Les tarifs Standard et Premium pour le cloud sont basés sur l'utilisation ou les ventes, plutôt que des tarifs mensuels fixes affichés sur la page publique.

  2. Le niveau gratuit est limité à 1 Go de RAM et 4 Go de disque sans haute disponibilité, donc les charges de production nécessitent un niveau payant.

  3. Les déploiements auto-hébergés nécessitent votre propre travail opérationnel par rapport à la configuration via la console cloud managée.

FAQ:

Qdrant propose-t-il un plan gratuit ?

Oui. Qdrant Cloud offre un niveau gratuit qui reste gratuit indéfiniment pour les tests et prototypes. Il inclut un cluster à nœud unique avec 0,5 vCPU, 1 Go de RAM, 4 Go de disque, et une inférence cloud gratuite avec des modèles sélectionnés.

Puis-je héberger Qdrant moi-même au lieu d'utiliser Qdrant Cloud ?

Oui. Qdrant est open source et peut être hébergé localement en tant que base de données vectorielle Qdrant. Qdrant propose également une solution cloud managée Qdrant Cloud, un Cloud Hybride sur votre infrastructure, et un Cloud Privé pour des déploiements d'entreprise isolés.

Qu'est-ce que la recherche hybride dans Qdrant ?

La recherche hybride de Qdrant combine la similarité de vecteurs denses avec la correspondance de mots-clés clairsemés dans une seule requête. Elle prend en charge BM25, SPLADE++, et miniCOIL pour que vous puissiez mêler la récupération sémantique et lexicale sans exécuter deux systèmes séparés.

Que puis-je construire avec Qdrant ?

Qdrant supporte les pipelines RAG et GenAI, les agents d'IA avec mémoire persistante, la recherche sémantique, les systèmes de recommandation, et l'analyse de données avec détection d'anomalies. Son API de recommandation peut évaluer plusieurs vecteurs en une seule requête pour des résultats personnalisés.

Puis-je migrer un déploiement existant Qdrant OSS vers Qdrant Cloud ?

Oui. Qdrant documente la migration des déploiements open source vers Qdrant Cloud et fournit des outils pour déplacer les données existantes. Si votre cluster dépasse les limites du niveau gratuit de 1 Go de RAM et 4 Go de disque, vous pouvez passer à un cluster dédié du niveau Standard.

Quels fournisseurs de cloud Qdrant Cloud prend-il en charge ?

Qdrant Cloud fonctionne sur les régions AWS, Google Cloud et Azure à travers le monde. Qdrant est aussi référencé sur AWS Marketplace, Google Cloud Marketplace et Microsoft Azure Marketplace pour la facturation par abonnement.

Comment fonctionne la facturation de Qdrant Cloud sur les niveaux payants ?

La facturation du niveau Standard de Qdrant Cloud est basée sur l'utilisation du calcul (vCPU), de la mémoire (Go), du stockage (Go), du stockage de sauvegarde, et des jetons d'inférence pour les modèles payants. L'utilisation est mesurée à l'heure et visible dans le tableau de bord Qdrant Cloud.

Catégorie:

Tarification:

Freemium

Tags:

Vector Database
Similarity Search
RAG
Open Source

Technologie utilisée:

Ant Design
Google Tag Manager
HubSpot
Google Fonts
Python
Ruby
GitHub
Styled Components
Tailwind CSS

Commentaires:

Give your opinion on Qdrant :-

Overall rating

Join thousands of AI enthusiasts in the World of AI!

Meilleur Gratuit Qdrant Alternatives (et Payées)

By Rishit