Qdrant
Qdrant 是一个为生产级 AI 工作负载构建的开源向量搜索引擎。它存储嵌入向量,并具有快速的相似度搜索与元数据过滤功能,方便团队实现 RAG 聊天机器人、语义搜索、推荐系统和代理记忆等应用,无需从零搭建检索基础设施。你可以在免费云层起步,自行托管数据库,或在 AWS、GCP 和 Azure 上的托管集群中扩展。
该引擎采用 Rust 编写,使用定制的 HNSW 算法进行近似最近邻搜索。Qdrant 的特色包括原生混合搜索,可在一次查询中同时处理密集和稀疏向量,图遍历中的一阶段过滤,以及支持多向量,即单个对象需要多个嵌入时的支持。诸如标量、乘积和二进制量化的压缩选项,帮助在大规模集合中降低内存使用。
开发者可以通过 REST、gRPC 或官方客户端库连接,OpenAPI 规范支持生成其他语言的绑定。内置的 Web UI 让你无需编写脚本即可检查集合、运行测试查询和调整过滤器。Qdrant Cloud 提供托管备份、零宕机扩展和可选的云端推理,使你可以在同一管道中嵌入文本或图像。
该项目于 2021 年在 GitHub 上启动,当时现有的库不能满足生产的需求。在现在,它支持企业部署,并吸引了庞大的开源社区,案例研究包括 Tripadvisor、HubSpot 和 Deutsche Telekom 等公司。
在一次查询中融合密集与稀疏搜索,支持 BM25、SPLADE++ 和 miniCOIL
元数据过滤器在 HNSW 遍历期间运行,而非作为缓慢的前置或后置过滤步骤
使用 Rust 编写,性能测试显示请求每秒(RPS)最高达替代方案的4倍
支持 REST、gRPC 以及官方客户端,涵盖 Python、JavaScript、Go 等多种语言
内置Web UI,方便浏览集合、测试查询并直观检查结果
多向量集合,适用于单个对象需要多个嵌入向量的场景
可在 Qdrant Cloud 运行托管,支持自托管开源版本(OSS),或部署混合及私有云方案
开源核心,提供永久免费的云端层,适用于原型设计和早期测试。
原生混合搜索和一阶段元数据过滤,减少对独立检索堆栈的需求。
灵活部署,支持从自托管开源软件到全托管、混合和私有云选项。
强劲的开源影响力,主页引用了超过3万颗GitHub星标。
企业云部署支持SOC2和HIPAA合规认证徽章。
标准版和高级云定价是基于使用量或销售导向,而非公共页面上的固定月费。
免费套餐的上限为1GB内存和4GB磁盘,且不支持高可用性,因此生产环境需要付费套餐。
自托管部署相比于托管云控制台设置,需要您自行进行运维工作。
Qdrant 有免费方案吗?
有的。Qdrant Cloud 提供永久免费用于测试和原型开发的免费层。它包含一个单节点集群,配备 0.5 vCPU、1GB 内存、4GB 磁盘空间,并且支持选定模型的云端免费推理。
我可以自托管 Qdrant 而不是使用 Qdrant Cloud 吗?
可以。Qdrant 是开源的,可以作为 Qdrant 向量数据库进行自托管。Qdrant 还提供托管的 Qdrant Cloud、部署在您基础设施上的混合云以及用于企业隔离部署的私有云。
Qdrant 中的混合搜索是什么?
Qdrant 的混合搜索在单次查询中结合了稠密向量相似度和稀疏关键词匹配。它支持 BM25、SPLADE++ 和 miniCOIL,使您无需运行两个独立系统即可融合语义检索和词汇检索。
我可以用 Qdrant 构建什么?
Qdrant 支持 RAG 和 GenAI 流水线、带持久记忆的 AI 代理、语义搜索、推荐系统以及带异常检测的数据分析。其推荐 API 可在一次请求中评分多个向量,实现个性化结果。
我可以将现有的 Qdrant OSS 部署迁移到 Qdrant Cloud 吗?
可以。Qdrant 提供了从开源部署迁移到 Qdrant Cloud 的文档和工具,帮助您迁移现有数据。如果您的集群超过了免费层 1GB 内存和 4GB 磁盘的限制,您可以升级到标准层专用集群。
Qdrant Cloud 支持哪些云服务提供商?
Qdrant Cloud 运行在全球的 AWS、Google Cloud 和 Azure 区域。Qdrant 也已上架 AWS Marketplace、Google Cloud Marketplace 和 Microsoft Azure Marketplace,支持订阅计费。
Qdrant Cloud 付费层的计费方式如何?
Qdrant Cloud 标准层的计费基于计算资源(vCPU)、内存(GB)、存储(GB)、备份存储和付费模型的推理令牌使用量。使用情况按小时计量,并在 Qdrant Cloud 控制面板中可见。

