Qdrant
Qdrant é um motor de busca vetorial de código aberto, desenvolvido para cargas de trabalho de IA em produção. Ele armazena embeddings e realiza buscas de similaridade rápidas com filtragem de metadados, permitindo que equipes alimentem chatbots RAG, buscas semânticas, recomendações e memória de agentes sem precisar construir infraestrutura de recuperação do zero. Você pode começar na camada gratuita de nuvem, hospedar o banco de dados localmente ou escalar em clusters gerenciados na AWS, GCP e Azure.
O motor é escrito em Rust e utiliza um algoritmo HNSW personalizado para busca por vizinhos mais próximos aproximada. O Qdrant se destaca com uma busca híbrida nativa que combina vetores densos e esparsos em uma única consulta, filtragem em uma etapa durante a travessia do grafo e suporte a multi-vetor quando um único objeto precisa de várias embeddings. Opções de compressão como quantização escalar, de produto e binária ajudam a reduzir o uso de memória em coleções grandes.
Desenvolvedores se conectam via REST, gRPC ou as bibliotecas clientes oficiais, com uma especificação OpenAPI para gerar ligações em outras linguagens. Uma interface Web integrada permite inspecionar coleções, executar consultas de teste e ajustar filtros sem escrever scripts. O Qdrant Cloud adiciona backups gerenciados, escalabilidade sem tempo de inatividade e inferência opcional na nuvem, permitindo incorporar texto ou imagens na mesma pipeline.
O projeto começou no GitHub em 2021, quando bibliotecas existentes não atendiam às necessidades de produção em termos de recursos e escala. Hoje, suporta implantações corporativas e atraiu uma grande comunidade open-source, com estudos de caso de empresas como Tripadvisor, HubSpot e Deutsche Telekom.
Pesquisa híbrida densa e esparsa em uma única consulta, com suporte a BM25, SPLADE++ e miniCOIL
Filtros de metadata executados durante a travessia HNSW, não como uma etapa lenta de pré- ou pós-filtragem
Escrito em Rust e testado com desempenho até 4x RPS em comparação a alternativas
REST, gRPC e clientes oficiais para Python, JavaScript, Go e mais
Interface Web integrada para navegar por coleções, testar consultas e inspecionar resultados visualmente
Coleções multivetoriais quando um objeto precisa de vários embeddings simultaneamente
Execução gerenciada na Qdrant Cloud, auto-hospedagem OSS ou opções de implantação Hybrid e Private Cloud
Núcleo open-source com um nível gratuito permanente na nuvem para protótipos e testes iniciais.
Busca híbrida nativa e filtragem de metadados em estágio único reduzem a necessidade de stacks de recuperação separadas.
Implantação flexível, desde OSS self-hosted até opções totalmente gerenciadas, híbridas e de nuvem privada.
Forte aceitação open-source com mais de 30 mil estrelas no GitHub, citadas na página inicial.
Selos de conformidade SOC2 e HIPAA listados para implantações empresariais na nuvem.
Os preços da nuvem Standard e Premium são baseados no uso ou orientados por vendas, em vez de taxas mensais fixas na página pública.
O Nível Gratuito possui um limite de 1GB de RAM e 4GB de disco sem alta disponibilidade, portanto, cargas de trabalho de produção exigem um nível pago.
Implantações self-hosted exigem que você realize suas próprias tarefas de operações, em comparação com a configuração gerenciada pelo console da nuvem.
O Qdrant possui um plano gratuito?
Sim. O Qdrant Cloud oferece um Nível Gratuito que permanece gratuito para sempre, ideal para testes e protótipos. Inclui um cluster de nó único com 0,5 vCPU, 1GB de RAM, 4GB de disco e inferência na nuvem gratuita com modelos selecionados.
Posso hospedar o Qdrant por conta própria em vez de usar o Qdrant Cloud?
Sim. O Qdrant é open source e pode ser hospedado localmente como o Qdrant Vector Database. O Qdrant também oferece o Qdrant Cloud gerenciado, Hybrid Cloud em sua infraestrutura e Private Cloud para implantações empresariais isoladas.
O que é a busca híbrida no Qdrant?
A busca híbrida do Qdrant combina similaridade de vetores densos com correspondência esparsa de palavras-chave em uma única consulta. Suporta BM25, SPLADE++ e miniCOIL, permitindo mesclar recuperação semântica e lexical sem precisar rodar dois sistemas separados.
O que posso construir com o Qdrant?
O Qdrant suporta pipelines RAG e GenAI, agentes de IA com memória persistente, busca semântica, sistemas de recomendação e análise de dados com detecção de anomalias. Sua API de Recomendações pode avaliar múltiplos vetores em um único pedido para resultados personalizados.
Posso migrar uma implantação Qdrant OSS existente para o Qdrant Cloud?
Sim. O Qdrant documenta a migração de implantações open-source para o Qdrant Cloud e fornece ferramentas para transferir dados existentes. Se seu cluster ultrapassar os limites do Nível Gratuito de 1GB de RAM e 4GB de disco, é possível fazer upgrade para um cluster dedicado no Nível Standard.
Quais provedores de nuvem o Qdrant Cloud suporta?
O Qdrant Cloud opera em regiões da AWS, Google Cloud e Azure globalmente. O Qdrant também está listado no AWS Marketplace, Google Cloud Marketplace e Microsoft Azure Marketplace para faturamento por assinatura.
Como funciona a cobrança no Qdrant Cloud nos níveis pagos?
A cobrança do Qdrant Cloud no Nível Standard é baseada no uso de computação (vCPU), memória (GB), armazenamento (GB), armazenamento de backup e tokens de inferência para modelos pagos. O consumo é medido por hora e visível no painel do Qdrant Cloud.

