Weaviate
Weaviate 是一个开源的向量数据库平台,旨在构建搜索、增强检索生成(RAG)以及代理工作流程。团队可以使用它存储嵌入向量,执行语义和混合查询,并无需拼接单独的搜索、记忆和数据库层,即可发布生产级AI应用。
该数据库整合了向量搜索、内置嵌入服务以及如 Query Agent 和 Engram 的代理工具。你可以自行托管这个开源项目,也可以作为 Weaviate 云服务运行,享受托管集群、自动扩展及集合集合和 GraphQL 查询的控制台工具。
它适用于后端工程师、ML平台团队以及开发RAG聊天机器人、推荐系统或多租户SaaS功能的产品团队。SDK支持Python、Go、TypeScript和JavaScript,其他功能则通过GraphQL和REST API实现。
纯向量、语义和混合搜索于一体的集合 API
Query Agent 将自然语言问题转换为数据库操作
Engram 为长时间运行的代理添加托管内存和上下文
Weaviate Cloud 内托管嵌入,按百万令牌计费
多租户在单个集群中隔离客户数据
提供 Python、Go、TypeScript 和 JavaScript 的 SDK 以及 GraphQL 和 REST
开源核心,提供托管云选项和自托管企业支持。
融合向量搜索、嵌入和代理工作流,无需依赖不同供应商。
多租户及十亿级架构支持大规模生产负载。
通过SOC 2 Type II审计,企业云(AWS)支持HIPAA。
免费套餐将存储限制在100,000个对象和一个集合。
SSO/SAML和HIPAA需要高级或专用企业计划。
基于使用的向量维度和存储定价可能难以预测。
Weaviate 有免费计划吗?
有的。Weaviate Cloud 提供免费计划,支持最多 100,000 个对象,一个集合,混合搜索,向量压缩,多租户和基于角色的访问控制(RBAC)。免费套餐中的嵌入请求每天限制为 2,000 次。
Weaviate Cloud 费用是多少?
Weaviate Cloud Flex 从每月 起,按使用量计费,运行在共享基础设施上。高级预付合约从每月 起,包括在 AWS、GCP 和 Azure 上提供共享或专用部署,保证高达 99.95% 的正常运行时间。
我可以自行托管 Weaviate 吗?
可以。Weaviate 是开源的,可以运行在您自己的基础设施上。Weaviate 还提供 Weaviate Assurance,用于自托管部署,增加企业服务级别协议(SLA)、全天候事故响应和直接访问核心工程团队。
Weaviate 支持哪些编程语言?
Weaviate 提供官方客户端 SDK,支持 Python、Go、TypeScript 和 JavaScript。您也可以通过 GraphQL 或 REST API 查询集群,文档详见 docs.weaviate.io。
Weaviate 是否符合 SOC 2 或 HIPAA 认证?
Weaviate Cloud 已通过 SOC 2 Type II 审计。部署在 AWS 上的企业云支持符合 HIPAA 规定的医疗健康工作负载。合规文档可通过 Weaviate Trust Portal 获取。
什么是 Weaviate Query Agent?
Weaviate Query Agent 允许您使用自然语言查询 Weaviate 数据库,并返回精准结果。免费套餐包含每月 1,000 次请求;月度 组织套餐包含 4,000 次请求,额外使用按量计费。

