一、先记选型 4 条铁律(直接决定你选对还是选错)1.数据量级决定用轻量/嵌入式/分布式2.是否要运维决定开源自建 vs 云托管3.是否混合查询(关键词+向量+过滤)决定是否要混合检索4.延迟要求决定索引类型(HNSW 必选线上)二、主流向量库一句话定位(背会就能面试)1.Milvus(最主流企业级)亿级向量、分布式、高吞吐、生产标准、CNCF孵化→ 适合:大规模生产、高并发、RAG平台、推荐系统2.Qdrant(Rust 高性能)查询极快、过滤强、资源省、REST友好→ 适合:低延迟、复杂过滤、中小规模到亿级3.Weaviate(混合检索强)向量+关键词(BM25)混合搜、内置Rerank、GraphQL→ 适合:知识库、企业搜索、RAG准确率要求高4.Pinecone(云托管免运维)开箱即用、自动扩缩容、无运维→ 适合:快速上线、不想运维、中小团队5.pgvector(PG 插件)用 PostgreSQL 存向量、事务、SQL 熟→ 适合:已有 PG、千万级内、简单RAG、后台系统6.Chroma(轻量嵌入式)几行代码跑、Python 友好、LangChain 无缝→ 适合:原型验证、小数据(100万)、测试
向量数据库技术选型
一、先记选型 4 条铁律(直接决定你选对还是选错)1.数据量级决定用轻量/嵌入式/分布式2.是否要运维决定开源自建 vs 云托管3.是否混合查询(关键词+向量+过滤)决定是否要混合检索4.延迟要求决定索引类型(HNSW 必选线上)二、主流向量库一句话定位(背会就能面试)1.Milvus(最主流企业级)亿级向量、分布式、高吞吐、生产标准、CNCF孵化→ 适合:大规模生产、高并发、RAG平台、推荐系统2.Qdrant(Rust 高性能)查询极快、过滤强、资源省、REST友好→ 适合:低延迟、复杂过滤、中小规模到亿级3.Weaviate(混合检索强)向量+关键词(BM25)混合搜、内置Rerank、GraphQL→ 适合:知识库、企业搜索、RAG准确率要求高4.Pinecone(云托管免运维)开箱即用、自动扩缩容、无运维→ 适合:快速上线、不想运维、中小团队5.pgvector(PG 插件)用 PostgreSQL 存向量、事务、SQL 熟→ 适合:已有 PG、千万级内、简单RAG、后台系统6.Chroma(轻量嵌入式)几行代码跑、Python 友好、LangChain 无缝→ 适合:原型验证、小数据(100万)、测试