RAG 开源项目排行榜（2026 年 5 月）-尧图企业网站定制

数据来源GitHub Stars 排行榜、gh-spy 扫描、多源交叉验证。Stars 为近似值实时数据以 GitHub 为准。文章目录一、总榜 Top 15按 GitHub Stars 排序二、按定位分类——别只看 Stars看类型类型 ARAG 专用引擎就是做 RAG 的️ 类型 B全栈 AI 平台RAG 是功能之一类型 CRAG 开发框架给开发者用的 SDK 类型 D教育资源学 RAG 用的三、关键维度对比检索策略部署难度文档解析能力四、活跃度与维护健康度五、选型决策树六、趋势判断RAG 下半场1. AgentRAG 是主战场2. 文档解析深度决定上限3. 混合检索成为标配4. 评估体系从感觉还行到指标说话七、WeKnora 在榜单中的位置一、总榜 Top 15按 GitHub Stars 排序排名项目⭐ Stars语言定位维护状态1Dify~141kTypeScript / Python低代码 AI 应用平台含 RAG 引擎极度活跃2Open WebUI~137kPython用户友好的 AI 界面Ollama OpenAI 活跃3LangChain~137kPython / JS通用 LLM 编排框架RAG 是子集极度活跃4awesome-llm-apps~110kPython100 可运行 AI Agent RAG 应用合集教程型5RAGFlow~80kPython专注 RAG 引擎 Agent深度文档理解极度活跃6Anything-LLM~60kJavaScript多合一 AI 生产力工具隐私优先活跃7LlamaIndex~40kPython / JSRAG-First 数据框架检索最强活跃8LightRAG~35kPython港大出品轻量快速 RAGEMNLP 2025 活跃9GraphRAG~33kPython微软出品知识图谱驱动的 RAG 降温月提交 310RAG_Techniques~27kPythonRAG 高级技巧合集 Notebook 教程教程型11FastGPT~23kTypeScript工作流知识库国产低代码平台活跃12Haystack~20kPython生产级 Pipeline 架构企业首选活跃13QAnything~13kPython网易有道出品BCEmbedding Reranker 中等14WeKnora~15kGo / Vue腾讯出品文档理解混合检索 Agent 活跃15MaxKB~12kPython开箱即用企业级 AI 智能体平台活跃二、按定位分类——别只看 Stars看类型Stars 多不等于更好用。Dify 141k star但它是全栈 AI 平台RAG 只是其中一个功能RAGFlow 80k star才是专注 RAG 的引擎。选项目先选类型。类型 ARAG 专用引擎就是做 RAG 的项目Stars核心能力适合谁RAGFlow~80kDeepDoc 文档解析、OCR、布局识别、GraphRAG、Agentic RAG文档密集场景、需要深度解析LightRAG~35k轻量快速、图结构检索、EMNLP 论文加持学术研究、快速原型GraphRAG~33k知识图谱驱动、跨文档关联发现需要图谱推理的场景QAnything~13kBCEmbedding 自研模型、Reranker、离线部署中文场景、隐私优先WeKnora~15k混合检索关键词向量图谱、ReACT Agent、多租户企业知识管理、需对接 AgentR2R~8kRESTful API、Agentic RAGAPI 优先的集成场景Verba~8kWeaviate 原生、轻量Weaviate 生态用户️ 类型 B全栈 AI 平台RAG 是功能之一项目StarsRAG 能力其他能力适合谁Dify~141k内置知识库、混合检索、Q2Q 召回工作流编排、Agent、多模型管理企业级全场景FastGPT~23k知识库工作流可视化对话流、API 编排中小团队快速搭建MaxKB~12k知识库问答工作流、Agent、多模型开箱即用型企业Anything-LLM~60k文档向量化问答多 LLM 支持、本地优先个人 / 小团队类型 CRAG 开发框架给开发者用的 SDK项目Stars核心抽象适合谁LangChain~137kChain / Agent / Retriever通用 LLM 开发、灵活编排LlamaIndex~40kIndex向量/关键词/图谱/树RAG-First、复杂检索模式Haystack~20kPipeline有向图组件生产级、企业部署DSPy~10kSignature Optimizer自动化调优、标注数据驱动Ragas~8k评估指标Faithfulness / RelevancyRAG 质量评估类型 D教育资源学 RAG 用的项目Stars内容适合谁awesome-llm-apps~110k100 可运行 AI RAG 应用入门学习、找灵感RAG_Techniques~27kRAG 高级技巧 Notebook 教程进阶学习、查方案三、关键维度对比检索策略项目纯向量关键词(BM25)知识图谱混合检索RAGFlow✅✅✅GraphRAG✅WeKnora✅✅✅✅LightRAG✅❌✅图结构部分GraphRAG❌❌✅核心❌Dify✅✅❌✅LlamaIndex✅✅✅✅QAnything✅✅❌✅部署难度项目Docker 一键本地免 Docker云端 SaaS私有化部署RAGFlow✅❌❌✅Dify✅❌✅✅WeKnora✅✅一键镜像❌✅Anything-LLM✅✅❌✅FastGPT✅❌✅✅QAnything✅❌❌✅文档解析能力项目PDFWord图片 OCR表格MarkdownHTMLRAGFlow✅ 深度✅✅ 强✅ 强✅✅WeKnora✅ 深度✅✅✅✅✅Dify✅ 基础✅⚠️ 有限⚠️ 有限✅✅LlamaIndex✅LlamaParse✅✅✅✅✅QAnything✅✅✅⚠️✅❌四、活跃度与维护健康度来自 gh-spy 扫描数据RAG 专用引擎维度项目月提交Open IssuesIssue 平均关闭天数贡献者健康评级RAGFlow338300033.6 天463A/F/A/A活跃但维护滞后LightRAG18822624.5 天246A/D/A/A活跃且较健康GraphRAG3—17.2 天50D/D/B/A降温但还在响应R2R0—29.9 天61F/D/B/B已停更Verba2—78.4 天37D/F/B/B大厂 Demo 模式AutoRAG0149524.5 天26F/F/C/B已停滞三个关键洞察RAGFlow 独占赛道 40% star——马太效应明显但 3000 open issues 说明增长快维护跟不上大厂项目发布后降温定律——微软 GraphRAG月提交 3、NVIDIA ChatRTX1 贡献者、Weaviate Verba月提交 2无一例外降温真正持续的是创业公司RAGFlow/InfiniFlow和学术团队LightRAG/港大五、选型决策树你的需求是什么 │ ├─ 我要开箱即用不想写代码 │ ├─ 企业级全功能 → Dify │ ├─ 个人/小团队 → Anything-LLM │ └─ 中文知识库 → FastGPT / MaxKB │ ├─ 我要专注 RAG 引擎 │ ├─ 文档深度解析OCR、表格、布局→ RAGFlow / WeKnora │ ├─ 轻量快速、学术场景 → LightRAG │ ├─ 知识图谱推理 → GraphRAG / WeKnora │ └─ 中文优化、离线部署 → QAnything │ ├─ 我是开发者要 SDK │ ├─ RAG-First、复杂检索 → LlamaIndex │ ├─ 通用 LLM 编排 → LangChain │ ├─ 生产级 Pipeline → Haystack │ └─ 自动调优 → DSPy Ragas │ └─ 我要学 RAG ├─ 看技巧合集 → RAG_Techniques └─ 跑现成应用 → awesome-llm-apps六、趋势判断RAG 下半场1. AgentRAG 是主战场纯 RAG 已经不够了。RAGFlow 融合 AgentWeKnora 内置 ReACT AgentDify 有工作流 Agent——RAG Agent 才是下半场。2. 文档解析深度决定上限“垃圾进垃圾出”——RAG 的天花板不在检索算法在文档解析。RAGFlow 的 DeepDoc、WeKnora 的多模态解析、LlamaIndex 的 LlamaParse都在啃这块硬骨头。3. 混合检索成为标配单一向量检索覆盖不了所有场景。关键词向量图谱混合检索已经是主流项目的共识。4. 评估体系从感觉还行到指标说话Ragas、DSPy 的崛起说明RAG 不能只靠人肉体验评估自动化评测持续优化才是工程化正道。七、WeKnora 在榜单中的位置维度WeKnora 的位置Stars (~15k)中等但增长快腾讯 2025 年底开源RAG 引擎排名第二梯队头部与 QAnything 同级独特优势混合检索三合一、ReACT Agent、腾讯生态微信对话开放平台与其他项目差异Go 语言后端性能、MCP 工具集成、多租户一句话WeKnora 不是 star 最多的但在企业级 RAG Agent这个交叉领域功能完整度能打。特别是你同时用 OpenClaw Hermes 的场景WeKnora 的 MCP 集成和 API 优先设计对接成本最低。

相关新闻

3分钟快速上手：R3nzSkin国服换肤神器完全指南

Layerdivider：AI智能分层工具完整指南 - 快速将单张图片转为分层PSD

ChatGPT+VS Code+GitHub Copilot三体协同工作流：一套私密配置模板，助你日均节省2.4小时重复编码

AI时代工程师的核心价值：从写代码到定义问题

Claude 3.5架构升级：请求编排器层的零成本蒸发

KMS智能激活脚本：一键解决Windows和Office激活的终极方案

Tree-GRPO：面向AI Agent的树状策略优化范式

LDA主题建模在医学文献风险识别中的实战方法论

CyberChef：浏览器端数据处理的模块化架构解析

状态机——SpringStateMachine嵌套状态流转

终极Windows 11优化指南：如何用开源工具彻底清理系统冗余

利用TaoToken模型广场为不同文本处理任务选择性价比最优模型

基于CircuitPython与运动传感器的智能LED滑雪板灯光系统全解析

app扫描wifi的时候需要打开GPS定位----否则扫不到

使用辅助权限登录wifi

从stress到stress-ng：一文搞懂Linux压力测试工具怎么选？实战对比CPU/内存/磁盘压测效果

从TTL到eDP：嵌入式工程师选屏接口的实战避坑指南（附信号实测对比）

实测 Taotoken 多模型路由的响应延迟与稳定性体感