过去一段时间一直在各种项目里断断续续跟 RAG 打交道。从最开始“把文档切一切、向量化、检索出来”这个最基础的流程到后来接触多路召回、查询翻译、查询路由、自我纠正这类技巧踩过不少坑也逐渐摸清楚了这个领域的一些技术脉络。最近我把相关内容重新整理了一遍先挖个坑后面再慢慢填。这里先聊一个相对大的框架。01先说背景RAG 到底是什么RAG 的全称是 Retrieval Augmented Generation也就是检索增强生成。名字其实已经把核心说得很直白了不是只靠模型自己生成而是先检索再生成。前面的阶段是 数据处理和存储核心是把 LLM 的内在参数化知识和外部非参数化知识结合起来。如果再拆细一点我理解的 RAG 不只是“查一下资料然后回答”这么简单它至少包含这样几个阶段数据处理数据存储信息检索上下文增强最终生成所以RAG 本质上并不是一个单点技术而是一整套围绕“信息怎么被找到、怎么被组织、怎么被送进模型”的方法论。02“RAG 已死”最近这段时间“RAG 已死”这种说法时不时就会冒出来。但如果把 RAG 理解得稍微广义一点这个判断其实并不成立。凡是跟 context builder 相关、凡是为模型构建有效上下文的信息系统我都倾向于把它放进 RAG 这个大框架里看。比如现在 Agent 体系里常见的 memory、session history、user profile、skill甚至一些更偏个性化和状态化的上下文信息本质上都在做同一件事让模型在当前任务里拿到更合适的信息。从这个角度看RAG 没死它只是早就不再局限于“知识库检索”这一个小盒子里了。准确地说它在扩边界也在长系统。03RAG 与 Agent本质上是“知”与“行”比喻一下RAG 是“知”Agent 是“行”。知者行之始行者知之成。RAG 解决的是“知识从哪里来”的问题。它负责把正确的信息、合适的信息、此时此刻需要的信息拉到上下文里。Agent 解决的是“行动如何发生”的问题。它面对的是一个不确定环境需要持续做决策、调用工具、推进状态直到目标达成或者确认这件事当前无法达成。所以两者在架构上其实是互补关系。没有“知”“行”的效果会大打折扣。一个不会查、不会补充上下文、不会更新认知的 Agent执行能力再强也容易在错误信息上越跑越远。反过来RAG 也不只是一个被动模块。纯 RAG 更像是“你问我答”但放进 Agent 体系里之后它会变成一种主动能力也就是 Agent 会自己判断什么时候该查、查什么、查到了怎么处理、是否还需要继续查。所以我更愿意把它们理解成一句话RAG 提供知识能力Agent 提供决策与执行能力。分开看都能成立合起来才更像一个完整系统。04下一阶段RAG 和 Agent 可能会怎么演进如果继续往下看我觉得 AI 下一阶段的演进未必只是“参数更大、速度更快”而是会越来越像一个真正意义上的数字大脑甚至数字社会。RAG 的演进方向下一阶段的 RAG不会只是“检索几段资料塞进上下文”这么朴素它更可能演化成大模型的外部记忆系统。像人脑一样它会逐步具备短期记忆、长期记忆、情境记忆甚至某种程度上的遗忘机制。它不只是回答前查一下资料而是会持续吸收用户历史、任务过程、环境变化和多模态信息然后自动判断什么该记住什么该压缩什么该淘汰最后沉淀成一个会成长的知识底座。Agent 的演进方向Agent 也不会长期停留在今天这种“执行器”的形态。它更可能往多 Agent 协作的方向发展变得像一个数字组织彼此之间通过分工、协商、博弈和复盘形成群体智能。到了那一步真正有价值的可能就不再是某一个超级模型单打独斗而是“模型 记忆 工具 多 Agent 协作”组成的完整智能系统。再发挥一点想象力可能会形成一种持续在线、持续学习、持续行动的数字生命体雏形。它既像大脑也像团队既会调用知识也会积累经验甚至会通过模拟、试错和“做梦式推演”提前预演未来的行动路径。到那时候AI 的核心竞争力可能就不是“谁更会回答问题”而是“谁更像人类大脑谁更像人类社会谁更能在复杂环境中长期稳定地自主运转”实实在在的创造价值。想象力再大一点目前的 RAG 只是把外部数据“喂”给模型像是一个人在考试前翻书。未来的演进方向可能是“数字基因重组”。到时候AI 不再需要实时检索而是将获取的关键知识像“基因编辑”一样直接通过梯度更新或权重修正 内化 到自己的神经网络参数中。它不再是“查阅资料”而是真正地“学会了”。就像你学会了骑自行车你不需要回忆“教程”你的身体模型参数本身就是知识的载体。未来的 AI 将具备“瞬时进化”的能力——读完一本量子力学著作它的“大脑结构”就物理性地改变了成为了一个量子力学专家而不是一个拿着书的普通人。05写在最后过去这段时间研究 RAG 下来我最大的感受是RAG 不是一个固定的技术点而是一个持续演进的思想。它的核心始终没有变就是把 LLM 的内在参数化知识和外部非参数化知识结合起来。只要这个需求还在无论外面再叠加多少模块比如查询转换、多路召回、自我修正甚至未来更复杂的记忆机制和协作机制它本质上都还是在这个框架下继续演进。所以与其急着讨论“RAG 死没死”不如先想清楚一件事我们到底还需不需要让模型更好地获得信息、组织信息、使用信息。只要这个问题的答案还是“需要”那 RAG 就不会消失。它只会继续升级而且大概率会以一种比今天更大、更深、更像智能系统基础设施的方式存在下去。这里给大家精心整理了一份全面的AI大模型学习资源包括AI大模型全套学习路线图从入门到实战、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等资料免费分享扫码免费领取全部内容1. 成长路线图学习规划要学习一门新的技术作为新手一定要先学习成长路线图方向不对努力白费。这里我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。2. 大模型经典PDF书籍书籍和学习文档资料是学习大模型过程中必不可少的我们精选了一系列深入探讨大模型技术的书籍和学习文档它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。书籍含电子版PDF3. 大模型视频教程对于很多自学或者没有基础的同学来说书籍这些纯文字类的学习教材会觉得比较晦涩难以理解因此我们提供了丰富的大模型视频教程以动态、形象的方式展示技术概念帮助你更快、更轻松地掌握核心知识。4. 2026行业报告行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5. 大模型项目实战学以致用当你的理论知识积累到一定程度就需要通过项目实战在实际操作中检验和巩固你所学到的知识同时为你找工作和职业发展打下坚实的基础。6. 大模型面试题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我们将提供精心整理的大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。7. 资料领取全套内容免费抱走学 AI 不用再找第二份不管你是 0 基础想入门 AI 大模型还是有基础想冲刺大厂、了解行业趋势这份资料都能满足你现在只需按照提示操作就能免费领取扫码免费领取全部内容
浅谈 RAG(RAG 已死?)
过去一段时间一直在各种项目里断断续续跟 RAG 打交道。从最开始“把文档切一切、向量化、检索出来”这个最基础的流程到后来接触多路召回、查询翻译、查询路由、自我纠正这类技巧踩过不少坑也逐渐摸清楚了这个领域的一些技术脉络。最近我把相关内容重新整理了一遍先挖个坑后面再慢慢填。这里先聊一个相对大的框架。01先说背景RAG 到底是什么RAG 的全称是 Retrieval Augmented Generation也就是检索增强生成。名字其实已经把核心说得很直白了不是只靠模型自己生成而是先检索再生成。前面的阶段是 数据处理和存储核心是把 LLM 的内在参数化知识和外部非参数化知识结合起来。如果再拆细一点我理解的 RAG 不只是“查一下资料然后回答”这么简单它至少包含这样几个阶段数据处理数据存储信息检索上下文增强最终生成所以RAG 本质上并不是一个单点技术而是一整套围绕“信息怎么被找到、怎么被组织、怎么被送进模型”的方法论。02“RAG 已死”最近这段时间“RAG 已死”这种说法时不时就会冒出来。但如果把 RAG 理解得稍微广义一点这个判断其实并不成立。凡是跟 context builder 相关、凡是为模型构建有效上下文的信息系统我都倾向于把它放进 RAG 这个大框架里看。比如现在 Agent 体系里常见的 memory、session history、user profile、skill甚至一些更偏个性化和状态化的上下文信息本质上都在做同一件事让模型在当前任务里拿到更合适的信息。从这个角度看RAG 没死它只是早就不再局限于“知识库检索”这一个小盒子里了。准确地说它在扩边界也在长系统。03RAG 与 Agent本质上是“知”与“行”比喻一下RAG 是“知”Agent 是“行”。知者行之始行者知之成。RAG 解决的是“知识从哪里来”的问题。它负责把正确的信息、合适的信息、此时此刻需要的信息拉到上下文里。Agent 解决的是“行动如何发生”的问题。它面对的是一个不确定环境需要持续做决策、调用工具、推进状态直到目标达成或者确认这件事当前无法达成。所以两者在架构上其实是互补关系。没有“知”“行”的效果会大打折扣。一个不会查、不会补充上下文、不会更新认知的 Agent执行能力再强也容易在错误信息上越跑越远。反过来RAG 也不只是一个被动模块。纯 RAG 更像是“你问我答”但放进 Agent 体系里之后它会变成一种主动能力也就是 Agent 会自己判断什么时候该查、查什么、查到了怎么处理、是否还需要继续查。所以我更愿意把它们理解成一句话RAG 提供知识能力Agent 提供决策与执行能力。分开看都能成立合起来才更像一个完整系统。04下一阶段RAG 和 Agent 可能会怎么演进如果继续往下看我觉得 AI 下一阶段的演进未必只是“参数更大、速度更快”而是会越来越像一个真正意义上的数字大脑甚至数字社会。RAG 的演进方向下一阶段的 RAG不会只是“检索几段资料塞进上下文”这么朴素它更可能演化成大模型的外部记忆系统。像人脑一样它会逐步具备短期记忆、长期记忆、情境记忆甚至某种程度上的遗忘机制。它不只是回答前查一下资料而是会持续吸收用户历史、任务过程、环境变化和多模态信息然后自动判断什么该记住什么该压缩什么该淘汰最后沉淀成一个会成长的知识底座。Agent 的演进方向Agent 也不会长期停留在今天这种“执行器”的形态。它更可能往多 Agent 协作的方向发展变得像一个数字组织彼此之间通过分工、协商、博弈和复盘形成群体智能。到了那一步真正有价值的可能就不再是某一个超级模型单打独斗而是“模型 记忆 工具 多 Agent 协作”组成的完整智能系统。再发挥一点想象力可能会形成一种持续在线、持续学习、持续行动的数字生命体雏形。它既像大脑也像团队既会调用知识也会积累经验甚至会通过模拟、试错和“做梦式推演”提前预演未来的行动路径。到那时候AI 的核心竞争力可能就不是“谁更会回答问题”而是“谁更像人类大脑谁更像人类社会谁更能在复杂环境中长期稳定地自主运转”实实在在的创造价值。想象力再大一点目前的 RAG 只是把外部数据“喂”给模型像是一个人在考试前翻书。未来的演进方向可能是“数字基因重组”。到时候AI 不再需要实时检索而是将获取的关键知识像“基因编辑”一样直接通过梯度更新或权重修正 内化 到自己的神经网络参数中。它不再是“查阅资料”而是真正地“学会了”。就像你学会了骑自行车你不需要回忆“教程”你的身体模型参数本身就是知识的载体。未来的 AI 将具备“瞬时进化”的能力——读完一本量子力学著作它的“大脑结构”就物理性地改变了成为了一个量子力学专家而不是一个拿着书的普通人。05写在最后过去这段时间研究 RAG 下来我最大的感受是RAG 不是一个固定的技术点而是一个持续演进的思想。它的核心始终没有变就是把 LLM 的内在参数化知识和外部非参数化知识结合起来。只要这个需求还在无论外面再叠加多少模块比如查询转换、多路召回、自我修正甚至未来更复杂的记忆机制和协作机制它本质上都还是在这个框架下继续演进。所以与其急着讨论“RAG 死没死”不如先想清楚一件事我们到底还需不需要让模型更好地获得信息、组织信息、使用信息。只要这个问题的答案还是“需要”那 RAG 就不会消失。它只会继续升级而且大概率会以一种比今天更大、更深、更像智能系统基础设施的方式存在下去。这里给大家精心整理了一份全面的AI大模型学习资源包括AI大模型全套学习路线图从入门到实战、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等资料免费分享扫码免费领取全部内容1. 成长路线图学习规划要学习一门新的技术作为新手一定要先学习成长路线图方向不对努力白费。这里我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。2. 大模型经典PDF书籍书籍和学习文档资料是学习大模型过程中必不可少的我们精选了一系列深入探讨大模型技术的书籍和学习文档它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。书籍含电子版PDF3. 大模型视频教程对于很多自学或者没有基础的同学来说书籍这些纯文字类的学习教材会觉得比较晦涩难以理解因此我们提供了丰富的大模型视频教程以动态、形象的方式展示技术概念帮助你更快、更轻松地掌握核心知识。4. 2026行业报告行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5. 大模型项目实战学以致用当你的理论知识积累到一定程度就需要通过项目实战在实际操作中检验和巩固你所学到的知识同时为你找工作和职业发展打下坚实的基础。6. 大模型面试题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我们将提供精心整理的大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。7. 资料领取全套内容免费抱走学 AI 不用再找第二份不管你是 0 基础想入门 AI 大模型还是有基础想冲刺大厂、了解行业趋势这份资料都能满足你现在只需按照提示操作就能免费领取扫码免费领取全部内容