Day21理论篇从大模型 “睁眼说瞎话” 到精准靠谱RAG 入门保姆级教程看完直接写进简历你是不是被大模型的 “嘴” 坑过相信所有用过 AI 大模型的朋友都踩过这些坑问公司内部的报销新规、项目资料它要么说 “我没有相关信息”要么瞎编一套看似合理的规则问 2026 年最新的政策、刚发布的行业数据它给你甩个 2024 年的过时内容更坑的是你问一个它不懂的问题它为了 “面子”能给你编得有鼻子有眼连参考文献都能瞎造这就是大名鼎鼎的大模型幻觉我之前就被坑过用本地部署的 Deepseek-R1 问我们部门上周的项目复盘结论它给我编了 3 条完全不存在的优化建议差点让我在周会上社死。那有没有办法让大模型 “闭嘴别瞎编先查资料再说话”有这就是我们今天要学的RAG检索增强生成堪称大模型的 “防瞎编神器”也是目前企业 AI 落地最火、最实用的技术没有之一。一句话讲透 RAG 的核心逻辑先给大家一个能直接记在笔记里的定义RAG 检索 增强生成本质就是给大模型配了一个专属的实时资料库 智能检索员强制大模型回答问题前先查资料再基于资料回答从根源上解决幻觉、时效性差、无法使用私有数据的三大痛点。给大家一个超通俗的类比保证你一辈子忘不掉我们可以把大模型比作一个刚毕业的 985 学霸脑子很聪明会说话通用知识储备拉满但它有三个致命缺陷知识截止到毕业那天大模型的训练数据有截止时间之后的新东西一概不知道只学了通用课本你们公司的内部制度、项目资料、你的私人笔记它完全没接触过死要面子不懂也不会说 “我不知道”只会硬着头皮瞎编幻觉本幻而 RAG就是给这个学霸配了三个神器一个可以随时更新的专属资料库你的私有文档、最新政策、行业数据一个超级智能的检索员1 秒内从几万份资料里找到和问题最相关的内容一个铁律回答问题必须基于检索到的资料资料里没有的就老实说 “我不知道”不许瞎编你看这么一改造原本只会瞎编的学霸瞬间变成了精准靠谱的专属助理不管是通义千问、Deepseek 这种在线大模型还是你本地部署的开源大模型都能靠 RAG 实现质的飞跃。保姆级拆解RAG 全流程 5 步走看完就懂很多新手一看到 RAG 的流程图就头大别慌我把它拆成了 5 个大白话步骤每一步都配了真实案例哪怕你是零基础也能看懂。第一步文档预处理 —— 给你的资料 “洗个澡”拆成小卡片我们手里的资料五花八门PDF、Word、Excel、录音转写的文字甚至是网页内容里面还有很多没用的页眉页脚、乱码、多余换行大模型根本没法直接用。预处理的核心就是把杂乱的文档拆成一小块一小块的 “文本块Chunk”就像把一本厚书拆成一页一页的小卡片每一张卡片只讲一个小主题。举个例子你把公司 2026 年 3 月的报销新规 PDF拆成了 10 个文本块每个块 300-500 字分别对应 “差旅住宿标准”“打车报销规则”“餐饮报销上限” 等主题。第二步向量化Embedding—— 给每个小卡片办一张 “智能身份证”这是 RAG 最核心的一步也是很多新手卡壳的地方其实非常好理解计算机看不懂文字但是看得懂数字所以我们要把每一块文本转换成一串数字也就是向量这个向量就代表了这段文本的核心语义相当于给每个小卡片办了一张 “智能身份证”。这个 “身份证” 有多智能比如 “上海出差住宿一天最多报 500 元” 这个文本块转换成向量后它和 “去上海住酒店报销标准”“一线城市出差住宿上限” 这些问题的向量距离会非常近但和 “餐饮报销能报多少” 的向量距离就会很远。第三步向量存储 —— 把卡片和身份证放进 “智能文件柜”转换好的向量不能随便丢在文件夹里要放进专门的向量数据库比如 Chroma、Milvus、PGVector这个数据库就相当于一个智能文件柜。这个文件柜的厉害之处在于你给它一个问题的向量它能在几毫秒内从几十万甚至几百万个文本块里找到和这个问题向量最接近的几个文本块也就是和问题最相关的资料。还是拿报销新规举例子你把 10 个文本块的向量和对应的原文都存进了 Chroma 数据库你的专属智能文件柜就建好了后续不管用什么大模型都能来这里查资料。第四步检索 —— 用户提问先去文件柜找相关资料当用户问一个问题比如 “我去上海出差住酒店一天能报多少钱”我们要做的第一件事不是直接把问题丢给大模型而是用和之前完全一样的 Embedding 模型把用户的问题也转换成向量拿着这个问题向量去向量数据库里做相似度检索找到最相关的 3-5 个文本块把这些文本块的原文作为 “参考资料” 提取出来这一步就相当于你让检索员先去文件柜里把和用户问题相关的资料都找出来放在大模型面前不许它瞎编。第五步增强生成 —— 拿着资料让大模型老实回答这是最后一步也是最爽的一步我们把检索到的参考资料 用户的问题 严格的规则打包成一个 Prompt喂给大模型强制它只能基于资料回答。给大家一个万能 Prompt 模板通义千问、Deepseek、本地大模型都能用复制就能跑你是一个专业、严谨的答疑助手必须严格基于以下提供的参考资料回答用户的问题。 规则 1. 答案只能来自参考资料绝对不允许编造参考资料里没有的信息 2. 如果参考资料里没有和问题相关的内容直接回答“抱歉参考资料中没有相关内容无法为你解答”不许瞎编 3. 回答要简洁清晰符合用户的问题场景 参考资料 {{这里放你检索到的相关文本块内容}} 用户问题{{这里放用户的提问}}还是拿报销的例子我们把检索到的 “上海属于一线城市住宿报销上限 500 元 / 天” 放进参考资料再把 Prompt 喂给大模型通义千问、Deepseek 会精准回答“根据公司 2026 年 3 月的报销新规上海属于一线城市出差住宿报销上限为 500 元 / 天。”哪怕是你本地部署的 7B 小参数模型也能给出完全准确的回答绝对不会瞎编。你看这就是 RAG 的完整流程没有任何复杂的公式逻辑非常清晰。有图有真相纯大模型 VS RAG 问答对比案例直接抄进笔记光说不练假把式我给大家整理了 3 个最常见的场景用通义千问、Deepseek、本地大模型做了真实对比看完你就知道 RAG 的威力有多大。场景 1私有数据场景公司内部资料用户问题我们公司 2026 年 3 月的报销新规里上海出差住宿一天最多能报多少纯大模型通义千问 / Deepseek / 本地开源模型回答抱歉我无法获取您公司的内部报销新规信息建议您咨询公司的行政或财务部门获取准确内容。部分大模型还会瞎编“一般公司上海出差住宿报销上限是 300-400 元 / 天具体以您公司规定为准”看似合理实则完全没用RAG 增强后的大模型回答根据您公司 2026 年 3 月最新发布的报销新规上海属于一线城市出差住宿报销上限为 500 元 / 天超出部分需个人自行承担。精准、有依据完全符合需求场景 2时效性场景最新政策数据用户问题2026 年 3 月最新的 1 年期 LPR 利率是多少纯大模型训练数据截止 2025 年回答2025 年 12 月公布的 1 年期 LPR 为 3.45%5 年期以上 LPR 为 4.2%。完全过时信息错误RAG 增强后的大模型提前存入 2026 年 3 月央行最新公告回答根据中国人民银行 2026 年 3 月 20 日公布的最新贷款市场报价利率LPR1 年期 LPR 为 3.2%5 年期以上 LPR 为 3.95%。最新、准确完全解决时效性问题场景 3防幻觉场景知识纠错用户问题《红楼梦》里林黛玉写的《蜀道难》的核心思想是什么纯大模型回答林黛玉在《红楼梦》中写的《蜀道难》以蜀道的艰险隐喻自己身世的坎坷表达了寄人篱下的苦闷与对自由的向往是其代表作之一。纯纯瞎编《蜀道难》是李白的林黛玉根本没写过RAG 增强后的大模型提前存入《红楼梦》全本 唐诗三百首回答参考资料中没有《红楼梦》里林黛玉创作《蜀道难》的相关内容《蜀道难》是唐代诗人李白的代表作《红楼梦》中林黛玉的经典诗作有《葬花吟》《秋窗风雨夕》等。直接纠正错误绝不瞎编靠谱度拉满RAG 到底能用在哪学会了直接做项目涨工资很多新手会问我学会了 RAG能做什么我可以很负责任地说RAG 是目前 AI 落地最广的技术几乎所有企业的 AI 应用都离不开 RAG学会了这些场景不管是做副业、做项目还是写进简历涨工资都是绝对的加分项企业内部知识库问答机器人给公司做个专属答疑机器人新员工问制度、问流程、问项目资料都能精准回答不用天天找 HR、找老员工智能客服把产品手册、售后规则、常见问题放进知识库客服机器人就能精准回答用户问题减少客诉降低人工成本个人学习助手把考研资料、考公教材、编程教程放进知识库随时提问精准定位知识点不会被大模型的瞎编内容带偏专业领域助手把最新的法条、医学指南、行业规范放进知识库辅助律师、医生、工程师精准查询避免用过时的内容实时资讯问答把每天的新闻、政策更新放进知识库大模型就能回答最新的事件再也不会给你过时的信息新手入门避坑指南我踩过的 5 个坑你别再踩了别上来就搞复杂的先跑通最小 Demo先拿一个小的 txt 文档跑通 “分块→向量化→存储→检索→生成” 的全流程再搞复杂的 PDF、多文档、多模态内容Embedding 模型要选对中文场景优先选国内的中文嵌入模型比如通义千问 Embedding、bge 系列别用国外的英文模型效果差很多别迷信大模型参数越大越好RAG 场景下哪怕是 7B 的本地 Deepseek 模型配合好的检索效果比 100B 的纯大模型还要准Prompt 规则要写死一定要在 Prompt 里明确告诉大模型 “只能用参考资料回答不许编造”不然它还是会忍不住瞎编检索结果不是越多越好一般选 3-5 个最相关的文本块就够了放太多无关内容反而会干扰大模型的回答出现 “信息过载”结尾RAG 的魅力就在于它不需要你会训练大模型不需要你有几百万的显卡只要你懂基础的 Python就能跑通一个属于自己的 RAG 应用让原本 “满嘴跑火车” 的大模型变成精准靠谱的专属助理。
Day21:(理论篇)从大模型 “睁眼说瞎话” 到精准靠谱:RAG 入门保姆级教程,看完直接写进简历!
Day21理论篇从大模型 “睁眼说瞎话” 到精准靠谱RAG 入门保姆级教程看完直接写进简历你是不是被大模型的 “嘴” 坑过相信所有用过 AI 大模型的朋友都踩过这些坑问公司内部的报销新规、项目资料它要么说 “我没有相关信息”要么瞎编一套看似合理的规则问 2026 年最新的政策、刚发布的行业数据它给你甩个 2024 年的过时内容更坑的是你问一个它不懂的问题它为了 “面子”能给你编得有鼻子有眼连参考文献都能瞎造这就是大名鼎鼎的大模型幻觉我之前就被坑过用本地部署的 Deepseek-R1 问我们部门上周的项目复盘结论它给我编了 3 条完全不存在的优化建议差点让我在周会上社死。那有没有办法让大模型 “闭嘴别瞎编先查资料再说话”有这就是我们今天要学的RAG检索增强生成堪称大模型的 “防瞎编神器”也是目前企业 AI 落地最火、最实用的技术没有之一。一句话讲透 RAG 的核心逻辑先给大家一个能直接记在笔记里的定义RAG 检索 增强生成本质就是给大模型配了一个专属的实时资料库 智能检索员强制大模型回答问题前先查资料再基于资料回答从根源上解决幻觉、时效性差、无法使用私有数据的三大痛点。给大家一个超通俗的类比保证你一辈子忘不掉我们可以把大模型比作一个刚毕业的 985 学霸脑子很聪明会说话通用知识储备拉满但它有三个致命缺陷知识截止到毕业那天大模型的训练数据有截止时间之后的新东西一概不知道只学了通用课本你们公司的内部制度、项目资料、你的私人笔记它完全没接触过死要面子不懂也不会说 “我不知道”只会硬着头皮瞎编幻觉本幻而 RAG就是给这个学霸配了三个神器一个可以随时更新的专属资料库你的私有文档、最新政策、行业数据一个超级智能的检索员1 秒内从几万份资料里找到和问题最相关的内容一个铁律回答问题必须基于检索到的资料资料里没有的就老实说 “我不知道”不许瞎编你看这么一改造原本只会瞎编的学霸瞬间变成了精准靠谱的专属助理不管是通义千问、Deepseek 这种在线大模型还是你本地部署的开源大模型都能靠 RAG 实现质的飞跃。保姆级拆解RAG 全流程 5 步走看完就懂很多新手一看到 RAG 的流程图就头大别慌我把它拆成了 5 个大白话步骤每一步都配了真实案例哪怕你是零基础也能看懂。第一步文档预处理 —— 给你的资料 “洗个澡”拆成小卡片我们手里的资料五花八门PDF、Word、Excel、录音转写的文字甚至是网页内容里面还有很多没用的页眉页脚、乱码、多余换行大模型根本没法直接用。预处理的核心就是把杂乱的文档拆成一小块一小块的 “文本块Chunk”就像把一本厚书拆成一页一页的小卡片每一张卡片只讲一个小主题。举个例子你把公司 2026 年 3 月的报销新规 PDF拆成了 10 个文本块每个块 300-500 字分别对应 “差旅住宿标准”“打车报销规则”“餐饮报销上限” 等主题。第二步向量化Embedding—— 给每个小卡片办一张 “智能身份证”这是 RAG 最核心的一步也是很多新手卡壳的地方其实非常好理解计算机看不懂文字但是看得懂数字所以我们要把每一块文本转换成一串数字也就是向量这个向量就代表了这段文本的核心语义相当于给每个小卡片办了一张 “智能身份证”。这个 “身份证” 有多智能比如 “上海出差住宿一天最多报 500 元” 这个文本块转换成向量后它和 “去上海住酒店报销标准”“一线城市出差住宿上限” 这些问题的向量距离会非常近但和 “餐饮报销能报多少” 的向量距离就会很远。第三步向量存储 —— 把卡片和身份证放进 “智能文件柜”转换好的向量不能随便丢在文件夹里要放进专门的向量数据库比如 Chroma、Milvus、PGVector这个数据库就相当于一个智能文件柜。这个文件柜的厉害之处在于你给它一个问题的向量它能在几毫秒内从几十万甚至几百万个文本块里找到和这个问题向量最接近的几个文本块也就是和问题最相关的资料。还是拿报销新规举例子你把 10 个文本块的向量和对应的原文都存进了 Chroma 数据库你的专属智能文件柜就建好了后续不管用什么大模型都能来这里查资料。第四步检索 —— 用户提问先去文件柜找相关资料当用户问一个问题比如 “我去上海出差住酒店一天能报多少钱”我们要做的第一件事不是直接把问题丢给大模型而是用和之前完全一样的 Embedding 模型把用户的问题也转换成向量拿着这个问题向量去向量数据库里做相似度检索找到最相关的 3-5 个文本块把这些文本块的原文作为 “参考资料” 提取出来这一步就相当于你让检索员先去文件柜里把和用户问题相关的资料都找出来放在大模型面前不许它瞎编。第五步增强生成 —— 拿着资料让大模型老实回答这是最后一步也是最爽的一步我们把检索到的参考资料 用户的问题 严格的规则打包成一个 Prompt喂给大模型强制它只能基于资料回答。给大家一个万能 Prompt 模板通义千问、Deepseek、本地大模型都能用复制就能跑你是一个专业、严谨的答疑助手必须严格基于以下提供的参考资料回答用户的问题。 规则 1. 答案只能来自参考资料绝对不允许编造参考资料里没有的信息 2. 如果参考资料里没有和问题相关的内容直接回答“抱歉参考资料中没有相关内容无法为你解答”不许瞎编 3. 回答要简洁清晰符合用户的问题场景 参考资料 {{这里放你检索到的相关文本块内容}} 用户问题{{这里放用户的提问}}还是拿报销的例子我们把检索到的 “上海属于一线城市住宿报销上限 500 元 / 天” 放进参考资料再把 Prompt 喂给大模型通义千问、Deepseek 会精准回答“根据公司 2026 年 3 月的报销新规上海属于一线城市出差住宿报销上限为 500 元 / 天。”哪怕是你本地部署的 7B 小参数模型也能给出完全准确的回答绝对不会瞎编。你看这就是 RAG 的完整流程没有任何复杂的公式逻辑非常清晰。有图有真相纯大模型 VS RAG 问答对比案例直接抄进笔记光说不练假把式我给大家整理了 3 个最常见的场景用通义千问、Deepseek、本地大模型做了真实对比看完你就知道 RAG 的威力有多大。场景 1私有数据场景公司内部资料用户问题我们公司 2026 年 3 月的报销新规里上海出差住宿一天最多能报多少纯大模型通义千问 / Deepseek / 本地开源模型回答抱歉我无法获取您公司的内部报销新规信息建议您咨询公司的行政或财务部门获取准确内容。部分大模型还会瞎编“一般公司上海出差住宿报销上限是 300-400 元 / 天具体以您公司规定为准”看似合理实则完全没用RAG 增强后的大模型回答根据您公司 2026 年 3 月最新发布的报销新规上海属于一线城市出差住宿报销上限为 500 元 / 天超出部分需个人自行承担。精准、有依据完全符合需求场景 2时效性场景最新政策数据用户问题2026 年 3 月最新的 1 年期 LPR 利率是多少纯大模型训练数据截止 2025 年回答2025 年 12 月公布的 1 年期 LPR 为 3.45%5 年期以上 LPR 为 4.2%。完全过时信息错误RAG 增强后的大模型提前存入 2026 年 3 月央行最新公告回答根据中国人民银行 2026 年 3 月 20 日公布的最新贷款市场报价利率LPR1 年期 LPR 为 3.2%5 年期以上 LPR 为 3.95%。最新、准确完全解决时效性问题场景 3防幻觉场景知识纠错用户问题《红楼梦》里林黛玉写的《蜀道难》的核心思想是什么纯大模型回答林黛玉在《红楼梦》中写的《蜀道难》以蜀道的艰险隐喻自己身世的坎坷表达了寄人篱下的苦闷与对自由的向往是其代表作之一。纯纯瞎编《蜀道难》是李白的林黛玉根本没写过RAG 增强后的大模型提前存入《红楼梦》全本 唐诗三百首回答参考资料中没有《红楼梦》里林黛玉创作《蜀道难》的相关内容《蜀道难》是唐代诗人李白的代表作《红楼梦》中林黛玉的经典诗作有《葬花吟》《秋窗风雨夕》等。直接纠正错误绝不瞎编靠谱度拉满RAG 到底能用在哪学会了直接做项目涨工资很多新手会问我学会了 RAG能做什么我可以很负责任地说RAG 是目前 AI 落地最广的技术几乎所有企业的 AI 应用都离不开 RAG学会了这些场景不管是做副业、做项目还是写进简历涨工资都是绝对的加分项企业内部知识库问答机器人给公司做个专属答疑机器人新员工问制度、问流程、问项目资料都能精准回答不用天天找 HR、找老员工智能客服把产品手册、售后规则、常见问题放进知识库客服机器人就能精准回答用户问题减少客诉降低人工成本个人学习助手把考研资料、考公教材、编程教程放进知识库随时提问精准定位知识点不会被大模型的瞎编内容带偏专业领域助手把最新的法条、医学指南、行业规范放进知识库辅助律师、医生、工程师精准查询避免用过时的内容实时资讯问答把每天的新闻、政策更新放进知识库大模型就能回答最新的事件再也不会给你过时的信息新手入门避坑指南我踩过的 5 个坑你别再踩了别上来就搞复杂的先跑通最小 Demo先拿一个小的 txt 文档跑通 “分块→向量化→存储→检索→生成” 的全流程再搞复杂的 PDF、多文档、多模态内容Embedding 模型要选对中文场景优先选国内的中文嵌入模型比如通义千问 Embedding、bge 系列别用国外的英文模型效果差很多别迷信大模型参数越大越好RAG 场景下哪怕是 7B 的本地 Deepseek 模型配合好的检索效果比 100B 的纯大模型还要准Prompt 规则要写死一定要在 Prompt 里明确告诉大模型 “只能用参考资料回答不许编造”不然它还是会忍不住瞎编检索结果不是越多越好一般选 3-5 个最相关的文本块就够了放太多无关内容反而会干扰大模型的回答出现 “信息过载”结尾RAG 的魅力就在于它不需要你会训练大模型不需要你有几百万的显卡只要你懂基础的 Python就能跑通一个属于自己的 RAG 应用让原本 “满嘴跑火车” 的大模型变成精准靠谱的专属助理。