Agent 基础概念一、什么是 AI Agent智能体1. 通俗定义2. 核心区别3. 核心价值二、AI Agent 五大核心组件标准架构1. 大模型 LLM大脑2. 记忆 Memory记忆系统3. 工具 Tools手脚4. 规划与行动 Planning Acting执行逻辑5. 反思与观察 Reflection Observation闭环三、Agent 标准工作流程四、主流 Agent 运行范式两类经典架构1. ReAct 范式最主流、入门首选2. Plan-and-Execute 范式规划-执行五、Agent 分类按能力/场景划分1. 按能力复杂度2. 按应用场景六、Agent 核心优势 现存局限优势局限生产环境必须注意生产优化方案七、LangChain 基础 Agent 入门实战1. 安装依赖2. 完整代码3. 代码说明4. 运行日志解读八、Agent 与 RAG、Workflow 的区别1. Workflow固定工作流2. RAG检索增强生成3. Agent智能体一、什么是 AI Agent智能体1. 通俗定义传统大模型被动应答你问一句、它答一句能力局限在自身训练知识不会主动思考、不会调用外部工具、不会分步解决复杂问题。AI Agent智能体具备自主规划、思考、决策、工具调用、循环执行、自我纠错能力的大模型应用。简单总结能自己拆解任务、自己选工具、自己一步步完成目标的 AI。2. 核心区别普通对话大模型AI Agent被动接收指令单次输出主动思考、分步执行、循环迭代无法使用外部工具搜索/计算/查库内置工具系统可灵活调用外部能力复杂任务容易逻辑断裂任务拆解、规划、复盘完成长链路任务无记忆/行动记录完整行动轨迹、上下文记忆3. 核心价值突破大模型上下文限制、知识截止、能力单一三大短板落地自动化任务自动办公、智能客服、数据分析、网络搜索、机器人流程等。二、AI Agent 五大核心组件标准架构主流 AgentLangChain、AutoGPT、Dify均由这 5 部分组成是理解 Agent 的关键。1. 大模型 LLM大脑角色决策中心负责思考、判断、推理、生成指令。工作分析用户目标、判断下一步该做什么、解析工具返回结果、生成最终答案。选型通用对话模型即可GPT、GLM、通义、Qwen 等。2. 记忆 Memory记忆系统Agent 的“短期/长期记忆”区分两类短期记忆对话历史、每一步行动记录保证上下文连贯不会忘记前面做了什么。长期记忆知识库、用户偏好、历史任务记录一般对接向量数据库Chroma/FAISS。常见实现ConversationBufferMemory、VectorStoreRetrieverMemory。3. 工具 Tools手脚Agent 能力的延伸LLM 本身做不到的事交给工具完成。常用工具分类信息查询联网搜索、文档检索RAG能力计算计算器、代码解释器操作系统文件读写、接口调用、工单提交交互工具发送消息、调用第三方API核心逻辑LLM 只负责决策工具负责执行。4. 规划与行动 Planning Acting执行逻辑这是 Agent 和普通对话最大的区别规划把复杂大目标拆分成多个可执行小步骤。例目标「整理本周销售数据并统计总额」→ 拆分读取文件 → 提取数据 → 求和计算 → 生成总结。行动按照规划依次调用工具、执行操作。5. 反思与观察 Reflection Observation闭环完整闭环流程执行工具 → 拿到返回结果观察LLM 分析结果任务是否完成是否出错是否需要继续调用工具调整下一步行动反思循环直到任务结束经典闭环思考 → 行动 → 观察 → 再思考三、Agent 标准工作流程以「用户让 Agent 查询今天天气」为例完整流转接收目标用户提问查询北京今日天气记忆加载读取历史对话、相关上下文思考决策LLM自身无实时天气数据需要调用「搜索工具」调用工具发起网络搜索传入参数「北京 今日天气」获取结果观察拿到搜索返回的天气文本反思判断LLM信息完整无需继续调用工具整合输出整理结果回复用户记录记忆保存本次对话与行动日志如果是复杂任务多步骤会重复思考→调用工具→观察循环。四、主流 Agent 运行范式两类经典架构1. ReAct 范式最主流、入门首选Reason Act推理 行动核心理念把「思考过程」和「工具调用动作」显式写出来LLM 交替输出思考内容和执行动作。特点结构简单、易调试、工业界使用最多LangChain 默认 Agent 就是 ReAct。适用绝大多数常规任务、工具调用场景。2. Plan-and-Execute 范式规划-执行先整体规划再分步执行第一步LLM 先把整个任务拆成完整步骤清单第二步Agent 按清单依次执行每一步执行中可动态修正计划特点擅长长链路、复杂多步骤任务如数据分析、项目流程、自动化办公。缺点简单任务会冗余适合复杂场景。入门优先学习ReAct Agent。五、Agent 分类按能力/场景划分1. 按能力复杂度基础工具型 Agent仅调用单个/少量工具单循环执行入门级别例带搜索、计算器的问答助手。复杂多步骤 Agent多工具组合、多轮循环、动态改计划例自动数据分析、自动化运维。自主 Agent高阶无人工干预长期自主运行代表AutoGPT、GPT4o 自主模式。2. 按应用场景问答检索 Agent结合 RAG 搜索智能查资料、解答问题办公自动化 Agent读写文件、表格处理、邮件发送、工单创建数据分析 Agent调用代码解释器做统计、绘图、数据清洗客服 Agent意图识别、自动回复、流转工单对应你之前学的 Workflow六、Agent 核心优势 现存局限优势突破模型知识截止时间通过搜索获取实时信息弥补模型能力短板计算、文件、接口、代码复杂任务自动拆解降低人工操作成本记忆持久化支持连续多轮复杂交互局限生产环境必须注意幻觉传导LLM 决策错误 → 工具调用错误 → 结果错误层层放大循环死锁无限重复调用同一个工具无法终止安全风险工具权限过大时可能误删文件、调用高危接口延迟高多轮思考工具调用响应速度远慢于普通对话生产优化方案限制最大循环轮次防止死循环工具增加权限校验、入参过滤每一步结果做事实校验区分「可信工具」和「高危工具」七、LangChain 基础 Agent 入门实战基于前面学的 LangChain 栈实现一个带计算器、搜索模拟的简易 Agent直观理解组件与流程。1. 安装依赖pipinstalllangchain langchain-openai langchain-community2. 完整代码fromlangchain_openaiimportChatOpenAIfromlangchainimporthubfromlangchain.agentsimportAgentExecutor,create_react_agentfromlangchain.toolsimportCalculatorTool# 内置计算器工具# # 1. 初始化大模型Agent 大脑# llmChatOpenAI(modelgpt-3.5-turbo,temperature0,# 推理类任务设为0保证严谨api_key你的API_KEY,base_url中转地址# 国内使用填写)# # 2. 定义工具Agent 手脚# 这里使用官方内置计算器工具# tools[CalculatorTool()]# # 3. 加载 ReAct 标准提示词模板定义Agent思考规则# prompthub.pull(hwchase17/react)# # 4. 创建 ReAct Agent# agentcreate_react_agent(llm,tools,prompt)# Agent 执行器管理循环、记忆、终止条件agent_executorAgentExecutor(agentagent,toolstools,verboseTrue,# 开启日志查看每一步思考行动学习必开max_iterations5# 限制最大循环次数防止死循环)# # 5. 运行测试# if__name____main__:# 提问需要调用计算器工具的复杂计算question计算 (128 256) * 3 等于多少resultagent_executor.invoke({input:question})print(\n 最终回答 )print(result[output])3. 代码说明temperature0Agent 推理、计算场景必须调低减少随机性。verboseTrue打印每一步思考、工具调用、返回结果是学习 Agent 流程的核心。max_iterations5强制限制循环次数规避死循环。CalculatorTool内置工具模拟「外部能力调用」。4. 运行日志解读你会看到三段关键输出对应 ReAct 流程ThoughtLLM 思考需要使用计算器工具Action决定调用Calculator并传入计算表达式Observation工具返回计算结果Final Answer整合结果输出最终答案八、Agent 与 RAG、Workflow 的区别结合你之前学的内容做对比区分建立完整知识体系1. Workflow固定工作流特点流程预先写死分支、步骤、顺序全部固定没有自主决策。适用标准化、固定流程如你之前做的「自动工单」。2. RAG检索增强生成特点单一链路检索知识库 → 拼接上下文 → 模型回答。核心解决知识幻觉、外部文档问答。无自主规划、无多工具调用。3. Agent智能体特点动态决策、流程不固定自主选择工具、自主拆分任务、循环执行。可融合 RAG / WorkflowAgent 可以把「RAG 检索」当作一个工具调用。进阶组合Workflow 做固定主干 Agent 做动态分支 RAG 做知识库支撑是企业主流架构。
AI学习——Agent 基础概念
Agent 基础概念一、什么是 AI Agent智能体1. 通俗定义2. 核心区别3. 核心价值二、AI Agent 五大核心组件标准架构1. 大模型 LLM大脑2. 记忆 Memory记忆系统3. 工具 Tools手脚4. 规划与行动 Planning Acting执行逻辑5. 反思与观察 Reflection Observation闭环三、Agent 标准工作流程四、主流 Agent 运行范式两类经典架构1. ReAct 范式最主流、入门首选2. Plan-and-Execute 范式规划-执行五、Agent 分类按能力/场景划分1. 按能力复杂度2. 按应用场景六、Agent 核心优势 现存局限优势局限生产环境必须注意生产优化方案七、LangChain 基础 Agent 入门实战1. 安装依赖2. 完整代码3. 代码说明4. 运行日志解读八、Agent 与 RAG、Workflow 的区别1. Workflow固定工作流2. RAG检索增强生成3. Agent智能体一、什么是 AI Agent智能体1. 通俗定义传统大模型被动应答你问一句、它答一句能力局限在自身训练知识不会主动思考、不会调用外部工具、不会分步解决复杂问题。AI Agent智能体具备自主规划、思考、决策、工具调用、循环执行、自我纠错能力的大模型应用。简单总结能自己拆解任务、自己选工具、自己一步步完成目标的 AI。2. 核心区别普通对话大模型AI Agent被动接收指令单次输出主动思考、分步执行、循环迭代无法使用外部工具搜索/计算/查库内置工具系统可灵活调用外部能力复杂任务容易逻辑断裂任务拆解、规划、复盘完成长链路任务无记忆/行动记录完整行动轨迹、上下文记忆3. 核心价值突破大模型上下文限制、知识截止、能力单一三大短板落地自动化任务自动办公、智能客服、数据分析、网络搜索、机器人流程等。二、AI Agent 五大核心组件标准架构主流 AgentLangChain、AutoGPT、Dify均由这 5 部分组成是理解 Agent 的关键。1. 大模型 LLM大脑角色决策中心负责思考、判断、推理、生成指令。工作分析用户目标、判断下一步该做什么、解析工具返回结果、生成最终答案。选型通用对话模型即可GPT、GLM、通义、Qwen 等。2. 记忆 Memory记忆系统Agent 的“短期/长期记忆”区分两类短期记忆对话历史、每一步行动记录保证上下文连贯不会忘记前面做了什么。长期记忆知识库、用户偏好、历史任务记录一般对接向量数据库Chroma/FAISS。常见实现ConversationBufferMemory、VectorStoreRetrieverMemory。3. 工具 Tools手脚Agent 能力的延伸LLM 本身做不到的事交给工具完成。常用工具分类信息查询联网搜索、文档检索RAG能力计算计算器、代码解释器操作系统文件读写、接口调用、工单提交交互工具发送消息、调用第三方API核心逻辑LLM 只负责决策工具负责执行。4. 规划与行动 Planning Acting执行逻辑这是 Agent 和普通对话最大的区别规划把复杂大目标拆分成多个可执行小步骤。例目标「整理本周销售数据并统计总额」→ 拆分读取文件 → 提取数据 → 求和计算 → 生成总结。行动按照规划依次调用工具、执行操作。5. 反思与观察 Reflection Observation闭环完整闭环流程执行工具 → 拿到返回结果观察LLM 分析结果任务是否完成是否出错是否需要继续调用工具调整下一步行动反思循环直到任务结束经典闭环思考 → 行动 → 观察 → 再思考三、Agent 标准工作流程以「用户让 Agent 查询今天天气」为例完整流转接收目标用户提问查询北京今日天气记忆加载读取历史对话、相关上下文思考决策LLM自身无实时天气数据需要调用「搜索工具」调用工具发起网络搜索传入参数「北京 今日天气」获取结果观察拿到搜索返回的天气文本反思判断LLM信息完整无需继续调用工具整合输出整理结果回复用户记录记忆保存本次对话与行动日志如果是复杂任务多步骤会重复思考→调用工具→观察循环。四、主流 Agent 运行范式两类经典架构1. ReAct 范式最主流、入门首选Reason Act推理 行动核心理念把「思考过程」和「工具调用动作」显式写出来LLM 交替输出思考内容和执行动作。特点结构简单、易调试、工业界使用最多LangChain 默认 Agent 就是 ReAct。适用绝大多数常规任务、工具调用场景。2. Plan-and-Execute 范式规划-执行先整体规划再分步执行第一步LLM 先把整个任务拆成完整步骤清单第二步Agent 按清单依次执行每一步执行中可动态修正计划特点擅长长链路、复杂多步骤任务如数据分析、项目流程、自动化办公。缺点简单任务会冗余适合复杂场景。入门优先学习ReAct Agent。五、Agent 分类按能力/场景划分1. 按能力复杂度基础工具型 Agent仅调用单个/少量工具单循环执行入门级别例带搜索、计算器的问答助手。复杂多步骤 Agent多工具组合、多轮循环、动态改计划例自动数据分析、自动化运维。自主 Agent高阶无人工干预长期自主运行代表AutoGPT、GPT4o 自主模式。2. 按应用场景问答检索 Agent结合 RAG 搜索智能查资料、解答问题办公自动化 Agent读写文件、表格处理、邮件发送、工单创建数据分析 Agent调用代码解释器做统计、绘图、数据清洗客服 Agent意图识别、自动回复、流转工单对应你之前学的 Workflow六、Agent 核心优势 现存局限优势突破模型知识截止时间通过搜索获取实时信息弥补模型能力短板计算、文件、接口、代码复杂任务自动拆解降低人工操作成本记忆持久化支持连续多轮复杂交互局限生产环境必须注意幻觉传导LLM 决策错误 → 工具调用错误 → 结果错误层层放大循环死锁无限重复调用同一个工具无法终止安全风险工具权限过大时可能误删文件、调用高危接口延迟高多轮思考工具调用响应速度远慢于普通对话生产优化方案限制最大循环轮次防止死循环工具增加权限校验、入参过滤每一步结果做事实校验区分「可信工具」和「高危工具」七、LangChain 基础 Agent 入门实战基于前面学的 LangChain 栈实现一个带计算器、搜索模拟的简易 Agent直观理解组件与流程。1. 安装依赖pipinstalllangchain langchain-openai langchain-community2. 完整代码fromlangchain_openaiimportChatOpenAIfromlangchainimporthubfromlangchain.agentsimportAgentExecutor,create_react_agentfromlangchain.toolsimportCalculatorTool# 内置计算器工具# # 1. 初始化大模型Agent 大脑# llmChatOpenAI(modelgpt-3.5-turbo,temperature0,# 推理类任务设为0保证严谨api_key你的API_KEY,base_url中转地址# 国内使用填写)# # 2. 定义工具Agent 手脚# 这里使用官方内置计算器工具# tools[CalculatorTool()]# # 3. 加载 ReAct 标准提示词模板定义Agent思考规则# prompthub.pull(hwchase17/react)# # 4. 创建 ReAct Agent# agentcreate_react_agent(llm,tools,prompt)# Agent 执行器管理循环、记忆、终止条件agent_executorAgentExecutor(agentagent,toolstools,verboseTrue,# 开启日志查看每一步思考行动学习必开max_iterations5# 限制最大循环次数防止死循环)# # 5. 运行测试# if__name____main__:# 提问需要调用计算器工具的复杂计算question计算 (128 256) * 3 等于多少resultagent_executor.invoke({input:question})print(\n 最终回答 )print(result[output])3. 代码说明temperature0Agent 推理、计算场景必须调低减少随机性。verboseTrue打印每一步思考、工具调用、返回结果是学习 Agent 流程的核心。max_iterations5强制限制循环次数规避死循环。CalculatorTool内置工具模拟「外部能力调用」。4. 运行日志解读你会看到三段关键输出对应 ReAct 流程ThoughtLLM 思考需要使用计算器工具Action决定调用Calculator并传入计算表达式Observation工具返回计算结果Final Answer整合结果输出最终答案八、Agent 与 RAG、Workflow 的区别结合你之前学的内容做对比区分建立完整知识体系1. Workflow固定工作流特点流程预先写死分支、步骤、顺序全部固定没有自主决策。适用标准化、固定流程如你之前做的「自动工单」。2. RAG检索增强生成特点单一链路检索知识库 → 拼接上下文 → 模型回答。核心解决知识幻觉、外部文档问答。无自主规划、无多工具调用。3. Agent智能体特点动态决策、流程不固定自主选择工具、自主拆分任务、循环执行。可融合 RAG / WorkflowAgent 可以把「RAG 检索」当作一个工具调用。进阶组合Workflow 做固定主干 Agent 做动态分支 RAG 做知识库支撑是企业主流架构。