[智能体-136]:LangChain 短期记忆实现方法与工程代码示例

[智能体-136]:LangChain 短期记忆实现方法与工程代码示例 一、LangChain 短期记忆核心定义工程视角结合计算机层级状态理论LangChain 短期记忆属于会话级/任务级临时状态记忆是智能体最基础的记忆能力。核心特征作用域仅当前会话、当前任务有效严格会话隔离生命周期服务运行期间临时存储会话销毁、服务重启后数据全部丢失本质将历史对话、交互上下文拼接进 Prompt让大模型拥有多轮连贯对话能力对比长期记忆无需向量库、无需数据库持久化纯内存存储速度快、开销低LangChain 短期记忆四种主流实现方案完整缓存记忆ConversationBufferMemory全量保存滑动窗口记忆ConversationBufferWindowMemory固定轮数摘要压缩记忆ConversationSummaryMemory降低Token开销Token 限制缓存记忆ConversationTokenBufferMemory按Token限流二、前置环境依赖所有代码通用依赖统一安装pip install langchain langchain-community langchain-openai python-dotenv项目根目录配置.env模型密钥统一适配各类大模型OPENAI_API_KEY你的密钥 OPENAI_BASE_URL模型地址 OPENAI_MODEL_NAMEgpt-3.5-turbo三、四种短期记忆详解 完整可运行代码1. ConversationBufferMemory 完整缓存记忆基础全量短期记忆原理无压缩、无截断、无摘要完整保存当前会话所有对话历史每一轮对话都会拼接全部历史上下文送入模型。优缺点优点上下文最全、对话零丢失、逻辑最连贯缺点轮次越多 Token 消耗越高极易上下文溢出适用场景短轮次对话、简单问答、对上下文完整性要求高的场景完整代码示例2. ConversationBufferWindowMemory 滑动窗口记忆固定轮数短期记忆原理只保留最近 N 轮对话超出轮次的历史自动丢弃严格控制上下文长度是工程最常用的短期记忆方案。优缺点优点内存开销稳定、不会无限膨胀、杜绝上下文溢出缺点会丢失早期历史对话信息适用场景日常聊天、智能体交互、长轮次对话场景生产首选完整代码示例3. ConversationSummaryMemory 摘要压缩记忆智能精简短期记忆原理不直接保存原始对话而是调用模型对历史对话自动摘要压缩用少量 Token 保留核心语义兼顾上下文完整性和开销控制。优缺点优点极大节省 Token、长对话不溢出、保留关键信息缺点需要额外调用模型生成摘要存在少量推理开销适用场景长轮次多轮对话、深度问答、需要长期连贯交互的智能体场景完整代码示例4. ConversationTokenBufferMemory Token 限流记忆精准开销控制原理不按对话轮次截断而是按 Token数量限制上下文长度精准适配模型上下文窗口上限彻底避免溢出。优缺点优点控制精度最高、适配不同模型上下文窗口、资源利用率最高缺点配置相对复杂需匹配模型 Token 规则适用场景模型窗口受限、对 Token 开销严格管控的生产场景完整代码示例四、四种短期记忆选型对比工程落地标准记忆类型核心能力开销信息完整性生产推荐度Buffer 完整缓存全量保存对话高、持续递增100%完整⭐⭐仅测试用Window 滑动窗口保留最近N轮稳定可控局部完整⭐⭐⭐⭐⭐通用首选Summary 摘要压缩语义精简压缩低核心信息完整⭐⭐⭐⭐长对话首选Token 限流精准Token管控极低按需截断⭐⭐⭐⭐精细化管控首选五、短期记忆核心工程特性总结1. 作用域特性所有短期记忆均为会话级作用域不同会话实例记忆完全隔离互不串扰对齐操作系统线程/进程隔离逻辑。2. 存储特性纯内存临时存储无持久化会话结束、程序重启后记忆清空属于瞬时/短期状态记忆。3. 核心价值解决大模型无上下文、单轮孤立对话问题用极低开销实现多轮连贯交互是智能体复杂任务、工具调用、多轮推理的基础底座。六、短期记忆与长期记忆核心区别短期记忆内存存储、会话作用域、无持久化、用于实时多轮对话长期记忆向量库/数据库存储、用户级作用域、持久化、用于跨会话知识复用