编辑部 整理自 AIGC2026量子位 | 公众号 QbitAIAI范式从Chat转向Agent时AI的能力边界正在被重新定义。在探寻下一代AI助理差异化的关键节点盛大集团副总裁、EverMind CEO邓亚峰提出了核心判断模型能力的差距正在缩小在产品与业务实践中记忆与数据层才是真正能沉淀下来的护城河。他认为未来的AI不仅要能完成任务更需要像人一样在与环境和用户的交互中不断自我进化。而实现智能体“自主”与“自进化”两大特征的基石关键在于长期记忆系统——这将是下一代AI基础设施的决定性战场也正成为企业构建差异化竞争力的关键。为了完整体现邓亚峰的思考在不改变原意的基础上量子位对演讲内容进行了编辑整理希望能给你带来更多启发。2026中国AIGC产业峰会是由量子位主办的行业峰会近20位产业代表与会讨论。线下参会观众超千人线上直播观众近400万获得了主流媒体的广泛关注与报道。核心观点梳理Agent是明确的下一代AI范式软件交付与人机交互范式正在发生根本性改变。下一代AI助理的核心竞争力在于“自主”与“自进化”两大特征其中长期记忆是最核心的底层技术。当基础模型能力趋同时围绕长期记忆构建的数据中间层将成为产品差异化、业务竞争力的关键壁垒。实现“自进化”的关键路径在于构建一个能自动沉淀、匹配与复用Skill的生态系统让智能体系统能够在使用中持续优化真正做到“越用越聪明”。个人数据与记忆的所有权将回归用户未来的理想状态是用户的记忆可跨平台、跨智能体同步与使用最懂用户的AI将成为个人意图的“分发中心”。以下为邓亚峰演讲原文AI新范式已确立当下我们正在真正迎来数字世界的生产力革命。回顾语言模型的发展历程有一个时间点可能被大家忽略了——2025年5月Claude 4的发布。从今天来看那实际上是智能体走向真正自主的关键节点。现在大家意识到Claude在某些方面已经超越了OpenAI但回到那个时间点我们很多人并未充分认识到这一点。关于“OpenClaw”的爆火我简单谈谈我的理解。它让人感觉拥有了一个AI贾维斯可以像人一样7×24小时工作只需留言就能完成任务。更重要的是它将长期记忆、自主性等新的AI能力运用到了智能体之中尽管目前做得还不够完善——前段时间风靡破圈但我也知道很多人已经弃用。核心原因不是大家不需要而是它做得还不够好。我的理解是它有点像智能体时代的iPhone 4定义了一种框架或产品范式但它并不完美需要不断迭代和超越。同时它将几个核心组件明确了下来这也是我们今后可以参考的。大家已经深刻认识到当前行业正从Chat转向Agent的范式这也是Claude和Anthropic在估值上超越OpenAI的重要原因。伴随着这种范式变迁整个软件行业也发生了变化过去SaaS交付的可能是一套流程和界面而现在更多是直接交付结果。交互方式也越来越以Message为主更像人与人之间的交流。这是我们这个时代正在经历的剧变。未来智能体的核心特征与技术基石在这个时间点我们的思考是我们需要什么样的AI助理这里有几个关键定语一是自主二是自进化。自进化意味着AI能像人一样在与人和环境的交互中不断成长、优化而目前的AI尚未做到这一点。因此我认为自主和自进化是下一代AI智能体非常重要的两个Feature特征。其中与此最相关、最核心的底层技术我个人认为是长期记忆。一个Agent是由模型和Harness组成的而Harness主要包括两部分一是操作流程包括Agent Loop和底层基础设施等另一部分则是围绕数据或Memory构建的中间层这正是长期记忆的核心价值所在。抽丝剥茧来看当模型能力越来越强时Memory或Data这部分反而更容易在产品与业务实践中沉淀为差异化的竞争力。再回顾人类智能的构成我们通常认为它由两部分组成推理能力和长期记忆能力。在人类进化过程中长期记忆非常重要——比如记住哪里能找到食物、没有风险、没有威胁等人类需要记住这些信息然后预测未来。我们曾与神经科学领域的一些专家交流发现人之所以具备强大的泛化能力很重要的一个原因在于人具备在记忆中组织训练样本的能力。也就是说在人类智能中记忆也至关重要。当前大家看到模型进展非常快但在记忆方面的工作今年才逐渐多起来去年这个时候我们和行业里一些团队开始交流AI Memory这方面的关注还非常少。在Agent运行过程中记忆有几个核心作用我简单总结为三点第一模型的上下文窗口长度有限目前一般能做到1兆。但在Agent运行过程中上下文会急剧扩张因此需要对信息进行抽象、总结并为模型提供应有的信息。这其中涉及效率、准确率、成本等多个关键问题。第二在与AI交互时大家常发现AI很容易“失忆”——之前告诉它的事情过段时间就忘了。因此Agent需要一个个性化和偏好对齐的过程即让AI知道“这个人是谁、有什么偏好、身份、目标、价值观”。这也是长期记忆在Agent系统中非常重要的功能。第三对于Agent而言我们一方面希望交代任务后它能完成这是基本要求更进一步的是希望它在了解你全部历史的基础上能主动提炼你可能感兴趣的事情并提前处理做完再询问你是否需要。就像雇佣人类员工一样最好的员工不仅能把交代的A任务完成得很好还可能主动做了B和C。这需要AI具备一定主动预测的能力。EverMind是盛大集团孵化的一个团队我们主要的工作是基于长期记忆的核心技术研究目标是打造具备自进化能力的自主Agent OS。我们有一个平台叫EverOS它的定位是“Agent Memory For AI Builders”为AI开发者构建的智能体记忆系统。一方面我们聚焦于Agent Memory另一方面我们认为未来的AI Memory的Layer记忆层服务的可能不仅是资深的开发者将来很多人都会构建AI应用。我们在产品序列上也有所考虑。首先我们希望服务于广大的AI Builders并在其中内置强大的Self-Evolving自进化能力也就是说随着你使用我们的记忆基础设施你的智能体会变得越来越好。具体来说它支持自进化、多模态当前很多平台和技术尚不支持多模态并且其本身跨平台、跨智能体——用户可以把在一个Agent上积累的记忆提取管理用在其他Agent或平台上。同时它还提供云版本和本地版本两者兼容本地版本主要采用Markdown文件结构。在多项指标上例如经典的Benchmark、上下文长度、准确率、响应速度添加和Retrieve检索均为几百毫秒级方面我们都处于领先水平。我们在token节省和模型成本方面也取得了显著的效果原因是利用强化学习的方法训练了很小的模型——我们的4B模型在记忆提取和检索使用上的效果可媲美几百B的模型并且已有不少学术成果发表。例如《EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning》这篇文章总结了EverOS算法上的一些成果已经被ACL 2026收录文章提到我们在五个主流Benchmark上测试均取得了SOTA结果。我们还开展了一项称为稀疏注意力机制Memory Sparse Attention的工作。这项工作的思考原点是人一生的文本量约为几亿token而当前模型上下文窗口一般在1兆左右大概仅为1%。如果要让Agent陪伴人终身进化有没有能让大模型具备可以端到端训练的、支持上亿token上下文的方案几个月前我们刚刚发表了《MSA: Memory Sparse Attention for Efficient End-to-End Memory Model Scaling to 100M Tokens》能将上下文长度扩展到1亿且对底层模型结构进行了修改通过和大模型可插拔的结构实现真正的端到端。在常见问答任务上其性能与当前SOTA模型相当。最关键的是当上下文容量超过1兆时大多数模型性能衰减严重而我们的MSA能做到准确率基本保持平稳。让AI越用越聪明自进化的技术路径接下来我简要介绍一下我们当前在自进化能力方面所做的工作。我认为“AI越用越聪明”一定是未来产品的重要Feature为此我们做了以下几件事第一整理现有Skill库。目前Skill库规模约为几十万我们进行了质量筛选最终提炼出7万多个Skills大家可以直接使用且都是开源、可商用的。第二当Skills数量非常多时就不能简单依赖模型的渐进式披露而需要技能匹配的策略与机制。我们在这方面也做了大量工作精度和效率都很高。此外我们还实现了Skill的自进化——当每个人使用Agent时会有成功和失败的经验不同用户可能执行相似任务同一用户也可能重复类似任务。我们会将成功的经验积累下来自动提取为Skills当类似任务再次执行时这些技能便会被自动调取和使用。具体来说我们整理了8000多个公开Skills仓库通过安全性检查、去重、剔除无效项等一系列筛选流程最终得到7万多个Skills可供直接下载和使用。在Skills的筛选机制上与同参数量或稍小规模的通用模型相比我们的检索指标更优。此外我们还推出了一个称为EvoAgentBench的评测体系目前在Hugging Face上Agent Bench类别已经排到下载量第二名。截止当前我们发布仅一个多月主要用于评估智能体在四大类任务上的Performences。其中也包含一些Evolving策略的横向比较。可以看到使用EverOS的Agent进化策略在任务执行成功率提升和任务轮次减少方面同样处于领先位置。未来趋势个人记忆主权与智能体生态整体来讲我们的工作主要是专注于长期记忆并基于此发展Agent的自进化与自主能力后续还会有其他与智能体操作系统相关的工作发表。并且我们坚持开源希望助力整个AI Builders和开发者的相关工作。我们还针对Agent场景重新定义了Memory体系。传统的记忆大多面向人类对话设计而我们则定义了一套更适合智能体场景的记忆体系包括智能体的身份设定、角色、目标、价值观、行为准则等这就是Agent Memory的部分。其次Agent执行任务时也需要了解用户因此会有User Memory的部分涵盖时间、地点、事件、行为历史以及用户自身的偏好、身份、价值观、历史偏好等。此外我们的工作还包括世界知识我们称之为“LLM Wiki”以上三部分我们都支持。在技能方面我们做了深入工作一方面大家可以使用我们筛选后直接可用的Skills并享受配套的检索策略。另一方面这些Skills会随着使用不断沉淀、优化。最理想的情况是模型与Harness能不断自我迭代、自我演化就像推荐系统一样这一定是未来的趋势。我们还有一个核心观点未来一个人可能会使用多个Agent但记忆应当属于个人数据也应当属于个人。创建和使用Agent的能力也正在从开发者普及到更广泛的专业人士群体。因此我们推出了EverMe产品核心是帮助更广泛的用户管理跨智能体、跨平台的数据和记忆。你在Codex、Claude Code、OpenClaw、Hermes等Agent中的记忆可以汇集管理并优化用于你后续在这些产品中的体验或者快速冷启动一个新的Agent时达到最优配置。这些记忆属于你自己并在一个地方同步。基于此我们最重要的设想是当一个AI拥有了你的记忆和数据后它应当是最最了解你的你未来的意图也可以从这里分发这就是我们正在做的事情。更多信息参考链接官网EverMind.ai开源入口https://github.com/EverMind-AI/EverOS一键三连「点赞」「转发」「小心心」欢迎在评论区留下你的想法—完—超千人线下参与、数百万观众在线观看的中国AIGC产业峰会实录来了近20位AI实战派如何看Agent、多模态、应用、算力...全部干货点击回顾 一键关注 点亮星标
AI越用越聪明,自主+自进化是关键拼图丨盛大邓亚峰EverMind@AIGC2026
编辑部 整理自 AIGC2026量子位 | 公众号 QbitAIAI范式从Chat转向Agent时AI的能力边界正在被重新定义。在探寻下一代AI助理差异化的关键节点盛大集团副总裁、EverMind CEO邓亚峰提出了核心判断模型能力的差距正在缩小在产品与业务实践中记忆与数据层才是真正能沉淀下来的护城河。他认为未来的AI不仅要能完成任务更需要像人一样在与环境和用户的交互中不断自我进化。而实现智能体“自主”与“自进化”两大特征的基石关键在于长期记忆系统——这将是下一代AI基础设施的决定性战场也正成为企业构建差异化竞争力的关键。为了完整体现邓亚峰的思考在不改变原意的基础上量子位对演讲内容进行了编辑整理希望能给你带来更多启发。2026中国AIGC产业峰会是由量子位主办的行业峰会近20位产业代表与会讨论。线下参会观众超千人线上直播观众近400万获得了主流媒体的广泛关注与报道。核心观点梳理Agent是明确的下一代AI范式软件交付与人机交互范式正在发生根本性改变。下一代AI助理的核心竞争力在于“自主”与“自进化”两大特征其中长期记忆是最核心的底层技术。当基础模型能力趋同时围绕长期记忆构建的数据中间层将成为产品差异化、业务竞争力的关键壁垒。实现“自进化”的关键路径在于构建一个能自动沉淀、匹配与复用Skill的生态系统让智能体系统能够在使用中持续优化真正做到“越用越聪明”。个人数据与记忆的所有权将回归用户未来的理想状态是用户的记忆可跨平台、跨智能体同步与使用最懂用户的AI将成为个人意图的“分发中心”。以下为邓亚峰演讲原文AI新范式已确立当下我们正在真正迎来数字世界的生产力革命。回顾语言模型的发展历程有一个时间点可能被大家忽略了——2025年5月Claude 4的发布。从今天来看那实际上是智能体走向真正自主的关键节点。现在大家意识到Claude在某些方面已经超越了OpenAI但回到那个时间点我们很多人并未充分认识到这一点。关于“OpenClaw”的爆火我简单谈谈我的理解。它让人感觉拥有了一个AI贾维斯可以像人一样7×24小时工作只需留言就能完成任务。更重要的是它将长期记忆、自主性等新的AI能力运用到了智能体之中尽管目前做得还不够完善——前段时间风靡破圈但我也知道很多人已经弃用。核心原因不是大家不需要而是它做得还不够好。我的理解是它有点像智能体时代的iPhone 4定义了一种框架或产品范式但它并不完美需要不断迭代和超越。同时它将几个核心组件明确了下来这也是我们今后可以参考的。大家已经深刻认识到当前行业正从Chat转向Agent的范式这也是Claude和Anthropic在估值上超越OpenAI的重要原因。伴随着这种范式变迁整个软件行业也发生了变化过去SaaS交付的可能是一套流程和界面而现在更多是直接交付结果。交互方式也越来越以Message为主更像人与人之间的交流。这是我们这个时代正在经历的剧变。未来智能体的核心特征与技术基石在这个时间点我们的思考是我们需要什么样的AI助理这里有几个关键定语一是自主二是自进化。自进化意味着AI能像人一样在与人和环境的交互中不断成长、优化而目前的AI尚未做到这一点。因此我认为自主和自进化是下一代AI智能体非常重要的两个Feature特征。其中与此最相关、最核心的底层技术我个人认为是长期记忆。一个Agent是由模型和Harness组成的而Harness主要包括两部分一是操作流程包括Agent Loop和底层基础设施等另一部分则是围绕数据或Memory构建的中间层这正是长期记忆的核心价值所在。抽丝剥茧来看当模型能力越来越强时Memory或Data这部分反而更容易在产品与业务实践中沉淀为差异化的竞争力。再回顾人类智能的构成我们通常认为它由两部分组成推理能力和长期记忆能力。在人类进化过程中长期记忆非常重要——比如记住哪里能找到食物、没有风险、没有威胁等人类需要记住这些信息然后预测未来。我们曾与神经科学领域的一些专家交流发现人之所以具备强大的泛化能力很重要的一个原因在于人具备在记忆中组织训练样本的能力。也就是说在人类智能中记忆也至关重要。当前大家看到模型进展非常快但在记忆方面的工作今年才逐渐多起来去年这个时候我们和行业里一些团队开始交流AI Memory这方面的关注还非常少。在Agent运行过程中记忆有几个核心作用我简单总结为三点第一模型的上下文窗口长度有限目前一般能做到1兆。但在Agent运行过程中上下文会急剧扩张因此需要对信息进行抽象、总结并为模型提供应有的信息。这其中涉及效率、准确率、成本等多个关键问题。第二在与AI交互时大家常发现AI很容易“失忆”——之前告诉它的事情过段时间就忘了。因此Agent需要一个个性化和偏好对齐的过程即让AI知道“这个人是谁、有什么偏好、身份、目标、价值观”。这也是长期记忆在Agent系统中非常重要的功能。第三对于Agent而言我们一方面希望交代任务后它能完成这是基本要求更进一步的是希望它在了解你全部历史的基础上能主动提炼你可能感兴趣的事情并提前处理做完再询问你是否需要。就像雇佣人类员工一样最好的员工不仅能把交代的A任务完成得很好还可能主动做了B和C。这需要AI具备一定主动预测的能力。EverMind是盛大集团孵化的一个团队我们主要的工作是基于长期记忆的核心技术研究目标是打造具备自进化能力的自主Agent OS。我们有一个平台叫EverOS它的定位是“Agent Memory For AI Builders”为AI开发者构建的智能体记忆系统。一方面我们聚焦于Agent Memory另一方面我们认为未来的AI Memory的Layer记忆层服务的可能不仅是资深的开发者将来很多人都会构建AI应用。我们在产品序列上也有所考虑。首先我们希望服务于广大的AI Builders并在其中内置强大的Self-Evolving自进化能力也就是说随着你使用我们的记忆基础设施你的智能体会变得越来越好。具体来说它支持自进化、多模态当前很多平台和技术尚不支持多模态并且其本身跨平台、跨智能体——用户可以把在一个Agent上积累的记忆提取管理用在其他Agent或平台上。同时它还提供云版本和本地版本两者兼容本地版本主要采用Markdown文件结构。在多项指标上例如经典的Benchmark、上下文长度、准确率、响应速度添加和Retrieve检索均为几百毫秒级方面我们都处于领先水平。我们在token节省和模型成本方面也取得了显著的效果原因是利用强化学习的方法训练了很小的模型——我们的4B模型在记忆提取和检索使用上的效果可媲美几百B的模型并且已有不少学术成果发表。例如《EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning》这篇文章总结了EverOS算法上的一些成果已经被ACL 2026收录文章提到我们在五个主流Benchmark上测试均取得了SOTA结果。我们还开展了一项称为稀疏注意力机制Memory Sparse Attention的工作。这项工作的思考原点是人一生的文本量约为几亿token而当前模型上下文窗口一般在1兆左右大概仅为1%。如果要让Agent陪伴人终身进化有没有能让大模型具备可以端到端训练的、支持上亿token上下文的方案几个月前我们刚刚发表了《MSA: Memory Sparse Attention for Efficient End-to-End Memory Model Scaling to 100M Tokens》能将上下文长度扩展到1亿且对底层模型结构进行了修改通过和大模型可插拔的结构实现真正的端到端。在常见问答任务上其性能与当前SOTA模型相当。最关键的是当上下文容量超过1兆时大多数模型性能衰减严重而我们的MSA能做到准确率基本保持平稳。让AI越用越聪明自进化的技术路径接下来我简要介绍一下我们当前在自进化能力方面所做的工作。我认为“AI越用越聪明”一定是未来产品的重要Feature为此我们做了以下几件事第一整理现有Skill库。目前Skill库规模约为几十万我们进行了质量筛选最终提炼出7万多个Skills大家可以直接使用且都是开源、可商用的。第二当Skills数量非常多时就不能简单依赖模型的渐进式披露而需要技能匹配的策略与机制。我们在这方面也做了大量工作精度和效率都很高。此外我们还实现了Skill的自进化——当每个人使用Agent时会有成功和失败的经验不同用户可能执行相似任务同一用户也可能重复类似任务。我们会将成功的经验积累下来自动提取为Skills当类似任务再次执行时这些技能便会被自动调取和使用。具体来说我们整理了8000多个公开Skills仓库通过安全性检查、去重、剔除无效项等一系列筛选流程最终得到7万多个Skills可供直接下载和使用。在Skills的筛选机制上与同参数量或稍小规模的通用模型相比我们的检索指标更优。此外我们还推出了一个称为EvoAgentBench的评测体系目前在Hugging Face上Agent Bench类别已经排到下载量第二名。截止当前我们发布仅一个多月主要用于评估智能体在四大类任务上的Performences。其中也包含一些Evolving策略的横向比较。可以看到使用EverOS的Agent进化策略在任务执行成功率提升和任务轮次减少方面同样处于领先位置。未来趋势个人记忆主权与智能体生态整体来讲我们的工作主要是专注于长期记忆并基于此发展Agent的自进化与自主能力后续还会有其他与智能体操作系统相关的工作发表。并且我们坚持开源希望助力整个AI Builders和开发者的相关工作。我们还针对Agent场景重新定义了Memory体系。传统的记忆大多面向人类对话设计而我们则定义了一套更适合智能体场景的记忆体系包括智能体的身份设定、角色、目标、价值观、行为准则等这就是Agent Memory的部分。其次Agent执行任务时也需要了解用户因此会有User Memory的部分涵盖时间、地点、事件、行为历史以及用户自身的偏好、身份、价值观、历史偏好等。此外我们的工作还包括世界知识我们称之为“LLM Wiki”以上三部分我们都支持。在技能方面我们做了深入工作一方面大家可以使用我们筛选后直接可用的Skills并享受配套的检索策略。另一方面这些Skills会随着使用不断沉淀、优化。最理想的情况是模型与Harness能不断自我迭代、自我演化就像推荐系统一样这一定是未来的趋势。我们还有一个核心观点未来一个人可能会使用多个Agent但记忆应当属于个人数据也应当属于个人。创建和使用Agent的能力也正在从开发者普及到更广泛的专业人士群体。因此我们推出了EverMe产品核心是帮助更广泛的用户管理跨智能体、跨平台的数据和记忆。你在Codex、Claude Code、OpenClaw、Hermes等Agent中的记忆可以汇集管理并优化用于你后续在这些产品中的体验或者快速冷启动一个新的Agent时达到最优配置。这些记忆属于你自己并在一个地方同步。基于此我们最重要的设想是当一个AI拥有了你的记忆和数据后它应当是最最了解你的你未来的意图也可以从这里分发这就是我们正在做的事情。更多信息参考链接官网EverMind.ai开源入口https://github.com/EverMind-AI/EverOS一键三连「点赞」「转发」「小心心」欢迎在评论区留下你的想法—完—超千人线下参与、数百万观众在线观看的中国AIGC产业峰会实录来了近20位AI实战派如何看Agent、多模态、应用、算力...全部干货点击回顾 一键关注 点亮星标