现在的 AI 记忆工具全在卷一件事存更多搜更快。向量数据库从 Chroma 卷到 PineconeRAG 从朴素检索卷到 Graph RAGLoCoMo 榜单上每个百分点都在争。但你把所有 AI 记忆公司的首页看一遍没人提一个问题存进去的那条记忆它本身还对吗检索准确率能告诉你找到了正确的文档但它没法告诉你文档里的内容是错的。这是两个完全不同的问题。前者是信息检索。后者是数据质量。数据质量这件事数据库领域花了几十年。ACID 出来之前数据库会丢数据、会不一致、会脏读大家觉得能用就行。测试覆盖率被提出来的时候很多人说浪费时间。现在回头看都是常识。AI 记忆正在经历同一个阶段。我写了个工具叫 Minta给 AI 记忆做质检。四个维度全部本地运行零 API 调用- 过时检测分类型衰减。偏好类记忆比项目状态类活得更久——你的技术栈三个月就变写作习惯半年不变- 冲突检测语义相似度 否定模式。不是看两条记忆相关是判断它们在说反话- 冗余检测余弦相似度 Jaccard 联合判定- 碎片检测DBSCAN 聚类把散落的信息归拢三分钟。Claude Code、Cursor、Codex 都能接。项目开源https://github.com/xinchen03/ minta 欢迎各位一起反馈优化也麻烦大家点点检测只是诊断。更好玩的问题是诊断之后的推理。我现在在推三个方向第一不在一个模型里死磕。通用模型判断不了什么是对的。医学有医学的标准法律有法律的标准。系统应该是联邦式的——独立专家各自深耕在边界处互相咨询。临床推理专家可以问法律专家要第二意见。第二记忆不能存成列表。 它们之间有依赖、有矛盾、有证据链。只有存成图才能在一条被修正时回答还有哪些结论会因此改变。第三置信度不该是死的。 它应该是一个持续运行的模型在学习你的记忆如何演化——预判应该发生什么在现实偏离时标记异常。这些事在做感兴趣的私下聊。诚挚招募团队一起打磨产品、拓展生态把这个项目做得更远欢迎同行交流xxinchen03gmail.com
That’s memory decay
现在的 AI 记忆工具全在卷一件事存更多搜更快。向量数据库从 Chroma 卷到 PineconeRAG 从朴素检索卷到 Graph RAGLoCoMo 榜单上每个百分点都在争。但你把所有 AI 记忆公司的首页看一遍没人提一个问题存进去的那条记忆它本身还对吗检索准确率能告诉你找到了正确的文档但它没法告诉你文档里的内容是错的。这是两个完全不同的问题。前者是信息检索。后者是数据质量。数据质量这件事数据库领域花了几十年。ACID 出来之前数据库会丢数据、会不一致、会脏读大家觉得能用就行。测试覆盖率被提出来的时候很多人说浪费时间。现在回头看都是常识。AI 记忆正在经历同一个阶段。我写了个工具叫 Minta给 AI 记忆做质检。四个维度全部本地运行零 API 调用- 过时检测分类型衰减。偏好类记忆比项目状态类活得更久——你的技术栈三个月就变写作习惯半年不变- 冲突检测语义相似度 否定模式。不是看两条记忆相关是判断它们在说反话- 冗余检测余弦相似度 Jaccard 联合判定- 碎片检测DBSCAN 聚类把散落的信息归拢三分钟。Claude Code、Cursor、Codex 都能接。项目开源https://github.com/xinchen03/ minta 欢迎各位一起反馈优化也麻烦大家点点检测只是诊断。更好玩的问题是诊断之后的推理。我现在在推三个方向第一不在一个模型里死磕。通用模型判断不了什么是对的。医学有医学的标准法律有法律的标准。系统应该是联邦式的——独立专家各自深耕在边界处互相咨询。临床推理专家可以问法律专家要第二意见。第二记忆不能存成列表。 它们之间有依赖、有矛盾、有证据链。只有存成图才能在一条被修正时回答还有哪些结论会因此改变。第三置信度不该是死的。 它应该是一个持续运行的模型在学习你的记忆如何演化——预判应该发生什么在现实偏离时标记异常。这些事在做感兴趣的私下聊。诚挚招募团队一起打磨产品、拓展生态把这个项目做得更远欢迎同行交流xxinchen03gmail.com