今天聊聊这套我自己在用的系统——用 Obsidian wiki 知识库实现选题自动推荐、素材自动查询、数据自动统计最后辅助生成文章和分析报告。 我的观察大多数人的知识库是「信息坟场」先说一个扎心的真相大多数人的 Obsidian 知识库本质上是个「高质量垃圾桶」。剪藏了几百篇文章用的时候根本找不到。笔记越来越多但写作时还是一片空白。知识和内容生产之间有一道很深的沟。这道沟不是因为笔记不够多而是因为——知识没有被结构化也没有和写作流程打通。我的做法是建一套「知识图谱脚本驱动」的工作流。 我的思考知识库应该能「主动说话」第零层知识是怎么进来的先说一个常被忽略的前提知识图谱再厉害也是靠「持续喂料」撑起来的。我的 wiki 知识库有五条持续输入的管道来源频率性质数智日报每日自动生成AI哨兵抓取行业动态51篇已归档数智周报每周五整理精选日报TOP内容形成周度快照学习笔记随课程进度大模型开发课、读书笔记、技术专题LLM问答记录随时存档和AI深度探讨某概念后的对话存档素材收藏库不定期整理AI工业、AI前沿的主动收藏其中数智日报是最核心的「喂料」环节——每天完全自动化扫描、摘要、落地到 Obsidian一条龙不需要我手动操作。LLM 问答记录则是另一种被低估的来源。每次和 AI 聊到某个话题有了新认识我会把整段对话存成 MD 文件copilot/conversations/。这些记录里有推理过程不是搜索结果而是思考的轨迹——这才是写作最难替代的素材。随着五条管道持续汇入每周新增 10-15 个文件知识库的「密度」才够让后面的图谱脚本找到有意义的关联。图1Obsidian Wiki 知识库持续积累信息流图——五大来源持续汇入经脚本处理转化为知识图谱最终驱动内容产出第一层让知识库知道自己有什么我的 Obsidian wiki 库路径D:\mywiki\目前有146 个 MD 文件、447 张图片涵盖 6 大分类分类词条数最高频词条覆盖领域概念33大模型105次AI核心技术、工业场景方法论15知识库建设63次分析框架、工作流工具19GPT57次AI工具、开发框架项目10方案官52次客户项目、交付物投资12基本面分析13次股票研究学习6课程笔记45次技术课程这些数字来自一个 Python 脚本build_knowledge_graph.py它全量扫描所有 MD 文件统计每个关键词在多少篇文档里出现过输出为keyword_stats.json。值得一提「大模型」能出现105次不是我写了105篇大模型文章而是日报、学习笔记、LLM问答、素材收藏里都在不断提到它。多来源共同印证的词条才是真正值得写的话题信号——仅凭单一来源堆出来的频次往往是偏科的结果。脚本在统计词条频次的同时也会建立词条之间的关联关系。比如「大模型」和「AI Agent」共现最强60篇文档「RAG」和「向量数据库」次之。这些关联关系是后续素材交叉查询的基础——找到一个词条顺着关联链能挖出一整片相关素材。图2Wiki 知识图谱核心概念关联网络——节点大小词条频次连线词条共现关系19个核心词条的关联拓扑脚本核心逻辑简化版# 扫描所有 MD 文件统计关键词出现频次for file in all_md_files: content read_file(file) for keyword in KEYWORD_RULES: if keyword in content: keyword_freq[keyword] 1 keyword_articles[keyword].append(file)# 输出 JSONwith open(keyword_stats.json, w) as f: json.dump({categories: keyword_freq, articles: keyword_articles}, f)一次全量构建约 20 秒增量更新--update模式只处理有改动的文件速度在 3 秒以内。第二层让频次数据驱动选题知道了哪些词出现最多下一步是判断「哪个词值得写」。判断标准不只是频次高还要看三个维度热度趋势这个词在最近 14 天的日报里出现了几次关联深度知识库里有没有至少 3 篇以上的关联文章可以当素材情绪价值这个话题对读者有没有「焦虑、迷茫、渴望改变」的情绪钩子第一和第二点可以脚本化。第三点目前还是我自己判断但可以给 AI 一个打分 prompt。实际运行结果2026年5月选题推荐示例选题候选命中关键词关联文章数最近14天日报提及推荐指数RAG已死是炒作吗RAG73次48篇12次★★★★★AI Agent在工业的演化AI Agent96次32篇9次★★★★☆Obsidian大模型重构知识库知识库74次15篇7次★★★★☆工业AI落地概念重构工业AI90次27篇8次★★★★☆图3从「知识库词条热度」到「选题决策」的自动化推荐流程图第三层从词条页直接抽取素材每个词条页面比如05-知识图谱/概念/RAG.md会自动维护一个「关联文章」列表——因为脚本在构建图谱时会把所有包含该词的文件路径写进去。这意味着当我决定写 RAG 相关的文章时我直接打开RAG.md就能看到60 篇关联文章的链接涵盖日报资讯、学习笔记、课件、项目方案……我再配合 AI让它读取关联文章列表中的前 10 篇提取关键论点和数据按「背景→观点→反驳→结论」的结构整理素材框架这样一篇 1000 字的文章从「有选题」到「有素材框架」大概只需要 10 分钟。 实操案例《RAG已死是炒作吗》是怎么出来的这篇[文章]的诞生过程完整走了一遍上面的流程Step 1脚本扫描发现「RAG」关键词出现 73 次最近 14 天日报提及 12 次——频次突然升高说明这个话题有争议性热点。Step 2打开RAG.md词条页关联文章 60 篇其中有课程笔记RAG高级技术、多篇日报20260429-20260510 集中讨论、知乎对话记录「RAG已死」论战梳理。Step 3让 AI 读取这些素材整理出三个观点• 一方向量检索精度有上限GraphRAG 才是方向• 另一方企业场景 80% 的需求普通 RAG 够用• 我的判断「RAG已死」是营销话术问题是大多数人连「普通 RAG」都没做好Step 4按知客笔记结构写稿全文 900 字公众号版知乎版各一篇共用时约 40 分钟。结果该篇文章在知乎获得收藏 80公众号阅读完成率 72%比平均值高 18%。 这套流程的核心价值一张表说清楚环节传统方式Wiki 知识库方式时间节省选题刷热榜凭感觉30-60分钟脚本推荐数据支撑5分钟~90%找素材搜索引擎收藏夹翻查60-90分钟词条页关联列表直取5-10分钟~85%数据佐证手动查报告30-60分钟keyword_stats.json直接引用即时~95%文章框架空白起稿20-40分钟AI读素材生成框架10分钟~70%全流程合计2.5-4小时30-40分钟~85% 收获说给也想搭这套系统的人建这套系统有几个坑真心聊几句坑1不要追求「完美结构」再开始。我刚开始建 Obsidian 的时候为目录结构纠结了两周结果啥也没写。现在的策略是先记录结构随时可以重组——反正有脚本帮你整理。坑2知识图谱脚本要「自用」才能迭代。第一版脚本只统计频次用着用着发现不够用后来加了「关联文章数」「最近14天热度」「热度分级」……每次写文章的时候遇到问题就改一改脚本。坑3AI不能替代你的「判断力」。脚本告诉你「RAG 出现了 73 次」但它不知道这个话题在你的读者群里是不是「已经被说烂了」。这一步还得是你来判断。关于「喂料」我的分层做法•自动层数智日报每天跑完全不用我操心•半自动层周报整理 LLM对话存档10-20分钟有我的筛选在里面•手动层学习笔记 项目复盘慢但有原创性三层叠加宽度靠自动化深度靠人工。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
Obsidian Wiki知识库+AI 应用实操:一套系统搞定知识沉淀、选题、内容生成全流程
今天聊聊这套我自己在用的系统——用 Obsidian wiki 知识库实现选题自动推荐、素材自动查询、数据自动统计最后辅助生成文章和分析报告。 我的观察大多数人的知识库是「信息坟场」先说一个扎心的真相大多数人的 Obsidian 知识库本质上是个「高质量垃圾桶」。剪藏了几百篇文章用的时候根本找不到。笔记越来越多但写作时还是一片空白。知识和内容生产之间有一道很深的沟。这道沟不是因为笔记不够多而是因为——知识没有被结构化也没有和写作流程打通。我的做法是建一套「知识图谱脚本驱动」的工作流。 我的思考知识库应该能「主动说话」第零层知识是怎么进来的先说一个常被忽略的前提知识图谱再厉害也是靠「持续喂料」撑起来的。我的 wiki 知识库有五条持续输入的管道来源频率性质数智日报每日自动生成AI哨兵抓取行业动态51篇已归档数智周报每周五整理精选日报TOP内容形成周度快照学习笔记随课程进度大模型开发课、读书笔记、技术专题LLM问答记录随时存档和AI深度探讨某概念后的对话存档素材收藏库不定期整理AI工业、AI前沿的主动收藏其中数智日报是最核心的「喂料」环节——每天完全自动化扫描、摘要、落地到 Obsidian一条龙不需要我手动操作。LLM 问答记录则是另一种被低估的来源。每次和 AI 聊到某个话题有了新认识我会把整段对话存成 MD 文件copilot/conversations/。这些记录里有推理过程不是搜索结果而是思考的轨迹——这才是写作最难替代的素材。随着五条管道持续汇入每周新增 10-15 个文件知识库的「密度」才够让后面的图谱脚本找到有意义的关联。图1Obsidian Wiki 知识库持续积累信息流图——五大来源持续汇入经脚本处理转化为知识图谱最终驱动内容产出第一层让知识库知道自己有什么我的 Obsidian wiki 库路径D:\mywiki\目前有146 个 MD 文件、447 张图片涵盖 6 大分类分类词条数最高频词条覆盖领域概念33大模型105次AI核心技术、工业场景方法论15知识库建设63次分析框架、工作流工具19GPT57次AI工具、开发框架项目10方案官52次客户项目、交付物投资12基本面分析13次股票研究学习6课程笔记45次技术课程这些数字来自一个 Python 脚本build_knowledge_graph.py它全量扫描所有 MD 文件统计每个关键词在多少篇文档里出现过输出为keyword_stats.json。值得一提「大模型」能出现105次不是我写了105篇大模型文章而是日报、学习笔记、LLM问答、素材收藏里都在不断提到它。多来源共同印证的词条才是真正值得写的话题信号——仅凭单一来源堆出来的频次往往是偏科的结果。脚本在统计词条频次的同时也会建立词条之间的关联关系。比如「大模型」和「AI Agent」共现最强60篇文档「RAG」和「向量数据库」次之。这些关联关系是后续素材交叉查询的基础——找到一个词条顺着关联链能挖出一整片相关素材。图2Wiki 知识图谱核心概念关联网络——节点大小词条频次连线词条共现关系19个核心词条的关联拓扑脚本核心逻辑简化版# 扫描所有 MD 文件统计关键词出现频次for file in all_md_files: content read_file(file) for keyword in KEYWORD_RULES: if keyword in content: keyword_freq[keyword] 1 keyword_articles[keyword].append(file)# 输出 JSONwith open(keyword_stats.json, w) as f: json.dump({categories: keyword_freq, articles: keyword_articles}, f)一次全量构建约 20 秒增量更新--update模式只处理有改动的文件速度在 3 秒以内。第二层让频次数据驱动选题知道了哪些词出现最多下一步是判断「哪个词值得写」。判断标准不只是频次高还要看三个维度热度趋势这个词在最近 14 天的日报里出现了几次关联深度知识库里有没有至少 3 篇以上的关联文章可以当素材情绪价值这个话题对读者有没有「焦虑、迷茫、渴望改变」的情绪钩子第一和第二点可以脚本化。第三点目前还是我自己判断但可以给 AI 一个打分 prompt。实际运行结果2026年5月选题推荐示例选题候选命中关键词关联文章数最近14天日报提及推荐指数RAG已死是炒作吗RAG73次48篇12次★★★★★AI Agent在工业的演化AI Agent96次32篇9次★★★★☆Obsidian大模型重构知识库知识库74次15篇7次★★★★☆工业AI落地概念重构工业AI90次27篇8次★★★★☆图3从「知识库词条热度」到「选题决策」的自动化推荐流程图第三层从词条页直接抽取素材每个词条页面比如05-知识图谱/概念/RAG.md会自动维护一个「关联文章」列表——因为脚本在构建图谱时会把所有包含该词的文件路径写进去。这意味着当我决定写 RAG 相关的文章时我直接打开RAG.md就能看到60 篇关联文章的链接涵盖日报资讯、学习笔记、课件、项目方案……我再配合 AI让它读取关联文章列表中的前 10 篇提取关键论点和数据按「背景→观点→反驳→结论」的结构整理素材框架这样一篇 1000 字的文章从「有选题」到「有素材框架」大概只需要 10 分钟。 实操案例《RAG已死是炒作吗》是怎么出来的这篇[文章]的诞生过程完整走了一遍上面的流程Step 1脚本扫描发现「RAG」关键词出现 73 次最近 14 天日报提及 12 次——频次突然升高说明这个话题有争议性热点。Step 2打开RAG.md词条页关联文章 60 篇其中有课程笔记RAG高级技术、多篇日报20260429-20260510 集中讨论、知乎对话记录「RAG已死」论战梳理。Step 3让 AI 读取这些素材整理出三个观点• 一方向量检索精度有上限GraphRAG 才是方向• 另一方企业场景 80% 的需求普通 RAG 够用• 我的判断「RAG已死」是营销话术问题是大多数人连「普通 RAG」都没做好Step 4按知客笔记结构写稿全文 900 字公众号版知乎版各一篇共用时约 40 分钟。结果该篇文章在知乎获得收藏 80公众号阅读完成率 72%比平均值高 18%。 这套流程的核心价值一张表说清楚环节传统方式Wiki 知识库方式时间节省选题刷热榜凭感觉30-60分钟脚本推荐数据支撑5分钟~90%找素材搜索引擎收藏夹翻查60-90分钟词条页关联列表直取5-10分钟~85%数据佐证手动查报告30-60分钟keyword_stats.json直接引用即时~95%文章框架空白起稿20-40分钟AI读素材生成框架10分钟~70%全流程合计2.5-4小时30-40分钟~85% 收获说给也想搭这套系统的人建这套系统有几个坑真心聊几句坑1不要追求「完美结构」再开始。我刚开始建 Obsidian 的时候为目录结构纠结了两周结果啥也没写。现在的策略是先记录结构随时可以重组——反正有脚本帮你整理。坑2知识图谱脚本要「自用」才能迭代。第一版脚本只统计频次用着用着发现不够用后来加了「关联文章数」「最近14天热度」「热度分级」……每次写文章的时候遇到问题就改一改脚本。坑3AI不能替代你的「判断力」。脚本告诉你「RAG 出现了 73 次」但它不知道这个话题在你的读者群里是不是「已经被说烂了」。这一步还得是你来判断。关于「喂料」我的分层做法•自动层数智日报每天跑完全不用我操心•半自动层周报整理 LLM对话存档10-20分钟有我的筛选在里面•手动层学习笔记 项目复盘慢但有原创性三层叠加宽度靠自动化深度靠人工。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】