knowhere | 第一课:项目导论与环境搭建

knowhere | 第一课:项目导论与环境搭建 课程定位本课是 Knowhere 项目课程的第一课,目标不是立刻深入某个业务函数,而是先建立完整的项目地图:知道这个项目解决什么问题,由哪些运行组件组成,核心代码分别放在哪里,以及如何把本地开发环境启动起来。学完本课后,你应该能够回答三个问题:Knowhere 为什么不是普通的文档解析器,而是面向 AI Agent 的文档记忆基础设施?apps/api、apps/worker、packages/shared-python三个目录分别承担什么职责?如何安装依赖、启动本地基础设施,并验证 API 服务可用?建议学习时长:4 学时。1. 项目解决的问题Knowhere 的核心定位是“复杂文档和 AI Agent 之间的记忆层”。它接收 PDF、Office、图片、表格、Markdown、文本等非结构化文档,经过解析、结构恢复、多模态归一化、结果发布和检索构建,把原始文件转换成 Agent 更容易消费的结构化知识。传统文档解析通常只输出一份 Markdown 或文本,后续 RAG 系统再把文本切成片段。这种方式容易丢失章节层级、表格语义、图片关联、页面位置和引用路径。Knowhere 的重点是把这些上下文保留下来,让后续 Agent 能够像人一样按章节、路径和证据导航文档。项目主链路可以理解为:用户请求 - AP