RAG优化

RAG优化 知识拆分优化分块策略固定长度分块递归字符分块基于句子分块将文本分割成句子再将句子聚合成块。适用于对句子完整性要求高的场景法律文书、新闻报道结构感知分块根据Markdown的标题层级或html的标签来定义块的边界对话式分块根据对话的发言人或轮次进行分块语义分块计算相邻句子/段落的向量相似度在语义发生突变相似度低的位置进行切分主题分块在文档的宏观主题发生转变时进行切分。适用于多主题报告小-大分块使用小块如句子进行高精度检索然后将包含该小块的原始大块如段落作为上下文送入LLM代理分块混合分块先用一种宏观策略进行切分再对过大的块使用更精细的策略进行二次切嵌入模型优化1.模型优化换模型像BGE、M3E、Jina、bge-m32.多向量优化同一段落生成「原文向量 / 标题向量 / 关键词向量」多组向量联合检索加权打分3.微调1.基于入库前的知识库库简历阶段要考虑索引的问题以及知识拆分问题文档不能拆分破坏语义甚至考虑tag元数据标签2.高效检索阶段多路召回高效的检索算法HNSW算法图检索算法BM25召回3.排序阶段需要不止是根据向量本身的相似性去过一遍Rerank模型得到自注意力分数更需要真实根据业务Tag字段去打分比如医疗问答场景你可以手动控制什么Tag更高频返回向量本身的Tag也可以加入到最后Rerank重排序的分数计算中去4.系统完成后的链路测评线上数据的反馈回流跑出真的知识飞轮包括可信评测