什么是RAG,RAG就是用户提问拿到问题先到知识库中检索相关文档,然后再把检索到的相关文档和用户提问一起交给LLM大模型,大模型会根据相关文档和提问生成结果返回给用户构建知识库的准备还有需要文档切片,为什么要做文档切片,因为要适应大模型的上文长度限制,你大模型上下文是有长度限制的,推荐符号切分字符数切分,建议的切分长度是200-500字为一段落,长度短会导致上下文不完整检索不准,长度太长的话可能会出现干扰信息太多,干扰判断再然后需要把文档向量化、向量化就是将单词拆分成片段、就是token、这些token转成一个浮点的数组 这个数组就是多维空间的一个坐标、每次提问的时候,都会吧原来的问题和生成的词给ai、然后ai从词向量里面匹配拿下一个词
RAG是什么
什么是RAG,RAG就是用户提问拿到问题先到知识库中检索相关文档,然后再把检索到的相关文档和用户提问一起交给LLM大模型,大模型会根据相关文档和提问生成结果返回给用户构建知识库的准备还有需要文档切片,为什么要做文档切片,因为要适应大模型的上文长度限制,你大模型上下文是有长度限制的,推荐符号切分字符数切分,建议的切分长度是200-500字为一段落,长度短会导致上下文不完整检索不准,长度太长的话可能会出现干扰信息太多,干扰判断再然后需要把文档向量化、向量化就是将单词拆分成片段、就是token、这些token转成一个浮点的数组 这个数组就是多维空间的一个坐标、每次提问的时候,都会吧原来的问题和生成的词给ai、然后ai从词向量里面匹配拿下一个词