1 项目背景业务场景某 SaaS 公司的客户成功团队每天都在重复回答相同的问题:CRM 系统怎么批量导入客户?免费版和付费版的区别?API 调用频率限制是多少?7 天无理由退货怎么申请?——这些问题的答案在帮助中心文档里写得清清楚楚,但客户就是不愿意翻。客服主管统计了一组数据:每天 2000 通在线咨询中,67% 的问题答案已经在帮助中心文档里;客服平均翻找文档耗时 42 秒;客户平均等待 90 秒后才收到回复。这意味着每天有 1340 次咨询本可以被机器人自动回答,却耗费了 15 人时的人力。产品总监拍板:基于现有的 500 篇帮助文档,搭建一个 FAQ 智能问答机器人。客户用自然语言提问,机器人从文档中自动定位答案片段并回复,只有机器人找不到答案时才转人工。痛点问答(Question Answering, QA)是 NLP 中最贴近"搜索引擎体验"的任务,但实现远非字面搜索那么简单:答案不是关键词匹配:客户问"怎么退钱?",文档里写的是"退款流程",字面不匹配但语义等价。传统 ES 关键词搜索只能召回包含"退钱"的文档,找不到不包含该词但语义相关的段落。答案边界定位:即使在正确的段落里,模型需要精确找到答案片段的起始和结束位置——多一个字或少一个字都会让答案不完整。长文档滑窗:帮助文档通常 2000-5000 字,远超 BERT 的 512 token 限制。必须对文档做滑窗切
第7章:问答任务实战:搭建 FAQ 智能助手
1 项目背景业务场景某 SaaS 公司的客户成功团队每天都在重复回答相同的问题:CRM 系统怎么批量导入客户?免费版和付费版的区别?API 调用频率限制是多少?7 天无理由退货怎么申请?——这些问题的答案在帮助中心文档里写得清清楚楚,但客户就是不愿意翻。客服主管统计了一组数据:每天 2000 通在线咨询中,67% 的问题答案已经在帮助中心文档里;客服平均翻找文档耗时 42 秒;客户平均等待 90 秒后才收到回复。这意味着每天有 1340 次咨询本可以被机器人自动回答,却耗费了 15 人时的人力。产品总监拍板:基于现有的 500 篇帮助文档,搭建一个 FAQ 智能问答机器人。客户用自然语言提问,机器人从文档中自动定位答案片段并回复,只有机器人找不到答案时才转人工。痛点问答(Question Answering, QA)是 NLP 中最贴近"搜索引擎体验"的任务,但实现远非字面搜索那么简单:答案不是关键词匹配:客户问"怎么退钱?",文档里写的是"退款流程",字面不匹配但语义等价。传统 ES 关键词搜索只能召回包含"退钱"的文档,找不到不包含该词但语义相关的段落。答案边界定位:即使在正确的段落里,模型需要精确找到答案片段的起始和结束位置——多一个字或少一个字都会让答案不完整。长文档滑窗:帮助文档通常 2000-5000 字,远超 BERT 的 512 token 限制。必须对文档做滑窗切