RAG系统设计题
RAG 系统设计题是 AI 应用面试高频题。回答时不要只讲向量数据库,要覆盖文档、检索、权限、生成、评估和运维。
# 1. 题目:设计一个企业知识库问答系统
回答主线:
文档接入
-> 解析清洗
-> 切分
-> 向量化和索引
-> 用户提问
-> 权限过滤
-> 混合检索
-> 重排
-> 上下文拼接
-> 模型生成
-> 引用和反馈
# 2. 离线索引链路
要点:
- 支持 Markdown、PDF、Word、网页等。
- 清洗页眉页脚、广告、重复内容。
- 保留标题、表格、代码块和元数据。
- 按标题、段落或语义切分 Chunk。
- Chunk 存储来源、版本、权限、更新时间。
- 使用 Embedding 写入向量库,同时可建关键词索引。
# 3. 在线问答链路
要点:
- 用户问题进入后先做身份识别和权限过滤。
- 使用向量检索 + 关键词检索 + 元数据过滤。
- 对候选结果去重和 Rerank。
- 拼接上下文时保留来源编号。
- Prompt 要求只基于资料回答。
- 资料不足时拒答。
- 返回答案和引用。
# 4. 权限设计
重点表达:
权限必须在检索阶段完成,不能把无权文档放进模型上下文后再要求模型不要泄露。
可以按租户、部门、项目、角色和文档 ACL 做过滤。
# 5. 评估指标
| 链路 | 指标 |
|---|---|
| 检索 | Recall@K、Precision@K、MRR |
| 生成 | 正确性、完整性、忠实性 |
| 引用 | 引用准确率 |
| 安全 | 越权率、拦截率 |
| 体验 | 延迟、点踩率、转人工率 |
# 6. 常见优化
- 优化文档清洗。
- 调整 Chunk 大小和重叠。
- 使用混合检索。
- 加 Rerank。
- 优化 Prompt 的拒答规则。
- 建立失败样本评估集。
- 对热点问题做缓存。
# 7. 容易漏的点
- 文档解析和清洗。
- 权限过滤。
- 引用来源。
- 资料不足时拒答。
- 文档更新和索引增量同步。
- RAG 评估闭环。
# 8. 简洁答法
我会把系统分成离线索引和在线问答两条链路。离线负责文档解析、清洗、切分、向量化和元数据入库;在线负责用户鉴权、混合检索、重排、上下文拼接和模型生成。权限过滤必须在检索阶段完成,答案需要返回引用。上线后通过检索指标、答案正确性、引用准确率和用户反馈持续优化。
上次更新: 2026/06/25, 17:53:09