Wrayの知识库 Wrayの知识库
首页
  • Java 基础
  • Java 集合
  • Java 并发
  • Java IO
  • JVM
  • Spring Framework
  • Spring Boot
  • Spring Cloud
  • Spring Security
  • MySQL
  • Redis
  • 计算机基础
  • 操作系统原理
  • Linux
  • MacOS
  • Windows
  • 系统工程与研究专题
  • AI 基础
  • 大模型基础
  • Prompt 工程
  • RAG 检索增强生成
  • Agent 智能体
  • AI 应用开发
  • AI 工程化
  • AI 安全与治理
  • AI 面试与设计题
  • 纸质书
  • 电子书
  • 学习课程
疑难杂症
GitHub (opens new window)
首页
  • Java 基础
  • Java 集合
  • Java 并发
  • Java IO
  • JVM
  • Spring Framework
  • Spring Boot
  • Spring Cloud
  • Spring Security
  • MySQL
  • Redis
  • 计算机基础
  • 操作系统原理
  • Linux
  • MacOS
  • Windows
  • 系统工程与研究专题
  • AI 基础
  • 大模型基础
  • Prompt 工程
  • RAG 检索增强生成
  • Agent 智能体
  • AI 应用开发
  • AI 工程化
  • AI 安全与治理
  • AI 面试与设计题
  • 纸质书
  • 电子书
  • 学习课程
疑难杂症
GitHub (opens new window)
  • AI概述
  • AI基础

  • 大模型基础

  • Prompt工程

  • RAG检索增强生成

  • Agent智能体

  • AI应用开发

  • AI工程化

  • AI安全与治理

  • AI面试与设计题

    • AI面试与设计题概述
    • AI基础高频题
    • Prompt工程高频题
    • RAG系统设计题
      • 1. 题目:设计一个企业知识库问答系统
      • 2. 离线索引链路
      • 3. 在线问答链路
      • 4. 权限设计
      • 5. 评估指标
      • 6. 常见优化
      • 7. 容易漏的点
      • 8. 简洁答法
    • Agent系统设计题
    • AI工程化高频题
    • AI安全治理高频题
目录

RAG系统设计题

RAG 系统设计题是 AI 应用面试高频题。回答时不要只讲向量数据库,要覆盖文档、检索、权限、生成、评估和运维。

# 1. 题目:设计一个企业知识库问答系统

回答主线:

文档接入
  -> 解析清洗
  -> 切分
  -> 向量化和索引
  -> 用户提问
  -> 权限过滤
  -> 混合检索
  -> 重排
  -> 上下文拼接
  -> 模型生成
  -> 引用和反馈

# 2. 离线索引链路

要点:

  • 支持 Markdown、PDF、Word、网页等。
  • 清洗页眉页脚、广告、重复内容。
  • 保留标题、表格、代码块和元数据。
  • 按标题、段落或语义切分 Chunk。
  • Chunk 存储来源、版本、权限、更新时间。
  • 使用 Embedding 写入向量库,同时可建关键词索引。

# 3. 在线问答链路

要点:

  • 用户问题进入后先做身份识别和权限过滤。
  • 使用向量检索 + 关键词检索 + 元数据过滤。
  • 对候选结果去重和 Rerank。
  • 拼接上下文时保留来源编号。
  • Prompt 要求只基于资料回答。
  • 资料不足时拒答。
  • 返回答案和引用。

# 4. 权限设计

重点表达:

权限必须在检索阶段完成,不能把无权文档放进模型上下文后再要求模型不要泄露。

可以按租户、部门、项目、角色和文档 ACL 做过滤。

# 5. 评估指标

链路 指标
检索 Recall@K、Precision@K、MRR
生成 正确性、完整性、忠实性
引用 引用准确率
安全 越权率、拦截率
体验 延迟、点踩率、转人工率

# 6. 常见优化

  • 优化文档清洗。
  • 调整 Chunk 大小和重叠。
  • 使用混合检索。
  • 加 Rerank。
  • 优化 Prompt 的拒答规则。
  • 建立失败样本评估集。
  • 对热点问题做缓存。

# 7. 容易漏的点

  1. 文档解析和清洗。
  2. 权限过滤。
  3. 引用来源。
  4. 资料不足时拒答。
  5. 文档更新和索引增量同步。
  6. RAG 评估闭环。

# 8. 简洁答法

我会把系统分成离线索引和在线问答两条链路。离线负责文档解析、清洗、切分、向量化和元数据入库;在线负责用户鉴权、混合检索、重排、上下文拼接和模型生成。权限过滤必须在检索阶段完成,答案需要返回引用。上线后通过检索指标、答案正确性、引用准确率和用户反馈持续优化。

上次更新: 2026/06/25, 17:53:09
Prompt工程高频题
Agent系统设计题

← Prompt工程高频题 Agent系统设计题→

Copyright © 2023-2026 Wray | 鄂ICP备2024050235号-1
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式