RAG检索增强生成概述
RAG(Retrieval-Augmented Generation,检索增强生成)是一种把外部知识检索结果提供给大模型,再由模型基于检索上下文生成答案的方法。它常用于企业知识库、私有文档问答、客服助手、规章制度查询和研发文档助手。
# 1. RAG 基本链路
文档采集
-> 文档清洗
-> 文档切分
-> Embedding 向量化
-> 向量库入库
-> 用户提问
-> 检索召回
-> 重排与过滤
-> 拼接上下文
-> 大模型生成
-> 引用与答案校验
# 2. 可以展开的知识点
| 方向 | 重点问题 | 后续文章建议 |
|---|---|---|
| RAG 基础 | RAG 解决什么问题 | RAG 是什么 |
| 文档处理 | PDF、Word、网页如何清洗 | 文档解析与清洗 |
| Chunk 切分 | 文档怎么切才适合检索 | 文档切分策略 |
| Embedding | 文本如何转成向量 | Embedding 与语义检索 |
| 向量数据库 | 向量如何存储和检索 | 向量数据库基础 |
| 召回策略 | 如何找到相关内容 | 关键词、向量与混合检索 |
| Rerank | 如何提升上下文相关性 | 重排模型与结果过滤 |
| 答案生成 | 如何让答案基于资料 | 上下文拼接与引用 |
| 质量评估 | RAG 效果怎么评估 | RAG 评估指标 |
# 本章节目录
# 3. RAG 和普通问答的区别
| 对比项 | 普通大模型问答 | RAG 问答 |
|---|---|---|
| 知识来源 | 主要依赖模型已有知识 | 依赖外部文档和检索结果 |
| 更新成本 | 需要模型更新或重新训练 | 更新文档和索引即可 |
| 可追溯性 | 通常较弱 | 可以返回引用来源 |
| 适合场景 | 通用知识、开放问答 | 企业知识库、私有资料、频繁更新内容 |
| 主要风险 | 幻觉、过时信息 | 检索不准、上下文污染、引用错误 |
# 4. RAG 常见优化方向
- 提升文档质量,删除重复、过期、噪声和权限不匹配内容。
- 优化切分策略,让每个 Chunk 保持语义完整。
- 使用混合检索,同时结合关键词和向量语义召回。
- 引入重排模型,把最相关内容放到上下文前面。
- 在答案中返回引用来源,方便用户核对。
- 对低置信度问题设计拒答和转人工策略。
# 5. Tips 快问快答
Q:RAG 能完全解决幻觉吗?
A:不能。RAG 能降低幻觉,但如果检索内容错误、上下文不相关或 Prompt 约束不足,模型仍然可能生成错误答案。
Q:Chunk 越小越好吗?
A:不是。Chunk 太小会丢上下文,太大会影响召回精度和成本。要结合文档结构、任务类型和模型窗口测试。
Q:向量数据库是不是 RAG 的全部?
A:不是。向量库只是检索链路的一部分,RAG 效果还取决于文档处理、切分、召回、重排、Prompt、评估和权限控制。
上次更新: 2026/06/25, 17:53:09