RAG检索增强生成概述

RAG（Retrieval-Augmented Generation，检索增强生成）是一种把外部知识检索结果提供给大模型，再由模型基于检索上下文生成答案的方法。它常用于企业知识库、私有文档问答、客服助手、规章制度查询和研发文档助手。

# 1. RAG 基本链路

文档采集
  -> 文档清洗
  -> 文档切分
  -> Embedding 向量化
  -> 向量库入库
  -> 用户提问
  -> 检索召回
  -> 重排与过滤
  -> 拼接上下文
  -> 大模型生成
  -> 引用与答案校验

# 2. 可以展开的知识点

方向	重点问题	后续文章建议
RAG 基础	RAG 解决什么问题	RAG 是什么
文档处理	PDF、Word、网页如何清洗	文档解析与清洗
Chunk 切分	文档怎么切才适合检索	文档切分策略
Embedding	文本如何转成向量	Embedding 与语义检索
向量数据库	向量如何存储和检索	向量数据库基础
召回策略	如何找到相关内容	关键词、向量与混合检索
Rerank	如何提升上下文相关性	重排模型与结果过滤
答案生成	如何让答案基于资料	上下文拼接与引用
质量评估	RAG 效果怎么评估	RAG 评估指标

# 本章节目录

# 3. RAG 和普通问答的区别

对比项	普通大模型问答	RAG 问答
知识来源	主要依赖模型已有知识	依赖外部文档和检索结果
更新成本	需要模型更新或重新训练	更新文档和索引即可
可追溯性	通常较弱	可以返回引用来源
适合场景	通用知识、开放问答	企业知识库、私有资料、频繁更新内容
主要风险	幻觉、过时信息	检索不准、上下文污染、引用错误

# 4. RAG 常见优化方向

提升文档质量，删除重复、过期、噪声和权限不匹配内容。
优化切分策略，让每个 Chunk 保持语义完整。
使用混合检索，同时结合关键词和向量语义召回。
引入重排模型，把最相关内容放到上下文前面。
在答案中返回引用来源，方便用户核对。
对低置信度问题设计拒答和转人工策略。

# 5. Tips 快问快答

Q：RAG 能完全解决幻觉吗？

A：不能。RAG 能降低幻觉，但如果检索内容错误、上下文不相关或 Prompt 约束不足，模型仍然可能生成错误答案。

Q：Chunk 越小越好吗？

A：不是。Chunk 太小会丢上下文，太大会影响召回精度和成本。要结合文档结构、任务类型和模型窗口测试。

Q：向量数据库是不是 RAG 的全部？

A：不是。向量库只是检索链路的一部分，RAG 效果还取决于文档处理、切分、召回、重排、Prompt、评估和权限控制。

上次更新: 2026/06/25, 17:53:09

← Prompt注入基础 RAG是什么→