RAG是什么

RAG（Retrieval-Augmented Generation）是检索增强生成。它先从外部知识库检索相关资料，再把资料作为上下文交给大模型生成答案。

# 1. RAG 解决的问题

大模型本身存在几个限制：

RAG 通过外部检索补充资料：

用户问题
  -> 检索知识库
  -> 找到相关资料
  -> 拼入上下文
  -> 大模型基于资料回答
  -> 返回答案和引用

离线索引链路：
文档 -> 解析 -> 清洗 -> 切分 -> 向量化 -> 入库

在线问答链路：
问题 -> 检索 -> 重排 -> 上下文拼接 -> 生成 -> 引用校验

离线链路决定知识质量，在线链路决定回答质量和用户体验。

Q：RAG 是不是就是向量数据库？

A：不是。向量数据库只是 RAG 的一部分，完整 RAG 还包括文档处理、切分、召回、重排、生成、引用、权限和评估。

Q：RAG 能让模型回答所有企业问题吗？

A：不能。前提是知识库中有正确资料，并且检索能找出来。资料缺失时应该拒答或转人工。

Q：RAG 为什么还会答错？

A：可能是文档错、切分差、召回错、重排差、上下文冲突或模型没有严格基于资料回答。

上次更新: 2026/06/25, 17:53:09