Wrayの知识库 Wrayの知识库
首页
  • Java 基础
  • Java 集合
  • Java 并发
  • Java IO
  • JVM
  • Spring Framework
  • Spring Boot
  • Spring Cloud
  • Spring Security
  • MySQL
  • Redis
  • 计算机基础
  • 操作系统原理
  • Linux
  • MacOS
  • Windows
  • 系统工程与研究专题
  • AI 基础
  • 大模型基础
  • Prompt 工程
  • RAG 检索增强生成
  • Agent 智能体
  • AI 应用开发
  • AI 工程化
  • AI 安全与治理
  • AI 面试与设计题
  • 纸质书
  • 电子书
  • 学习课程
疑难杂症
GitHub (opens new window)
首页
  • Java 基础
  • Java 集合
  • Java 并发
  • Java IO
  • JVM
  • Spring Framework
  • Spring Boot
  • Spring Cloud
  • Spring Security
  • MySQL
  • Redis
  • 计算机基础
  • 操作系统原理
  • Linux
  • MacOS
  • Windows
  • 系统工程与研究专题
  • AI 基础
  • 大模型基础
  • Prompt 工程
  • RAG 检索增强生成
  • Agent 智能体
  • AI 应用开发
  • AI 工程化
  • AI 安全与治理
  • AI 面试与设计题
  • 纸质书
  • 电子书
  • 学习课程
疑难杂症
GitHub (opens new window)
  • AI概述
  • AI基础

  • 大模型基础

  • Prompt工程

  • RAG检索增强生成

    • RAG检索增强生成概述
      • 1. RAG 基本链路
      • 2. 可以展开的知识点
      • 本章节目录
      • 3. RAG 和普通问答的区别
      • 4. RAG 常见优化方向
      • 5. Tips 快问快答
    • RAG是什么
    • 文档解析与清洗
    • 文档切分策略
    • Embedding与语义检索
    • 向量数据库基础
    • 关键词向量与混合检索
    • Rerank重排与上下文拼接
    • RAG评估与优化
  • Agent智能体

  • AI应用开发

  • AI工程化

  • AI安全与治理

  • AI面试与设计题

目录

RAG检索增强生成概述

RAG(Retrieval-Augmented Generation,检索增强生成)是一种把外部知识检索结果提供给大模型,再由模型基于检索上下文生成答案的方法。它常用于企业知识库、私有文档问答、客服助手、规章制度查询和研发文档助手。

# 1. RAG 基本链路

文档采集
  -> 文档清洗
  -> 文档切分
  -> Embedding 向量化
  -> 向量库入库
  -> 用户提问
  -> 检索召回
  -> 重排与过滤
  -> 拼接上下文
  -> 大模型生成
  -> 引用与答案校验

# 2. 可以展开的知识点

方向 重点问题 后续文章建议
RAG 基础 RAG 解决什么问题 RAG 是什么
文档处理 PDF、Word、网页如何清洗 文档解析与清洗
Chunk 切分 文档怎么切才适合检索 文档切分策略
Embedding 文本如何转成向量 Embedding 与语义检索
向量数据库 向量如何存储和检索 向量数据库基础
召回策略 如何找到相关内容 关键词、向量与混合检索
Rerank 如何提升上下文相关性 重排模型与结果过滤
答案生成 如何让答案基于资料 上下文拼接与引用
质量评估 RAG 效果怎么评估 RAG 评估指标

# 本章节目录

  • RAG是什么
  • 文档解析与清洗
  • 文档切分策略
  • Embedding与语义检索
  • 向量数据库基础
  • 关键词向量与混合检索
  • Rerank重排与上下文拼接
  • RAG评估与优化

# 3. RAG 和普通问答的区别

对比项 普通大模型问答 RAG 问答
知识来源 主要依赖模型已有知识 依赖外部文档和检索结果
更新成本 需要模型更新或重新训练 更新文档和索引即可
可追溯性 通常较弱 可以返回引用来源
适合场景 通用知识、开放问答 企业知识库、私有资料、频繁更新内容
主要风险 幻觉、过时信息 检索不准、上下文污染、引用错误

# 4. RAG 常见优化方向

  1. 提升文档质量,删除重复、过期、噪声和权限不匹配内容。
  2. 优化切分策略,让每个 Chunk 保持语义完整。
  3. 使用混合检索,同时结合关键词和向量语义召回。
  4. 引入重排模型,把最相关内容放到上下文前面。
  5. 在答案中返回引用来源,方便用户核对。
  6. 对低置信度问题设计拒答和转人工策略。

# 5. Tips 快问快答

Q:RAG 能完全解决幻觉吗?

A:不能。RAG 能降低幻觉,但如果检索内容错误、上下文不相关或 Prompt 约束不足,模型仍然可能生成错误答案。

Q:Chunk 越小越好吗?

A:不是。Chunk 太小会丢上下文,太大会影响召回精度和成本。要结合文档结构、任务类型和模型窗口测试。

Q:向量数据库是不是 RAG 的全部?

A:不是。向量库只是检索链路的一部分,RAG 效果还取决于文档处理、切分、召回、重排、Prompt、评估和权限控制。

上次更新: 2026/06/25, 17:53:09
Prompt注入基础
RAG是什么

← Prompt注入基础 RAG是什么→

Copyright © 2023-2026 Wray | 鄂ICP备2024050235号-1
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式