Wrayの知识库 Wrayの知识库
首页
  • Java 基础
  • Java 集合
  • Java 并发
  • Java IO
  • JVM
  • Spring Framework
  • Spring Boot
  • Spring Cloud
  • Spring Security
  • MySQL
  • Redis
  • 计算机基础
  • 操作系统原理
  • Linux
  • MacOS
  • Windows
  • 系统工程与研究专题
  • AI 基础
  • 大模型基础
  • Prompt 工程
  • RAG 检索增强生成
  • Agent 智能体
  • AI 应用开发
  • AI 工程化
  • AI 安全与治理
  • AI 面试与设计题
  • 纸质书
  • 电子书
  • 学习课程
疑难杂症
GitHub (opens new window)
首页
  • Java 基础
  • Java 集合
  • Java 并发
  • Java IO
  • JVM
  • Spring Framework
  • Spring Boot
  • Spring Cloud
  • Spring Security
  • MySQL
  • Redis
  • 计算机基础
  • 操作系统原理
  • Linux
  • MacOS
  • Windows
  • 系统工程与研究专题
  • AI 基础
  • 大模型基础
  • Prompt 工程
  • RAG 检索增强生成
  • Agent 智能体
  • AI 应用开发
  • AI 工程化
  • AI 安全与治理
  • AI 面试与设计题
  • 纸质书
  • 电子书
  • 学习课程
疑难杂症
GitHub (opens new window)
  • AI概述
  • AI基础

  • 大模型基础

  • Prompt工程

  • RAG检索增强生成

  • Agent智能体

    • Agent智能体概述
    • Agent是什么
    • Function Calling与工具调用
    • Planning任务规划
    • Memory记忆机制
    • Reflection与自我评估
      • 1. Reflection 的作用
      • 2. 自我评估模板
      • 3. Reflection 适合场景
      • 4. 局限性
      • 5. 外部验证
      • 6. 工程建议
      • 7. Tips 快问快答
    • Multi-Agent多智能体
    • Agent可靠性与权限边界
  • AI应用开发

  • AI工程化

  • AI安全与治理

  • AI面试与设计题

目录

Reflection与自我评估

Reflection 是让 Agent 对自己的中间结果或最终输出进行检查和修正的机制。它可以提升质量,但不能替代外部验证。

# 1. Reflection 的作用

生成结果
  -> 检查是否满足目标
  -> 发现问题
  -> 修正结果
  -> 输出最终答案

常见用途:

  • 检查是否遗漏要求。
  • 检查格式是否正确。
  • 检查引用是否支持结论。
  • 检查工具调用是否成功。
  • 检查计划是否需要调整。

# 2. 自我评估模板

请检查上一步结果是否满足以下标准:
1. 是否回答了用户问题。
2. 是否只基于给定资料。
3. 是否包含必要字段。
4. 是否存在无法验证的结论。
5. 是否需要补充或修正。

只输出需要修改的地方和修改后的版本。

# 3. Reflection 适合场景

场景 价值
长文总结 检查遗漏和重复
结构化输出 检查格式和字段
代码生成 检查潜在错误和测试
RAG 回答 检查引用是否支持答案
Agent 执行 判断是否需要继续工具调用

# 4. 局限性

模型自查仍然是模型输出,可能出现:

  • 自信地认可错误答案。
  • 无法发现缺失事实。
  • 被同一上下文偏差影响。
  • 为了修正而引入新错误。

因此高风险场景要结合规则、测试、工具和人审。

# 5. 外部验证

任务 更可靠的验证
JSON 输出 Schema 校验
代码 单元测试、编译、静态检查
数值计算 计算工具
事实问答 数据库、检索引用
权限判断 业务权限系统

Reflection 是辅助,不是安全边界。

# 6. 工程建议

  1. 对低成本任务可以用自我评估提升质量。
  2. 对结构化输出优先用程序校验。
  3. 对事实型问题要求引用证据。
  4. 对高风险动作必须使用外部规则和人工确认。
  5. 记录 Reflection 前后的结果,便于评估是否真的改善。

# 7. Tips 快问快答

Q:让模型“再检查一遍”有用吗?

A:有时有用,特别是格式、遗漏和简单逻辑问题。但不能保证事实正确。

Q:Reflection 会增加成本吗?

A:会。它增加调用次数或 Token,因此要用于值得提升质量的场景。

Q:能不能让一个模型检查另一个模型?

A:可以,这种方式能减少部分偏差,但仍然不能替代确定性验证。

上次更新: 2026/06/25, 17:53:09
Memory记忆机制
Multi-Agent多智能体

← Memory记忆机制 Multi-Agent多智能体→

Copyright © 2023-2026 Wray | 鄂ICP备2024050235号-1
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式