Reflection与自我评估

Reflection 是让 Agent 对自己的中间结果或最终输出进行检查和修正的机制。它可以提升质量，但不能替代外部验证。

# 1. Reflection 的作用

生成结果
  -> 检查是否满足目标
  -> 发现问题
  -> 修正结果
  -> 输出最终答案

常见用途：

请检查上一步结果是否满足以下标准：
1. 是否回答了用户问题。
2. 是否只基于给定资料。
3. 是否包含必要字段。
4. 是否存在无法验证的结论。
5. 是否需要补充或修正。

只输出需要修改的地方和修改后的版本。

模型自查仍然是模型输出，可能出现：

因此高风险场景要结合规则、测试、工具和人审。

Reflection 是辅助，不是安全边界。

Q：让模型“再检查一遍”有用吗？

A：有时有用，特别是格式、遗漏和简单逻辑问题。但不能保证事实正确。

Q：Reflection 会增加成本吗？

A：会。它增加调用次数或 Token，因此要用于值得提升质量的场景。

Q：能不能让一个模型检查另一个模型？

A：可以，这种方式能减少部分偏差，但仍然不能替代确定性验证。

上次更新: 2026/06/25, 17:53:09