日志指标与链路追踪

AI 应用排查问题比普通接口更复杂，因为一次回答可能涉及 Prompt、模型、检索、重排、工具调用和安全策略。必须建立日志、指标和链路追踪。

# 1. 需要观测什么

用户请求
  -> Prompt 版本
  -> 检索结果
  -> 模型调用
  -> 工具调用
  -> 安全检查
  -> 输出结果
  -> 用户反馈

每个阶段都要能定位耗时、错误和输入输出摘要。

敏感信息要脱敏或摘要记录。

Trace
├─ API 请求
├─ RAG 检索
├─ Rerank
├─ Model Call
├─ Tool Call
├─ Safety Check
└─ Response

链路追踪能回答“慢在哪里”“错在哪里”“用了哪些资料”。

日志不能无脑记录完整 Prompt 和输出。

建议：

Q：要不要记录完整 Prompt？

A：调试有价值，但有隐私风险。生产建议脱敏、分级访问和设置保留周期。

Q：AI 应用最重要的指标是什么？

A：要看场景。通常至少要有质量、延迟、成本、安全和用户反馈五类指标。

Q：如何排查 RAG 答错？

A：先看检索命中的 Chunk，再看重排顺序、上下文拼接、Prompt 和最终模型输出。

上次更新: 2026/06/25, 17:53:09