数据脱敏与权限过滤

AI 应用经常处理用户数据、企业文档和业务记录。数据进入模型前必须经过权限过滤和必要脱敏，避免泄露敏感信息。

# 1. 风险链路

业务数据
  -> 检索或查询
  -> 拼入 Prompt
  -> 模型处理
  -> 输出给用户
  -> 日志保存

任何环节都可能泄露数据。

权限过滤必须在数据进入模型前完成。

用户身份
  -> 权限系统
  -> 数据查询或检索过滤
  -> 只返回可访问数据
  -> 拼入模型上下文

不能把无权数据放进上下文后再要求模型不要说。

脱敏要结合任务需求。过度脱敏会影响模型完成任务，脱敏不足会泄露数据。

AI 日志也可能包含敏感信息。

建议：

Q：脱敏后模型效果会不会变差？

A：可能会。需要在隐私和任务效果之间平衡，尽量只保留完成任务必要的信息。

Q：权限过滤应该由模型做吗？

A：不能。权限过滤必须由业务系统或检索系统基于用户身份强制执行。

Q：内部系统用 AI 就不用脱敏吗？

A：不是。内部系统也有权限边界和审计要求，尤其是跨部门和多租户场景。

上次更新: 2026/06/25, 17:53:09