AI安全与治理概述

AI 安全与治理关注模型在真实业务中的风险边界。AI 应用可能暴露提示词、泄露私有数据、被 Prompt 注入诱导、越权调用工具，也可能生成不合规内容或错误决策。越是接近生产业务，越需要把安全治理前置。

# 1. AI 风险地图

用户输入
  -> Prompt 注入
  -> 数据泄露
  -> 越权访问
  -> 工具误调用
  -> 输出不合规
  -> 审计缺失
  -> 业务损失

# 2. 可以展开的知识点

方向	重点问题	后续文章建议
Prompt 注入	用户如何诱导模型忽略系统规则	Prompt 注入与防护
数据安全	私有数据如何避免泄露	数据脱敏与权限过滤
工具权限	Agent 调工具如何控制风险	工具调用安全
内容安全	如何拦截违规和高风险输出	内容审核与安全策略
企业治理	企业内部如何规范使用 AI	企业 AI 使用规范
审计追踪	如何追溯 AI 决策过程	日志审计与合规

# 本章节目录

# 3. 常见风险与防护

风险	示例	防护方式
Prompt 注入	用户要求模型忽略原有规则	输入隔离、规则校验、输出审查
数据泄露	模型返回不属于当前用户的数据	权限过滤、数据脱敏、租户隔离
工具越权	Agent 调用高风险接口	最小权限、人审、工具白名单
输出不合规	生成违法、歧视或敏感内容	内容安全模型、规则过滤、人工复核
供应商风险	外部模型保存或使用输入数据	合同约束、私有化、敏感数据不出域

# 4. 治理原则

权限判断必须由业务系统完成，不能只依赖模型自觉遵守。
敏感数据进入模型前要做分类、脱敏和最小化。
工具调用要有白名单、参数校验、二次确认和审计。
对外输出要经过安全策略和业务规则校验。
企业内部要明确哪些数据、场景和岗位可以使用 AI。

# 5. Tips 快问快答

Q：只靠系统 Prompt 能防住 Prompt 注入吗？

A：不能。系统 Prompt 有帮助，但真正的防护要依赖输入隔离、权限控制、工具白名单、输出校验和审计。

Q：AI 应用为什么容易出现权限问题？

A：模型本身不理解企业权限边界。如果检索、工具或数据接口没有按用户身份过滤，就可能把不该看的内容带入上下文或输出。

Q：企业使用外部模型要注意什么？

A：要关注数据是否出域、供应商是否训练使用输入数据、日志保存周期、访问权限、合规要求和应急处置流程。

上次更新: 2026/06/25, 17:53:09

← 日志指标与链路追踪 Prompt注入与防护→