AI安全治理高频题

AI 安全治理题主要考察 Prompt 注入、数据泄露、工具调用安全、内容审核和审计。回答时要强调模型不是安全边界。

# 1. 什么是 Prompt 注入，如何防护

回答要点：

Prompt 注入是用户或外部内容诱导模型忽略规则或执行非预期行为。
来源包括用户输入、网页、RAG 文档、工具返回。
防护包括指令隔离、外部内容标记、权限校验、工具白名单、输出检查和审计。

关键句：

系统 Prompt 只能降低风险，不能替代工程安全边界。

# 2. 如何防止数据泄露

回答要点：

数据进入模型前做权限过滤。
敏感字段脱敏。
RAG 按用户身份过滤文档。
日志脱敏和访问控制。
外部模型调用要考虑数据出域和供应商条款。
高敏感数据禁止输入或走私有化方案。

# 3. 工具调用如何保证安全

回答要点：

工具分级。
最小权限。
参数 Schema 校验。
用户权限校验。
高风险动作二次确认。
幂等和回滚。
全链路审计。

不要让模型直接执行 SQL、命令或生产操作。

# 4. 内容审核怎么做

回答要点：

输入和输出都要审核。
风险类型包括违法、暴力、隐私、歧视、高风险专业建议等。
使用规则、审核模型和人工审核分层处理。
拒答时给安全替代建议。
不暴露具体安全规则。

# 5. 企业 AI 使用规范包含什么

要点：

数据分级。
场景分级。
可用工具白名单。
敏感数据禁止输入。
对外输出人工复核。
日志审计。
违规处理和培训。

# 6. 如何做 AI 审计

记录：

用户身份。
请求时间和场景。
Prompt 版本。
模型。
检索资料。
工具调用。
安全拦截。
输出摘要。
人工确认记录。

敏感内容要脱敏、加密和限制访问。

# 7. 容易漏的点

权限过滤必须在检索或查询阶段完成。
Prompt 注入可能来自 RAG 文档。
工具调用参数不能直接信任。
日志本身也可能泄露数据。
高风险输出要人工复核。

上次更新: 2026/06/25, 17:53:09

← AI工程化高频题