预训练指令微调与对齐

大模型的能力通常来自多个训练阶段：预训练学习通用语言和知识，指令微调让模型理解人类任务，对齐让模型输出更符合偏好和安全要求。

# 1. 训练阶段总览

大规模语料
  -> 预训练
  -> 基础模型
  -> 指令微调
  -> 指令模型
  -> 偏好对齐 / 安全训练
  -> 可用于对话和应用的模型

预训练通常使用海量文本、代码和多模态数据，让模型学习通用模式。

常见目标是预测下一个 Token：

输入：今天天气很
目标：好

预训练带来的能力：

但基础模型不一定会按照人的指令回答，它可能只是续写文本。

指令微调用“指令 -> 回答”的数据训练模型，让模型更会遵循任务要求。

指令：总结下面这段话
输入：...
理想回答：...

指令微调改善的是交互能力：

对齐关注模型输出是否符合人类偏好、安全规范和产品边界。

对齐可以通过偏好数据、人工反馈、安全数据和规则策略实现。

Q：微调能让模型记住企业知识吗？

A：可以让模型学习一部分模式，但不适合频繁更新和需要可追溯的知识库。企业知识问答通常优先 RAG。

Q：对齐是不是只靠模型训练？

A：不是。产品层面的安全策略、权限控制、内容审核和审计同样重要。

Q：指令微调和 Prompt 工程有什么关系？

A：指令微调让模型更会听指令，Prompt 工程是在使用阶段把任务表达清楚。两者互补。

上次更新: 2026/06/25, 17:53:09