指令微调(Instruction Tuning)

定义

  • 通过指令—响应格式的数据对大模型进行监督微调,使模型学会遵循自然语言指令、对齐人类偏好与任务通用性。

数据与目标

  • 数据来源:人工标注、合成数据(自指令/自我提升)、开源集合;
  • 目标:最小化指令到期望响应的监督损失;可结合偏好对齐(RLHF/RLAIF)。

工程实践