机器学习算法分类

对机器学习进行系统分类有助于在真实业务中更快地匹配问题结构、数据约束与资源预算,并据此选择合适的模型族、优化策略与评估路径。常见维度包括监督信号、交互方式、任务目标与工程形态。

1. 按监督信号

  • 监督学习:以标注数据为监督(见 监督机器学习算法)。
  • 非监督学习:聚类、降维、主题模型与密度估计(见 非监督机器学习算法)。
  • 自监督学习:掩码建模、对比学习,为大模型预训练提供可扩展监督。
  • 半监督学习:少量标签 + 大量无标签联合训练。

2. 按交互方式

  • 强化学习:状态—动作—奖励的序列决策(见 强化机器学习算法)。
  • 离线学习:以静态日志训练,关注分布偏移与反事实;
  • 主动学习:预算受限的标注选择;
  • 在线学习:流式数据的持续更新与漂移应对。

3. 按任务目标

  • 判别式:直接学习 p(y|x),如分类/回归;
  • 生成式:学习 p(x) 或 p(x,y),支持生成与缺失值填补;
  • 序列建模:语言建模、时间序列、事件预测;
  • 多模态:跨模态对齐与联合建模。

4. 现代范式

  • 预训练 → 微调:指令对齐、RLHF/RLAIF、PEFT(如 LoRA微调神经网络训练);
  • 检索增强:检索增强生成 提升事实性与时效性;
  • 模块化:可插拔的编码器/重排器/生成器与评估管线。

5. 工程与评估

6. 实践清单

  • 需求澄清 → 方案备选 → 小样本试验 → 指标与样本级诊断 → 上线灰度 → 回滚与复盘;
  • 构建知识库:与名词卡、案例与图谱联动,维护统一术语与链接网络。

7. 参考资料

链接