模型优化(Model Optimization) 范围 训练期:优化器/学习率计划、正则化、并行策略(数据并行/张量并行/传递并行/ZeRO微调神经网络训练)。 推理期:蒸馏、剪枝、模型量化、图编译、算子融合、缓存与批处理调度。 目标 在质量—成本—时延—吞吐等维度做全局权衡。 参考 具体工程手册见《模型优化方法》。