强化机器学习算法(Reinforcement Learning)

定义

  • 通过与环境交互以最大化累积回报的序列决策学习范式,核心元素包含状态、动作、奖励与策略。