1.什么是序贯决策
序贯决策是用于随机性或不确定性动态系统最优化的决策方法。
2.序贯决策的特点
序贯决策的特点是:
①所研究的系统是动态的,即系统所处的状态与时间有关,可周期(或连续)地对它观察;
②决策是序贯地进行的,即每个时刻根据所观察到的状态和以前状态的记录,从一组可行方案中选用一个最优方案(即作最优决策),使取决于状态的某个目标函数取最优值(极大或极小值);
③系统下一步(或未来)可能出现的状态是随机的或不确定的。
序贯决策是用于随机性或不确定性动态系统最优化的决策方法。
序贯决策的特点是:
①所研究的系统是动态的,即系统所处的状态与时间有关,可周期(或连续)地对它观察;
②决策是序贯地进行的,即每个时刻根据所观察到的状态和以前状态的记录,从一组可行方案中选用一个最优方案(即作最优决策),使取决于状态的某个目标函数取最优值(极大或极小值);
③系统下一步(或未来)可能出现的状态是随机的或不确定的。