词语策略迭代法的详细解释,策略迭代法的拼音及基本释义

策略迭代法

【词语拼音】cè lüè dié dài fǎ

【词语繁体】策略叠代法

【词语结构】式词语

【词语字数】五字词语

【网络解释】
策略迭代法(policy iteration method)是动态规划中求最优策略的基本方法之一。它借助于动态规划基本方程,交替使用“求值计算”和“策略改进”两个步骤,求出逐次改进的、最终达到或收敛于最优策略的策略序列。