策略迭代法
【词语拼音】cè lüè dié dài fǎ
【词语繁体】策略叠代法
【词语结构】式词语
【词语字数】五字词语
【网络解释】
策略迭代法(policy iteration method)是动态规划中求最优策略的基本方法之一。它借助于动态规划基本方程,交替使用“求值计算”和“策略改进”两个步骤,求出逐次改进的、最终达到或收敛于最优策略的策略序列。
迭代法策略时代半迭代法策略疗法算法策略迭代策略选权迭代法一般迭代法函数迭代法牛顿迭代法感将法策略迭代器子空间迭代法策略哥大策略策略学牛策略策谋略红策略方略策策略组纯策略策謀略时代迭更迭代思维迭代循环广告策略策划迭代计算策略集合策略交易成本策略策略联盟免费策略空间策略战略对策促销策略战略决策搜索策略控制策略更换策略赢家策略维护策略思维策略品牌策略谈判策略学习策略询问策略解题策略增强策略竞争策略保险策略储存策略迁就策略拉引策略迭迭经营策略认知策略免疫策略套利策略策略桌游采购策略商标策略说教策略编码策略觅食策略奇正策略追逐策略查询策略应对策略对称策略交互策略证书策略策略数块顺从策略创意策略归类策略组块策略策略大师黄金策略传播策略理解策略策略空间策略路由财富策略策略目标战棋策略云期策略分销策略正略钧策量化策略策略足球读取策略王的策略集中策略策略科技