更多“动态规划的最优策略具有如下的性质:最优策略的后部子策略不是其对应后部子过程的最优策略;”相关的问题
第1题
强化学习的主要特点是通过试错来发现最优行为策略而不是带有标签的样本学习。
点击查看答案
第2题
当一个多智能体系统中的每个智能体都是自利的(使自身获利最大)时,每个智能体的最优策略的组合就是多智能体系统的最优策略,此时,只需一个集中式的控制器对每个智能体的策略进行控制。
点击查看答案
第3题
指标函数是衡量全过程策略或K子过程策略优劣的数量指标。
点击查看答案
第4题
博弈论的基本假设是()。
A.理性人假设
B.最优策略假设
C.理性共识假设
D.个体主义假设
点击查看答案
第5题
下列说法错误的是()
A.子博弈完美均衡一定是纳什均衡
B.纳什均衡未必是子博弈完美均衡
C.子博弈不包括整个博弈
D.局部的最优未必是全局的最优
点击查看答案
第6题
以严格竞争博弈为基础博弈的有限次重复博弈,该重复博弈的唯一子博弈精炼纳什均衡就是所有博弈方都始终采用这个基础博弈的()。
A.混合策略纳什均衡策略
B.纯策略纳什均衡策略
C.子博弈精炼纳什均衡策略
D.多重策略纳什均衡策略
点击查看答案
第7题
照相机拍卖假设张先生和李先生在英格兰式拍卖中竞买一架照相机。张先生的出价为100元,竞价涨幅为5元;李先生对相机的估价为114元,他不知道张先生的估价,但猜测可能是102或108。李先生有三种策略:出价105,110或弃拍。问: (1)二人的最优反应各是什么?(请写出分析过程) (2)该博弈的子博弈完美均衡是什么?
点击查看答案
第8题
下列属于服务营销组合策略增加的3P是()。
A.人的策略
B.过程策略
C.有形策略
D.媒体策略
E.公关策略
点击查看答案
第9题
若一个线性规划模型存在最优解,则其对偶模型也存在最优解,且两模型最优解分别对应的目标函数最优值必然相等。
点击查看答案
第10题
,有时又称为对策论,它是研究博弈情形下博弈参加者的理性行为选择的理论;也可以理解成它是关于竞争如何根据环境和竞争对手的情况变化,采取最优策略和行为的理论。
点击查看答案