题目
A.动态规划与Q-Learning
B.策略优化与策略评估
C.Q-learning与贪心策略优化
D.价值函数计算与动作-价值函数计算
第1题
A.A.动态规划
B.B.深度学习
C.C.时序差分(Temporal Difference)
D.D.蒙特卡洛采样
第2题
A.Bellman方程
B.动态规划
C.蒙特卡洛采样
D.贪心策略
第3题
B.贪心策略函数
C.q函数
D.蒙特卡洛采样函数
第4题
A.复述策略
B.精细加工策略
C.组织策略
D.认知策略
第5题
A.A.支架式学习策略
B.B.抛锚式学习策略
C.C.随机进入学习策略
D.D.讲授型学习策略
第6题
A.否定质疑与假设
B.发现兴趣
C.判断选择使用聚合思维还是创造思维
D.更多学习的选择
第7题
A.强化必有必保商品策略
B.突出综合贡献率高的商品策略
C.加强毛利率高的商品策略
D.优化毛利率偏低的商品策略
第8题
A.组织策略
B.认知策略
C.精细加工策略
D.资源管理策略
第9题
A.学习技能
B.技能学习
C.学习策略
D.策略学习
第10题
A.动作-价值函数
B.采样函数
C.策略学习与优化
D.价值函数
1. 搜题次数扣减规则:
备注:网站、APP、小程序均支持文字搜题、查看答案;语音搜题、单题拍照识别、整页拍照识别仅APP、小程序支持。
2. 使用语音搜索、拍照搜索等AI功能需安装APP(或打开微信小程序)。
3. 搜题卡过期将作废,不支持退款,请在有效期内使用完毕。
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!