以下关于强化学习，描述错误的是（）。

单选题以下关于强化学习，描述错误的是（）。

A、强化学习通过智能主体与环境的连续交互过程,学习最优的行为策略

B、强化学习非常适合用于智能决策和博弈场景

C、强化学习和马尔科夫决策过程无关

D、强化学习中的智能主体可以通过当前的状态和获得奖励,采取下一步的动作

查看答案

下载APP答题

由4m***08提供分享举报纠错

相关试题

单选题证券投资组合优化问题一直是金融投资决策领域的研究热点。搜索算法由于可以兼顾运算效率和结果质量两方面的要求，因此，它被广泛用来求解这一问题。下列关于搜索技术的阐述中，全部正确的组合是（）。 (1) 为在各个可能的解中找到一条最优解，一般首先把解空间中各种可能要素用状态空间表示出来，状态空间可以采用有向图来描述。 (2) 搜索技术要解决的三个基本问题是：从初始问题到最终答案是否存在一条关键路径；找到这个路径的时间、成本和质量是否在可接受范围内；搜索过程在什么情况下效率最高。 (3) 启发式函数 f(n) 可以用来估计带搜索结点的可行性程度，并依次给它们排定次序。 (4) 深度优先搜索是从搜索树的根结点开始，沿着搜索树的宽度遍历搜索树的结点，当所有结点均被访问后，算法则终止。 (5) A*搜索算法是基于估价函数的一种加权启发式图搜索算法，它每次按照 f(n) 的大小来对搜索的结点进行排序，在每次扩展结点时，都是选择当前 f(n) 值最小的结点来扩展。

A、(1)(2)(4)

B、(1)(3)(5)

C、(2)(3)(4)

D、(2)(4)(5)

查看答案

单选题遗传算法中，当所有个体的适应度评价值趋于相同时，该种群被视为（）。

A、进化成熟

B、进化停滞

C、进化失败

D、进化优化

查看答案

单选题在股票预测模型常用到可信度推理网络。关于可信度方法，下面说法错误的是（）。