单选题 以下关于强化学习,描述错误的是( )。

A、 强化学习通过智能主体与环境的连续交互过程,学习最优的行为策略
B、 强化学习非常适合用于智能决策和博弈场景
C、 强化学习和马尔科夫决策过程无关
D、 强化学习中的智能主体可以通过当前的状态和获得奖励,采取下一步的动作
下载APP答题
由4m***08提供 分享 举报 纠错

相关试题

单选题 证券投资组合优化问题一直是金融投资决策领域的研究热点。搜索算法由于可以兼顾运算效率和结果质量两方面的要求,因此,它被广泛用来求解这一问题。下列关于搜索技术的阐述中,全部正确的组合是( )。 (1) 为在各个可能的解中找到一条最优解,一般首先把解空间中各种可能要素用状态空间表示出来,状态空间可以采用有向图来描述。 (2) 搜索技术要解决的三个基本问题是:从初始问题到最终答案是否存在一条关键路径;找到这个路径的时间、成本和质量是否在可接受范围内;搜索过程在什么情况下效率最高。 (3) 启发式函数 f(n) 可以用来估计带搜索结点的可行性程度,并依次给它们排定次序。 (4) 深度优先搜索是从搜索树的根结点开始,沿着搜索树的宽度遍历搜索树的结点,当所有结点均被访问后,算法则终止。 (5) A*搜索算法是基于估价函数的一种加权启发式图搜索算法,它每次按照 f(n) 的大小来对搜索的结点进行排序,在每次扩展结点时,都是选择当前 f(n) 值最小的结点来扩展。

A、(1)(2)(4)
B、(1)(3)(5)
C、(2)(3)(4)
D、(2)(4)(5)

单选题 遗传算法中,当所有个体的适应度评价值趋于相同时,该种群被视为( )。

A、进化成熟
B、进化停滞
C、进化失败
D、进化优化

单选题 在股票预测模型常用到可信度推理网络。关于可信度方法,下面说法错误的是( )。

A、可信度方法可以将信任和不信任清楚地区分开来,容易理解,物理意义明确
B、可信度方法中,组合规则使用的顺序不同,可能得出不同的结果
C、可信度模型适用于推理链长但结论简单的问题
D、可信度模型属于不精确推理模型之一

单选题 强调反射行动形式的模拟方法的是以下哪一种人工智能学派?( )

A、行为主义
B、符号主义
C、联结主义
D、仿生学派

单选题 中国流行非常广泛的麻将游戏,是属于哪一类博弈决策问题?( )

A、完备信息的确定性博弈
B、非完备信息的确定性博弈
C、完备信息的随机博弈
D、非完备信息的随机博弈

单选题 知识图谱被用来泛指各种大规模知识库,以下哪个不是知识图谱的核心节点?( )

A、实体
B、概念
C、属性
D、关系

单选题 人工智能面临实际问题主要可以分为三类,不包含的是( )。

A、监督学习
B、无监督学习
C、混合监督学习
D、半监督学习

单选题 图灵测试把人和被测试机器安排在两个不同的房间内,以下哪一种情况认为机器通过图灵测试?( )

A、机器所在房间回答的正确率更高
B、机器所在房间回答表达能力更强
C、人们无法根据房间里的回答辨别人与机器
D、人们根据回答投票能够选择出机器所在的房间