单选题 以下两种描述分别对应哪两种对分类算法的评价标准? (a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。(b)描述有多少比例的小偷给警察抓了的标准。( )
A、Precision, Recall
B、Recall, Precision
C、Precision, ROC
D、Recall, ROC
单选题 以下哪项关于决策树的说法是错误的( )
A、冗余属性不会对决策树的准确率造成不利的影响
B、子树可能在决策树中重复多次
C、决策树算法对于噪声的干扰非常敏感
D、寻找最佳决策树是 NP 完全问题
单选题 决策树中不包含一下哪种结点( )
A、根结点(root node)
B、内部结点(internal node)
C、外部结点(external node)
D、叶结点(leaf node)
单选题 利用信息增益方法作为属性选择度量建立决策树时,已知某训练样本集的四个属性的信息增益分别为:Gain(收入)= 0.940位,Gain(职业)=0.151位,Gain(年龄)=0.780位,Gain(信誉)=0.048位,则应该选择哪个属性作为决策树的测试属性:( )。
A、“收入”属性
B、“职业”属性
C、“年龄”属性
D、“信誉”属性
单选题 当不知道数据所带标签时,可以使用哪种技术使带同类标签与带其他标签的数据相分离?( )。
A、分类;
B、聚类;
C、关联分析;
D、隐马尔可夫链;
单选题 什么是KDD?( )。
A、数据挖掘与知识发现;
B、领域知识发现;
C、文档知识发现;
D、动态知识发现;
单选题 某超市研究销售记录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )。
A、关联规则发现;
B、聚类;
C、分类;
D、自然语言处理;
单选题 通过聚集多个分类器的预测来提高分类准确率的技术称为 ( )
A、组合(ensemble)
B、聚集(aggregate)
C、合并(combination)
D、投票(voting)