单选题 K-means聚类的主要思想是()

A、 采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。
B、 将多个变量综合成一个变量来分析。
C、 通过迭代法找出使准则函数取极值的最好聚类结果。
D、 从最小的类开始,逐步合并,最后成为一个最大的类。
下载APP答题
由4l***qw提供 分享 举报 纠错

相关试题

单选题 以下两种描述分别对应哪两种对分类算法的评价标准? (a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。(b)描述有多少比例的小偷给警察抓了的标准。( )

A、Precision, Recall
B、Recall, Precision
C、Precision, ROC
D、Recall, ROC

单选题 以下哪项关于决策树的说法是错误的( )

A、冗余属性不会对决策树的准确率造成不利的影响
B、子树可能在决策树中重复多次
C、决策树算法对于噪声的干扰非常敏感
D、寻找最佳决策树是 NP 完全问题

单选题 决策树中不包含一下哪种结点( )

A、根结点(root node)
B、内部结点(internal node)
C、外部结点(external node)
D、叶结点(leaf node)

单选题 利用信息增益方法作为属性选择度量建立决策树时,已知某训练样本集的四个属性的信息增益分别为:Gain(收入)= 0.940位,Gain(职业)=0.151位,Gain(年龄)=0.780位,Gain(信誉)=0.048位,则应该选择哪个属性作为决策树的测试属性:(   )。

A、“收入”属性
B、“职业”属性
C、“年龄”属性
D、“信誉”属性 

单选题 当不知道数据所带标签时,可以使用哪种技术使带同类标签与带其他标签的数据相分离?( )。

A、分类;
B、聚类;
C、关联分析;
D、隐马尔可夫链;

单选题 什么是KDD?( )。

A、数据挖掘与知识发现;
B、领域知识发现;
C、文档知识发现;
D、动态知识发现;

单选题 某超市研究销售记录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )。

A、关联规则发现;
B、聚类;
C、分类;
D、自然语言处理;

单选题 通过聚集多个分类器的预测来提高分类准确率的技术称为 ( )

A、组合(ensemble)
B、聚集(aggregate)
C、合并(combination)
D、投票(voting)