单选题 (单选题)在分布分析中,数据类型被划分为( )种。
-
A、 2
-
B、 3
-
C、 1
-
D、 4
单选题 (单选题)关联规则分析中,以下哪个指标用于衡量项集A发生,则项集B发生的概率?
-
A、 Confidence(置信度)
-
B、 Lift(提升度)
-
C、 AUC
-
D、 Support(支持度)
单选题 (单选题)K - Means算法中的初始中心点( )。
-
A、 可随意设置
-
B、 必须足够分散
-
C、 必须在每个簇的真实中心点的附近
-
D、 直接影响算法的收敛结果
单选题 (单选题)用户有一种感兴趣的模式并且希望在数据集中找到相似的模式,属于数据挖掘哪一类任务?( )
-
A、 预测建模
-
B、 根据内容检索
-
C、 寻找模式和规则
-
D、 建模描述
单选题 (单选题)对于任一个频繁项集X和它的一个非空真子集Y,S = X - Y,规则S→Y成立的条件是( )。
-
A、 confidence(Y→S)<minconf
-
B、 confidence(Y→S)≥minconf
-
C、 confidence(S→Y)≥minconf
-
D、 confidence (S→Y)<minconf
单选题 (单选题)数据变换中,最小 - 最大标准化处理的数据会落入哪个区间?
-
A、 [0,1]
-
B、 (0,1)
-
C、 [-1,1]
-
D、 [1,0]
单选题 (单选题)在关联规则分析中,以下哪个指标表示“包含A的事务中同时包含B事务的比例”与“包含B事务的比例”的比值?
-
A、 Apriori
-
B、 Lift(提升度)
-
C、 Support(支持度)
-
D、 Confidence(置信度)
单选题 (单选题)当数据所带标签未知时,可以使用()技术找出同类标签,分离其他标签。
-
A、 聚类
-
B、 关联分析
-
C、 分类
-
D、 主成分分析