单选题 (单选题)在处理重复值时,pandas提供的drop_duplicates()方法的参数keep的默认值是什么? -

A、 last -
B、 all -
C、 false -
D、 first
下载APP答题
由4l***t8提供 分享 举报 纠错

相关试题

单选题 (单选题)在分布分析中,数据类型被划分为( )种。 -

A、 2 -
B、 3 -
C、 1 -
D、 4

单选题 (单选题)关联规则分析中,以下哪个指标用于衡量项集A发生,则项集B发生的概率? -

A、 Confidence(置信度) -
B、 Lift(提升度) -
C、 AUC -
D、 Support(支持度)

单选题 (单选题)K - Means算法中的初始中心点( )。 -

A、 可随意设置 -
B、 必须足够分散 -
C、 必须在每个簇的真实中心点的附近 -
D、 直接影响算法的收敛结果

单选题 (单选题)用户有一种感兴趣的模式并且希望在数据集中找到相似的模式,属于数据挖掘哪一类任务?( ) -

A、 预测建模 -
B、 根据内容检索 -
C、 寻找模式和规则 -
D、 建模描述

单选题 (单选题)对于任一个频繁项集X和它的一个非空真子集Y,S = X - Y,规则S→Y成立的条件是( )。 -

A、 confidence(Y→S)<minconf -
B、 confidence(Y→S)≥minconf -
C、 confidence(S→Y)≥minconf -
D、 confidence (S→Y)<minconf

单选题 (单选题)数据变换中,最小 - 最大标准化处理的数据会落入哪个区间? -

A、 [0,1] -
B、 (0,1) -
C、 [-1,1] -
D、 [1,0]

单选题 (单选题)在关联规则分析中,以下哪个指标表示“包含A的事务中同时包含B事务的比例”与“包含B事务的比例”的比值? -

A、 Apriori -
B、 Lift(提升度) -
C、 Support(支持度) -
D、 Confidence(置信度)

单选题 (单选题)当数据所带标签未知时,可以使用()技术找出同类标签,分离其他标签。 -

A、 聚类 -
B、 关联分析 -
C、 分类 -
D、 主成分分析