多选题 关于特征向量的缺失值处理方式如下:缺失值较多,直接将该特征舍弃掉,否则可能会带入较大的 noise,对结果造成不良影响;缺失值较少,其余的特征缺失值都在10% 以内,可以采取的处理方式有( )。

A、 把 NaN 直接作为一个特征,假设用 0 表示
B、 用均值填充
C、 用随机森林等算法预测填充
D、 以上选项都不正确
下载APP答题
由4l***ta提供 分享 举报 纠错

相关试题

多选题 做一个二分类预测问题,先设定阈值为 0.5,概率不小于 0.5 的样本归入正例类(即1),小于 0.5 的样本归入反例类(即 0)。然后,用阈值 n(n>0.5)重新划分样本到正例类和反例类。下列说法正确的有( )。

A、增加阈值不会提高召回率
B、 增加阈值会提高召回率
C、 增加阈值不会降低查准率
D、 增加阈值会降低查准率

多选题 一个监督观测值集合会被划分为( )。

A、训练集
B、 验证集
C、 测试集
D、 预处理集

多选题 如果将 A、B、C 三个分类器的P-R 曲线画在一个图中,其中A、B 的 P-R 曲线可以完全包含住C 的 P-R 曲线,A、B 的 P-R 曲线有交点,A、B、C 的平衡点分别为 0.79、0.66、0.58,则下列说法中正确的有( )。

A、学习器 A 的性能优于学习器 C
B、 学习器 A 的性能优于学习器 B
C、 学习器 B 的性能优于学习器 C
D、 学习器 C 的性能优于学习器 B

多选题 下列关于 AUC 面积的描述正确的有( )。

A、AUC 被定义为 ROC 曲线下与坐标轴围成的面积
B、AUC 面积的值大于1
C、AUC 面积的值等于 0.5 时,真实性最低,无应用价值
D、AUC 面积的值越接近 1.0,检测方法真实性越高

多选题 下列关于 Ridge 回归的说法正确的有( )。

A、若 λ=0,则等价于一般的线性回归
B、若 λ=0,则不等价于一般的线性回归
C、若 λ=+∞,则得到的权重系数很小,接近于零
D、若 λ=+∞,则得到的权重系数很大,接近与无穷大

多选题 下列可以用于特征降维的方法有( )。

A、主成分分析 PCA
B、 线性判别分析 LDA
C、 深度学习 SparseAutoEncoder
D、 矩阵奇异值分解 SVD

多选题 HighBias(高偏差)的解决方式有( )。

A、Boosting
B、 复杂模型(非线性模型、增加神经网络中的层)
C、 更多特征
D、 以上选项都不正确

多选题 可作为决策树选择划分属性的参数有( )。

A、信息增益
B、 信息增益率
C、 基尼指数
D、 密度函数