多选题 HighBias(高偏差)的解决方式有( )。
A、Boosting
B、 复杂模型(非线性模型、增加神经网络中的层)
C、 更多特征
D、 以上选项都不正确
多选题 如果将 A、B、C 三个分类器的P-R 曲线画在一个图中,其中A、B 的 P-R 曲线可以完全包含住C 的 P-R 曲线,A、B 的 P-R 曲线有交点,A、B、C 的平衡点分别为 0.79、0.66、0.58,则下列说法中正确的有( )。
A、学习器 A 的性能优于学习器 C
B、 学习器 A 的性能优于学习器 B
C、 学习器 B 的性能优于学习器 C
D、 学习器 C 的性能优于学习器 B
多选题 做一个二分类预测问题,先设定阈值为 0.5,概率不小于 0.5 的样本归入正例类(即1),小于 0.5 的样本归入反例类(即 0)。然后,用阈值 n(n>0.5)重新划分样本到正例类和反例类。下列说法正确的有( )。
A、增加阈值不会提高召回率
B、 增加阈值会提高召回率
C、 增加阈值不会降低查准率
D、 增加阈值会降低查准率
多选题 可作为决策树选择划分属性的参数有( )。
A、信息增益
B、 信息增益率
C、 基尼指数
D、 密度函数
多选题 关于特征向量的缺失值处理方式如下:缺失值较多,直接将该特征舍弃掉,否则可能会带入较大的 noise,对结果造成不良影响;缺失值较少,其余的特征缺失值都在10% 以内,可以采取的处理方式有( )。
A、把 NaN 直接作为一个特征,假设用 0 表示
B、用均值填充
C、用随机森林等算法预测填充
D、以上选项都不正确
多选题 下列关于 AUC 面积的描述正确的有( )。
A、AUC 被定义为 ROC 曲线下与坐标轴围成的面积
B、AUC 面积的值大于1
C、AUC 面积的值等于 0.5 时,真实性最低,无应用价值
D、AUC 面积的值越接近 1.0,检测方法真实性越高
多选题 下列关于 Ridge 回归的说法正确的有( )。
A、若 λ=0,则等价于一般的线性回归
B、若 λ=0,则不等价于一般的线性回归
C、若 λ=+∞,则得到的权重系数很小,接近于零
D、若 λ=+∞,则得到的权重系数很大,接近与无穷大
多选题 一个监督观测值集合会被划分为( )。
A、训练集
B、 验证集
C、 测试集
D、 预处理集